Kurs
Grundlagen von Big Data mit PySpark
ExperteSchwierigkeitsgrad
Aktualisiert 02.2025Kurs kostenlos starten
Im Lieferumfang enthalten beiPremium or Teams
SparkData Engineering4 Std.16 Videos55 Übungen4,600 XP63,119Leistungsnachweis
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.Beliebt bei Lernenden in Tausenden Unternehmen
Training für 2 oder mehr Personen?
Probiere es mit DataCamp for BusinessKursbeschreibung
Voraussetzungen
Introduction to Python1
Einführung in die Big-Data-Analyse mit Spark
Dieses Kapitel führt in die spannende Welt von Big Data ein und stellt die verschiedenen Konzepte und Frameworks für die Verarbeitung dieser riesigen Datenmengen vor. Du wirst verstehen, warum Apache Spark als bestes Framework für Big Data gilt.
2
Programmieren in PySpark-RDDs
Die wichtigste Abstraktion, die Spark zur Verfügung stellt, ist ein fehlertoleranter verteilter Datensatz – Resilient Distributed Dataset (RDD) –, der die Grundlage und das Rückgrat dieser Engine bildet. Dieses Kapitel führt in RDDs ein und zeigt, wie sie mit RDD-Transformationen und -Aktionen erstellt und ausgeführt werden.
3
PySpark SQL & DataFrames
In diesem Kapitel lernst du Spark SQL kennen. Dabei handelt es sich um ein Spark-Modul für die strukturierte Datenverarbeitung. Es bietet eine Programmierabstraktion namens DataFrames und kann auch als verteilte SQL Query Engine fungieren. Dieses Kapitel zeigt, wie du DataFrames mithilfe von Spark SQL in Python nutzen kannst.
4
Maschinelles Lernen mit PySpark MLlib
PySpark MLlib ist die skalierbare Bibliothek von Apache Spark für maschinelles Lernen in Python und besteht aus gängigen Lernalgorithmen und Dienstprogrammen. In diesem letzten Kapitel lernst du wichtige Algorithmen für maschinelles Lernen kennen. Du erstellst eine Engine für Filmempfehlungen und einen Spam-Filter und wendest k-Means-Clustering an.
Grundlagen von Big Data mit PySpark
Kurs abgeschlossen
Leistungsnachweis verdienen
Füge diesen Fähigkeitsnachweis zu Deinem LinkedIn-Profil, Anschreiben oder Lebenslauf hinzuTeile es auf Social Media und in Deiner Leistungsbeurteilung
Im Lieferumfang enthalten beiPremium or Teams
Jetzt anmeldenSchließe dich 19 Millionen Lernenden an und starte Grundlagen von Big Data mit PySpark heute!
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.