Weiter zum Inhalt

Startseite Python

Kurs

Unsupervised Learning in Python

MittelSchwierigkeitsgrad

Aktualisiert 12/2025

Nutze scikit-learn und scipy, um unbeschriftete Daten zu clustern, zu transformieren, zu visualisieren und in Erkenntnisse zu überführen.

Kurs kostenlos starten

PythonMachine Learning

4 Std.

13 Videos

52 Übungen

4,150 XP

170K+

Leistungsnachweis

Beliebt bei Lernenden in Tausenden Unternehmen

Ein Team schulen?

Für Unternehmen ausprobieren

Kursbeschreibung

Stell dir vor, du hast eine Sammlung von Kundinnen und Kunden mit verschiedenen Merkmalen wie Alter, Standort und finanzieller Historie und möchtest Muster entdecken und sie in Cluster einteilen. Oder du hast eine Menge Texte, etwa Wikipedia-Seiten, und willst sie anhand ihres Inhalts in Kategorien segmentieren. Das ist die Welt des Unsupervised Learning – so genannt, weil du die Mustersuche nicht durch eine Vorhersageaufgabe leitest oder überwachst, sondern verborgene Strukturen in unbeschrifteten Daten aufdeckst. Unsupervised Learning umfasst eine Vielzahl von Techniken im Machine Learning – von Clustering über Dimensionsreduktion bis hin zur Matrixfaktorisierung. In diesem Kurs lernst du die Grundlagen des Unsupervised Learning und setzt die wichtigsten Algorithmen mit scikit-learn und SciPy um. Du lernst, unbeschriftete Datensätze zu clustern, zu transformieren, zu visualisieren und daraus Erkenntnisse zu gewinnen – und beendest den Kurs mit dem Bau eines Empfehlungssystems, das beliebte Musik-Künstlerinnen und -Künstler vorschlägt.Die Videos enthalten Live-Transkripte, die du unten links im Video über „Show transcript“ einblenden kannst. Das Kursglossar findest du rechts im Bereich „Resources“.Um CPE-Credits zu erhalten, musst du den Kurs abschließen und in der qualifizierten Bewertung mindestens 70 % erreichen. Du gelangst zur Bewertung, indem du rechts auf den Hinweis zu den CPE-Credits klickst.

Voraussetzungen

Supervised Learning with scikit-learn

1

Clustering for Dataset Exploration

Learn how to discover the underlying groups (or "clusters") in a dataset. By the end of this chapter, you'll be clustering companies using their stock market prices, and distinguishing different species by clustering their measurements.

Unsupervised Learning

How many clusters?

Clustering 2D points

Inspect your clustering

Evaluating a clustering

How many clusters of grain?

Evaluating the grain clustering

Transforming features for better clusterings

Scaling fish data for clustering

Clustering the fish data

Clustering stocks using KMeans

Which stocks move together?

Kapitel starten

2

Visualization with Hierarchical Clustering and t-SNE

In this chapter, you'll learn about two unsupervised learning techniques for data visualization, hierarchical clustering and t-SNE. Hierarchical clustering merges the data samples into ever-coarser clusters, yielding a tree visualization of the resulting cluster hierarchy. t-SNE maps the data samples into 2d space so that the proximity of the samples to one another can be visualized.

Visualizing hierarchies

How many merges?

Hierarchical clustering of the grain data

Hierarchies of stocks

Cluster labels in hierarchical clustering

Which clusters are closest?

Different linkage, different hierarchical clustering!

Intermediate clusterings

Extracting the cluster labels

t-SNE for 2-dimensional maps

t-SNE visualization of grain dataset

A t-SNE map of the stock market

Kapitel starten

3

Decorrelating Your Data and Dimension Reduction

Dimension reduction summarizes a dataset using its common occuring patterns. In this chapter, you'll learn about the most fundamental of dimension reduction techniques, "Principal Component Analysis" ("PCA"). PCA is often used before supervised learning to improve model performance and generalization. It can also be useful for unsupervised learning. For example, you'll employ a variant of PCA will allow you to cluster Wikipedia articles by their content!

Visualizing the PCA transformation

Correlated data in nature

Decorrelating the grain measurements with PCA

Principal components

Intrinsic dimension

The first principal component

Variance of the PCA features

Intrinsic dimension of the fish data

Dimension reduction with PCA

Dimension reduction of the fish measurements

A tf-idf word-frequency array

Clustering Wikipedia part I

Clustering Wikipedia part II

Kapitel starten

4

Discovering Interpretable Features

In this chapter, you'll learn about a dimension reduction technique called "Non-negative matrix factorization" ("NMF") that expresses samples as combinations of interpretable parts. For example, it expresses documents as combinations of topics, and images in terms of commonly occurring visual patterns. You'll also learn to use NMF to build recommender systems that can find you similar articles to read, or musical artists that match your listening history!

Non-negative matrix factorization (NMF)

Non-negative data

NMF applied to Wikipedia articles

NMF features of the Wikipedia articles

NMF reconstructs samples

NMF learns interpretable parts

NMF learns topics of documents

Explore the LED digits dataset

NMF learns the parts of images

PCA doesn't learn parts

Building recommender systems using NMF

Which articles are similar to 'Cristiano Ronaldo'?

Recommend musical artists part I

Recommend musical artists part II

Final thoughts

Kapitel starten

Unsupervised Learning in Python

Kurs
abgeschlossen

Leistungsnachweis verdienen

Füge diesen Fähigkeitsnachweis zu deinem LinkedIn-Profil, Anschreiben oder Lebenslauf hinzu
Teile es auf Social Media und in deiner LeistungsbeurteilungJetzt anmelden

Schließe dich 19 Millionen Lernenden an und starte Unsupervised Learning in Python heute!

DataCamp gibt es auch für Mobilgeräte

Mit unseren Kursen für Mobilgeräte und täglichen Programmier-Challenges erweiterst du deine Datenkompetenz von unterwegs.