Pular para o conteúdo principal

Curso

Unsupervised Learning em Python

IntermediárioNível de habilidade

Atualizado 12/2025

Aprenda a agrupar, transformar, visualizar e extrair insights de dados não rotulados com scikit-learn e SciPy.

Iniciar curso gratuitamente

PythonMachine Learning

4 h

13 vídeos

52 Exercícios

4,150 XP

170K+

Declaração de realização

Preferido por alunos de milhares de empresas

Treinando uma equipe?

Experimente para Empresas

Descrição do curso

Imagine que você tem um conjunto de clientes com várias características, como idade, localização e histórico financeiro, e deseja descobrir padrões e agrupá-los em clusters. Ou talvez você tenha um conjunto de textos, como páginas da Wikipedia, e queira segmentá-los em categorias com base no conteúdo. Esse é o mundo do aprendizado não supervisionado, chamado assim porque você não orienta, ou supervisiona, a descoberta de padrões por meio de uma tarefa de previsão; em vez disso, revela estruturas ocultas a partir de dados sem rótulos. O aprendizado não supervisionado abrange diversas técnicas de Machine Learning, de clusterização à redução de dimensão e fatoração de matrizes. Neste curso, você vai aprender os fundamentos do aprendizado não supervisionado e implementar algoritmos essenciais usando scikit-learn e SciPy. Você vai aprender a fazer clustering, transformar, visualizar e extrair insights de conjuntos de dados sem rótulos, e vai encerrar o curso construindo um sistema de recomendação para sugerir artistas musicais populares.Os vídeos contêm transcrições ao vivo que você pode exibir clicando em "Show transcript" no canto inferior esquerdo dos vídeos. O glossário do curso está disponível à direita, na seção de recursos.Para obter créditos de CPE, você precisa concluir o curso e alcançar 70% na avaliação qualificada. Você pode acessar a avaliação clicando no destaque de créditos de CPE à direita.

Pré-requisitos

Supervised Learning with scikit-learn

1

Clustering para Exploração de Conjuntos de Dados

Aprenda a descobrir os grupos subjacentes (ou "clusters") em um conjunto de dados. Ao final deste capítulo, você estará agrupando empresas usando seus preços no mercado de ações e distinguindo diferentes espécies ao clusterizar suas medições.

Aprendizagem não supervisionada

Quantos clusters você tem?

Agrupamento de pontos 2D

Inspecione seu clustering

Avaliação de um clustering

Quantos cachos de grãos você tem?

Avaliação do agrupamento de grãos

Transformação de recursos para melhores agrupamentos

Dimensionamento de dados de peixes para agrupamento

Agrupamento dos dados de peixes

Agrupamento de ações usando KMeans

Quais ações se movem juntas?

Iniciar capítulo

2

Visualização com Clusterização Hierárquica e t-SNE

Neste capítulo, você vai conhecer duas técnicas de aprendizado não supervisionado para visualização de dados: clusterização hierárquica e t-SNE. A clusterização hierárquica combina as amostras em clusters cada vez mais amplos, gerando uma visualização em árvore da hierarquia resultante. O t-SNE mapeia as amostras para um espaço 2D para que a proximidade entre elas possa ser visualizada.

Visualização de hierarquias

Quantas fusões você fez?

Agrupamento hierárquico dos dados de grãos

Hierarquias de estoques

Rótulos de cluster em clustering hierárquico

Quais clusters estão mais próximos?

Diferentes vínculos, diferentes agrupamentos hierárquicos!

Agrupamentos intermediários

Extração dos rótulos de cluster

t-SNE para mapas bidimensionais

t-SNE visualização do conjunto de dados de grãos

Um mapa t-SNE do mercado de ações

Iniciar capítulo

3

Decorrelação dos Dados e Redução de Dimensão

A redução de dimensão resume um conjunto de dados usando seus padrões recorrentes. Neste capítulo, você vai aprender a mais fundamental das técnicas de redução de dimensão, a "Análise de Componentes Principais" ("PCA"). A PCA é frequentemente usada antes do aprendizado supervisionado para melhorar o desempenho e a capacidade de generalização do modelo. Ela também pode ser útil no aprendizado não supervisionado. Por exemplo, você vai aplicar uma variante de PCA que permitirá agrupar artigos da Wikipedia pelo conteúdo!

Visualizando a transformação PCA

Dados correlacionados na natureza

Decorrelacionando as medições de grãos com PCA

Componentes principais

Dimensão intrínseca

O primeiro componente principal

Variação dos recursos do site PCA

Dimensão intrínseca dos dados do peixe

Redução da dimensão com PCA

Redução da dimensão das medições de peixes

Um array de frequência de palavras com tf-idf

Agrupamento da Wikipédia parte I

Agrupamento de partes da Wikipédia II

Iniciar capítulo

4

Descobrindo Recursos Interpretáveis

Neste capítulo, você vai aprender uma técnica de redução de dimensão chamada "Fatoração de Matrizes Não Negativas" ("NMF"), que expressa amostras como combinações de partes interpretáveis. Por exemplo, ela representa documentos como combinações de tópicos e imagens em termos de padrões visuais recorrentes. Você também vai usar NMF para construir sistemas de recomendação que possam encontrar artigos semelhantes para você ler ou artistas musicais que combinem com seu histórico de escuta!

Fatoração de matriz não negativa (NMF)

Dados não negativos

NMF aplicado a artigos da Wikipédia

NMF recursos dos artigos da Wikipédia

NMF reconstrói amostras

NMF aprende partes interpretáveis

NMF aprende tópicos de documentos

Explore o conjunto de dados de LED dígitos

NMF aprende as partes das imagens

PCA não aprende as partes

Criação de sistemas de recomendação usando NMF

Quais artigos são semelhantes a "Cristiano Ronaldo"?

Recomendar artistas musicais - parte I

Recomendar a parte de artistas musicais II

Considerações finais

Iniciar capítulo

Unsupervised Learning em Python

Curso
concluído

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CV
Compartilhe nas redes sociais e em sua avaliação de desempenhoInscreva-se agora

Para Empresas

Treinar 2 ou mais pessoas?

Dê à sua equipe acesso à toda a plataforma DataCamp, incluindo todos os recursos.

Nas seguintes faixas

Associate Data Scientist em PythonCertificação

Engenheiro associado de IA para cientistas de dadosCertificação

Fundamentos de machine learning Em Python

Cientista de machine learning em Python

instrutor

Benjamin Wilson

Benjamin Wilson

Director of Research at lateral.io

colaboradores

Curso recursos

Company stock price movementsconjunto de dados

Eurovision 2016conjunto de dados

Fish measurementsconjunto de dados

Grainsconjunto de dados

LCD digitsconjunto de dados

Musical artistsconjunto de dados

Wikipedia articlesconjunto de dados

Wineconjunto de dados

Course Glossaryconjunto de dados

Faça como mais de 19 milhões de alunos e comece Unsupervised Learning em Python hoje mesmo!

Desenvolva suas habilidades em dados com o app do DataCamp

Continue progredindo em qualquer lugar com nossos cursos para celular e desafios diários de programação de 5 minutos.