Cours
Analyse de clusters avec R
IntermédiaireNiveau de compétence
Actualisé 11/2024RMachine Learning4 h16 vidéos52 Exercices3,800 XP43,616Certificat de réussite.
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.Apprécié par des utilisateurs provenant de milliers d'entreprises
Former 2 personnes ou plus ?
Essayez DataCamp for BusinessDescription du cours
Apprenez à réaliser une analyse par grappes
L'analyse par grappes constitue un outil puissant dans le domaine de la science des données. Il est utilisé pour identifier des groupes d'observations (clusters) qui partagent des caractéristiques similaires. Ces similitudes peuvent éclairer toutes sortes de décisions commerciales ; par exemple, en marketing, elles sont utilisées pour identifier des groupes distincts de clients auxquels des publicités peuvent être adaptées.Découvrez les techniques de regroupement hiérarchique et par la méthode des k-moyennes
Dans ce cours, vous découvrirez deux méthodes de regroupement couramment utilisées : le regroupement hiérarchique et le regroupement par la méthode des k-moyennes. Vous n'apprendrez pas seulement à utiliser ces méthodes, vous développerez également une intuition solide quant à leur fonctionnement et à l'interprétation de leurs résultats. Vous développerez cette intuition en explorant trois ensembles de données différents : les positions des joueurs de football, les données sur les dépenses des clients grossistes et les données longitudinales sur les salaires professionnels.Perfectionnez vos compétences grâce à une étude de cas pratique
Vous terminerez le cours en mettant en pratique vos nouvelles compétences dans le cadre d'une étude de cas portant sur les salaires moyens et leur évolution au fil du temps. Cela combinera des techniques de regroupement hiérarchique telles que les arbres professionnels, la préparation à l'exploration et la création de graphiques de grappes professionnelles, avec des techniques k-means, notamment l'analyse du coude et les largeurs moyennes de silhouette.Les cours DataCamp comprennent une combinaison de vidéos, d'articles et d'exercices pratiques afin de vous permettre de tester et de consolider vos nouvelles compétences, de manière à ce que vous vous sentiez à l'aise pour les mettre en application en dehors du cadre du cours.
Prérequis
Intermediate R1
Calculer la distance entre des observations
L’analyse de clusters vise à trouver des groupes d’observations similaires entre elles, tout en étant différentes des autres groupes. Cette similarité/différence est mesurée par une métrique appelée distance. Dans ce chapitre, vous apprendrez à calculer la distance entre des observations pour des variables continues et catégorielles. Vous développerez aussi une intuition sur la façon dont l’échelle de vos variables peut influencer la distance.
2
Clustering hiérarchique
Ce chapitre vous aidera à répondre à la dernière question du chapitre 1 : comment trouver des groupes d’observations similaires (clusters) dans vos données à partir des distances que vous avez calculées ? Vous découvrirez les principes fondamentaux du clustering hiérarchique — le critère de liaison et le dendrogramme — et comment ils servent à construire des clusters. Vous explorerez également des données d’un distributeur de gros afin de segmenter des clients en fonction de leurs habitudes de dépense.
3
Clustering k-means
Dans ce chapitre, vous allez comprendre les principes de l’algorithme k-means, apprendre à choisir le bon k lorsqu’il n’est pas connu à l’avance, et revisiter les données de gros sous un autre angle.
4
Étude de cas : salaire moyen national par profession
Dans ce chapitre, vous mettrez en pratique les compétences acquises pour analyser l’évolution, au fil du temps, du salaire moyen selon les professions.
Analyse de clusters avec R
Cours terminé
Obtenez un certificat de réussite
Ajoutez cette certification à votre profil LinkedIn, à votre CV ou à votre portfolioPartagez-la sur les réseaux sociaux et dans votre évaluation de performance
Inclus avecPremium or Teams
S'inscrire MaintenantRejoignez plus de 19 millions d'utilisateurs et commencez Analyse de clusters avec R dès aujourd'hui !
Créez votre compte gratuit
ou
En continuant, vous acceptez nos Conditions d'utilisation, notre Politique de confidentialité et le fait que vos données seront hébergées aux États-Unis.