Curso
Introdução ao PySpark
IntermediárioNível de habilidade
Atualizado 01/2026Iniciar Curso Gratuitamente
Incluído comPremium or Teams
SparkData Engineering4 h11 vídeos36 Exercícios2,850 XP23,913Certificado de conclusão
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.Preferido por alunos de milhares de empresas
Treinar 2 ou mais pessoas?
Experimentar DataCamp for BusinessDescrição do curso
Por que Spark? Por que agora?
Descubra a velocidade e a escalabilidade do Apache Spark, a poderosa estrutura projetada para lidar com big data. Com aulas interativas e exercícios práticos, você vai ver como o processamento em memória do Spark dá uma vantagem sobre estruturas tradicionais como o Hadoop. Você vai começar configurando sessões do Spark e mergulhando em componentes essenciais, como Conjuntos de Dados Distribuídos Resilientes (RDDs) e DataFrame. Aprenda a filtrar, agrupar e juntar conjuntos de dados com facilidade enquanto trabalha com exemplos reais.Melhore suas habilidades em Python e SQL para Big Data
Aprenda a usar o PySpark SQL para consultar e gerenciar dados usando a sintaxe SQL que você já conhece. Lide com esquemas, tipos de dados complexos e funções definidas pelo usuário (UDFs), enquanto desenvolve habilidades em cache e otimização de desempenho para sistemas distribuídos.Crie suas bases de Big Data
Ao final deste curso, você vai ter confiança pra lidar, consultar e processar big data usando o PySpark. Com essas habilidades básicas, você estará pronto para explorar tópicos avançados, como machine learning e análise de big data.Pré-requisitos
Introduction to SQLData Manipulation with pandas1
Introdução ao Apache Spark e ao PySpark
Uma introdução geral ao PySpark e à computação distribuída. Esta seção apresenta o PySpark, os DataFrames do PySpark e os RDDs.
2
PySpark em Python
Continuação sobre DataFrames e tipos de dados complexos. Esta seção aprofunda o que os DataFrames oferecem no PySpark e apresenta alguns conceitos do Spark SQL.
3
Introdução ao PySpark SQL
Aprofunde-se em como aproveitar o Spark SQL e o PySpark para processamento de dados em escala, combinando a simplicidade do SQL com o poder de computação distribuída do PySpark para lidar com grandes conjuntos de dados com eficiência.
Introdução ao PySpark
Curso concluído
Obtenha um certificado de conclusão
Adicione esta credencial ao seu perfil do LinkedIn, currículo ou CVCompartilhe nas redes sociais e em sua avaliação de desempenho
Incluído comPremium or Teams
Inscreva-se AgoraFaça como mais de 19 milhões de alunos e comece Introdução ao PySpark hoje mesmo!
Crie sua conta gratuita
ou
Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados serão armazenados nos EUA.