Categoría

Tópicos

Tutoriais de ciência de dados

Avance em sua carreira de dados com nossos tutoriais de ciência de dados. Orientamos você passo a passo nas funções e modelos desafiadores da ciência de dados.

Outros tópicos:

Treinar 2 ou mais pessoas?Experimentar DataCamp for Business

Quem vence a Copa do Mundo FIFA 2026: um guia de MLOps

Veja como um pipeline de MLOps ponta a ponta prevê os resultados da Copa 2026, do retreinamento automático e DVC a uma simulação de Monte Carlo com 10.000 execuções do chaveamento.

Tom Farnschläder

17 de junho de 2026

Estimativa de densidade por kernel: da teoria à prática

A estimativa de densidade por kernel é um método não paramétrico para estimar o formato de uma distribuição de dados sem assumir um modelo fixo. Aprenda a fórmula, a seleção de largura de banda e a implementação prática em Python e R.

Dario Radečić

16 de junho de 2026

Regressão spline: um guia prático com Python e R

Um guia prático sobre regressão spline, cobrindo como polinômios por partes e nós modelam relações não lineares, os principais tipos de spline e como ajustá-los em Python e R.

Dario Radečić

15 de junho de 2026

Pressupostos da regressão logística: o que você precisa checar antes de modelar

Um passo a passo prático dos pressupostos por trás da regressão logística, dos diagnósticos que detectam violações em Python e R e das alternativas quando os pressupostos não se sustentam.

Dario Radečić

15 de junho de 2026

Overfitting vs. Underfitting: um guia prático de diagnóstico de modelos

Um passo a passo detalhado sobre overfitting e underfitting em machine learning: como identificar cada falha, por que acontecem e como corrigi-las via trade-off viés-variância.

Dario Radečić

12 de junho de 2026

Modelo linear generalizado (GLM): guia para iniciantes de teoria e código

Um guia prático de GLMs — o que são, como seus três componentes funcionam juntos e como ajustá-los e interpretá-los em Python e R.

Dario Radečić

12 de junho de 2026

Gradient clipping: como evitar gradientes explosivos

Gradient clipping é um ajuste de uma linha no treino que impede gradientes explosivos de arruinarem o treinamento de redes neurais profundas. Este guia explica como funciona, os dois principais métodos, como escolher o limiar e como implementar no PyTorch e no TensorFlow.

Dario Radečić

10 de junho de 2026

Markov Chain Monte Carlo (MCMC): amostre distribuições de probabilidade complexas

Um guia sobre Markov Chain Monte Carlo — como funciona, por que é usado, os algoritmos mais comuns e como aplicar em Python para inferência bayesiana.

Dario Radečić

10 de junho de 2026

Support Vector Regression (SVR): como funciona e quando usar

Support Vector Regression é um método de regressão baseado em margem que ignora pequenos erros de propósito, lida com relações não lineares via kernels e se mantém firme em dados reais com ruído, onde a regressão padrão fica devendo.

Dario Radečić

4 de junho de 2026

Teste de Kruskal-Wallis: comparando múltiplos grupos sem normalidade

Um guia prático sobre o teste de Kruskal-Wallis — o que é, como funciona, quando usar no lugar do ANOVA e como rodar e interpretar em Python e R.

Dario Radečić

4 de maio de 2026

Kernel trick explicado: como SVMs aprendem padrões não lineares

Um guia conceitual sobre o kernel trick — o que é, como ele potencializa SVMs e outros modelos baseados em kernel, e quando usá-lo em vez de outras abordagens para modelagem não linear.

Dario Radečić

4 de maio de 2026

Função objetivo explicada: definição, exemplos e otimização

Entenda o que é uma função objetivo, como ela funciona em otimização e machine learning, e como defini-la e interpretá-la com exemplos reais.

Dario Radečić

4 de maio de 2026