Categoría
Tópicos
Tutoriais de ciência de dados
Avance em sua carreira de dados com nossos tutoriais de ciência de dados. Orientamos você passo a passo nas funções e modelos desafiadores da ciência de dados.
Outros tópicos:
Treinar 2 ou mais pessoas?Experimentar DataCamp for Business
Quem vence a Copa do Mundo FIFA 2026: um guia de MLOps
Veja como um pipeline de MLOps ponta a ponta prevê os resultados da Copa 2026, do retreinamento automático e DVC a uma simulação de Monte Carlo com 10.000 execuções do chaveamento.
Tom Farnschläder
17 de junho de 2026
Estimativa de densidade por kernel: da teoria à prática
A estimativa de densidade por kernel é um método não paramétrico para estimar o formato de uma distribuição de dados sem assumir um modelo fixo. Aprenda a fórmula, a seleção de largura de banda e a implementação prática em Python e R.
Dario Radečić
16 de junho de 2026
Regressão spline: um guia prático com Python e R
Um guia prático sobre regressão spline, cobrindo como polinômios por partes e nós modelam relações não lineares, os principais tipos de spline e como ajustá-los em Python e R.
Dario Radečić
15 de junho de 2026
Pressupostos da regressão logística: o que você precisa checar antes de modelar
Um passo a passo prático dos pressupostos por trás da regressão logística, dos diagnósticos que detectam violações em Python e R e das alternativas quando os pressupostos não se sustentam.
Dario Radečić
15 de junho de 2026
Overfitting vs. Underfitting: um guia prático de diagnóstico de modelos
Um passo a passo detalhado sobre overfitting e underfitting em machine learning: como identificar cada falha, por que acontecem e como corrigi-las via trade-off viés-variância.
Dario Radečić
12 de junho de 2026
Modelo linear generalizado (GLM): guia para iniciantes de teoria e código
Um guia prático de GLMs — o que são, como seus três componentes funcionam juntos e como ajustá-los e interpretá-los em Python e R.
Dario Radečić
12 de junho de 2026
Gradient clipping: como evitar gradientes explosivos
Gradient clipping é um ajuste de uma linha no treino que impede gradientes explosivos de arruinarem o treinamento de redes neurais profundas. Este guia explica como funciona, os dois principais métodos, como escolher o limiar e como implementar no PyTorch e no TensorFlow.
Dario Radečić
10 de junho de 2026
Markov Chain Monte Carlo (MCMC): amostre distribuições de probabilidade complexas
Um guia sobre Markov Chain Monte Carlo — como funciona, por que é usado, os algoritmos mais comuns e como aplicar em Python para inferência bayesiana.
Dario Radečić
10 de junho de 2026
Support Vector Regression (SVR): como funciona e quando usar
Support Vector Regression é um método de regressão baseado em margem que ignora pequenos erros de propósito, lida com relações não lineares via kernels e se mantém firme em dados reais com ruído, onde a regressão padrão fica devendo.
Dario Radečić
4 de junho de 2026
Teste de Kruskal-Wallis: comparando múltiplos grupos sem normalidade
Um guia prático sobre o teste de Kruskal-Wallis — o que é, como funciona, quando usar no lugar do ANOVA e como rodar e interpretar em Python e R.
Dario Radečić
4 de maio de 2026
Kernel trick explicado: como SVMs aprendem padrões não lineares
Um guia conceitual sobre o kernel trick — o que é, como ele potencializa SVMs e outros modelos baseados em kernel, e quando usá-lo em vez de outras abordagens para modelagem não linear.
Dario Radečić
4 de maio de 2026
Função objetivo explicada: definição, exemplos e otimização
Entenda o que é uma função objetivo, como ela funciona em otimização e machine learning, e como defini-la e interpretá-la com exemplos reais.
Dario Radečić
4 de maio de 2026