Pular para o conteúdo principal
Categoría
Tecnologias

Tutoriais do LLM

Mantenha-se atualizado com as últimas notícias, técnicas e recursos para Large Language Models. Nossos tutoriais estão repletos de orientações práticas e casos de uso que você pode usar para aprimorar suas habilidades.
Outras tecnologias:
Agentes de IAAWSAzureBusiness IntelligenceCara de abraçoChatGPTdbtDockerExcelGitGoogle Cloud PlatformIA generativaInteligência Artificial JavaKafkaKubernetesMongoDBMySQLNoSQLOpenAIPlanilhasPostgreSQLPower BIPySparkPythonRSnowflakeSQLSQLiteTableauTelas de dados
GroupTreinar 2 ou mais pessoas?Experimentar DataCamp for Business

Como acelerar LLMs locais com DFlash e decodificação especulativa

Aprenda a acelerar a inferência local do Gemma 4 31B em uma única RTX 4090 usando DFlash (decodificação especulativa) e Flash Attention em comparação a um baseline.
Abid Ali Awan's photo

Abid Ali Awan

17 de junho de 2026

Formato GGUF: um guia completo para inferência local de LLM

O GGUF reúne pesos do modelo, dados do tokenizador e metadados em um único arquivo portátil. Saiba como escolher o nível certo de quantização e começar com o Ollama.
Austin Chia's photo

Austin Chia

17 de junho de 2026

Tutorial SGLang: servindo o Mistral Medium 3.5 localmente

Configure um ambiente Docker multi-GPU com paralelismo de tensores e decodificação especulativa EAGLE para servir o Mistral Medium 3.5 128B por meio de uma API compatível com OpenAI.
Abid Ali Awan's photo

Abid Ali Awan

1 de junho de 2026

Tutorial do Claude Code: configuração, refatoração e depuração na prática

Aprenda a usar o Claude Code, da Anthropic, para melhorar fluxos de desenvolvimento de software com um exemplo prático usando a biblioteca Supabase para Python.
Aashi Dutt's photo

Aashi Dutt

28 de maio de 2026

Tutorial de Multi-Token Prediction: como acelerar LLMs

Rode o Qwen3.6 27B em uma RTX 3090 e aprenda como o Multi-Token Prediction (MTP) com o llama.cpp pode quase dobrar a inferência local de LLMs sem trocar sua GPU.
Abid Ali Awan's photo

Abid Ali Awan

14 de maio de 2026

Tutorial da API GPT-Realtime-2: três testes, três veredictos

Entenda as diferenças entre gpt-realtime-2, gpt-realtime-translate e gpt-realtime-whisper da OpenAI e teste cada um com código Python via WebSocket.
Khalid Abdelaty's photo

Khalid Abdelaty

12 de maio de 2026

Como executar o DeepSeek V4 Flash localmente

Aprenda a executar o modelo completo DeepSeek V4 Flash em uma única GPU usando uma build modificada do llama.cpp e um arquivo GGUF compatível neste tutorial prático.
Abid Ali Awan's photo

Abid Ali Awan

5 de maio de 2026

Fine-tuning do NVIDIA Nemotron-3-Nano em dados de perguntas e respostas de psicologia

Aprenda a fazer fine-tuning do NVIDIA Nemotron-3-Nano-4B em um dataset de Q&A de psicologia usando uma GPU RTX 3090, com LoRA e TRL, após baixar o modelo do Hugging Face.
Abid Ali Awan's photo

Abid Ali Awan

29 de abril de 2026

Tutorial da API Qwen 3.6 Plus: construindo um pipeline de processamento de faturas em Python

Aprenda a usar o Qwen 3.6 Plus da Alibaba, Python e o SDK da OpenAI para criar um pipeline automatizado de processamento de faturas com visão nativa e chamadas de ferramentas.
Bex Tuychiev's photo

Bex Tuychiev

27 de abril de 2026

Nano Banana 2: guia completo com Python

Aprenda tudo o que você precisa saber sobre o mais novo modelo de geração de imagens do Google, o Nano Banana 2, incluindo como criar um editor iterativo de imagens em chat usando a API com Python.
François Aubry's photo

François Aubry

22 de abril de 2026

Tutorial OpenClaw (Clawdbot): controle seu PC pelo WhatsApp

Configure o OpenClaw (antes Clawdbot/Moltbot), um agente self-hosted que conecta o Claude ao seu Mac via WhatsApp. Busque arquivos e rode comandos do celular.
Bex Tuychiev's photo

Bex Tuychiev

22 de abril de 2026