Перейти к основному содержимому
Категория
Технологии

Учебные материалы по LLM

Будьте в курсе последних новостей, методик и ресурсов по большим языковым моделям. Наши руководства полны практических разборов и кейсов, которые помогут прокачать навыки.
Другие технологии:
GroupОбучение двух или более человек?Попробуйте DataCamp for Business

Как ускорить локальные LLM с помощью спекулятивного декодирования DFlash

Узнайте, как ускорить локальный инференс Gemma 4 31B на одном RTX 4090 с помощью спекулятивного декодирования DFlash и Flash Attention по сравнению с базовой конфигурацией.

17 июня 2026 г.

Формат GGUF: полное руководство по локальному выводу LLM

GGUF упаковывает веса модели, данные токенизатора и метаданные в один переносимый файл. Узнайте, как выбрать подходящий уровень квантизации и начать работу с Ollama.

17 июня 2026 г.

Процедуры Claude Code: запускайте агента для работы с кодом по расписанию в облаке

Узнайте, как процедуры Claude Code запускают вашего агента для работы с кодом в облаке по расписанию или событию GitHub, чтобы проверки PR и аудиты завершались даже с закрытым ноутбуком.

17 июня 2026 г.

Учебник по SGLang: локальный запуск Mistral Medium 3.5

Настройте среду Docker с несколькими GPU, тензорным параллелизмом и спекулятивным декодированием EAGLE, чтобы обслуживать Mistral Medium 3.5 128B через совместимый с OpenAI API.

1 июня 2026 г.

Учебник по Claude Code: настройка, рефакторинг и отладка на практике

Узнайте, как использовать Claude Code от Anthropic для улучшения рабочих процессов разработки ПО на практическом примере с библиотекой Supabase для Python.

28 мая 2026 г.

Руководство по Multi-Token Prediction: как ускорить LLM

Запустите Qwen3.6 27B на RTX 3090 и узнайте, как Multi-Token Prediction (MTP) в llama.cpp почти в 2 раза ускоряет локальный инференс LLM без апгрейда GPU.

14 мая 2026 г.

Учебник по API GPT-Realtime-2: три теста — три вердикта

Узнайте, чем отличаются gpt-realtime-2, gpt-realtime-translate и gpt-realtime-whisper от OpenAI, а затем протестируйте каждый с рабочим Python-кодом на WebSocket.

12 мая 2026 г.

Как запустить DeepSeek V4 Flash локально

Узнайте, как запустить полноценную модель DeepSeek V4 Flash на одном GPU с помощью модифицированной сборки llama.cpp и совместимого файла GGUF в этом практическом руководстве.

5 мая 2026 г.

Тонкая настройка NVIDIA Nemotron-3-Nano на данных по психологии (Q&A)

Узнайте, как дообучить NVIDIA Nemotron-3-Nano-4B на наборе данных вопросов и ответов по психологии на GPU RTX 3090 с использованием LoRA и TRL после загрузки модели с Hugging Face.

29 апреля 2026 г.

Учебник по API Qwen 3.6 Plus: конвейер обработки счетов на Python

Узнайте, как использовать Qwen 3.6 Plus от Alibaba, Python и SDK OpenAI для построения конвейера автоматической обработки счетов с нативным зрением и вызовом инструментов.

27 апреля 2026 г.

Nano Banana 2: полное руководство с Python

Узнайте всё о новейшей модели генерации изображений от Google — Nano Banana 2, включая то, как создать итеративный чат‑редактор изображений с использованием API на Python.

22 апреля 2026 г.