Учебные материалы
Сравнение характеристик GPU для локального LLM: почему пропускная способность — не всё (реалити-чек)
Разбираем мифы о выборе GPU для локальных LLM. Почему пропускная способность памяти — не единственный критерий, и как не попасться на маркетинговые уловки. Реал
М1 Max 64GB: какой движок инференции реально быстрее в 2026? Бенчмарк MLX, llama.cpp и RunAnywhere.ai
Сравнение производительности MLX, llama.cpp, RunAnywhere.ai и vLLM-MLX на M1 Max 64GB. Результаты тестов с MLX-Chronos, анализ скорости, контекста и квантования
Почему стоит хостить не только инференс, но и тулинг вокруг локальных LLM: гайд по полной инфраструктуре
Гайд по построению полноценной инфраструктуры для локальных LLM: мониторинг, оркестрация, управление версиями, CI/CD. Почему одного инференса мало и как не прог
Запуск Qwen 3.6 35B MoE на Mac M1 Max: локальный AI-помощник для кода с Zoo Code
Пошаговый гайд по установке Qwen 3.6 35B MoE на Mac M1 Max через Zoo Code. Настройка локального AI-ассистента для кода без облачных затрат.
Бюджетный ИИ-сервер своими руками: сборка на 2× Tesla V100 32GB за 200 000 ₽ (бенчмарки 108 моделей)
Пошаговое руководство по сборке дешевого локального сервера на двух Tesla V100 32GB. Цены, комплектуха, грабли, сравнение с облаком и реальные тесты 108 LLM.
ИИ-агент внутри T-FLEX CAD: как заставить нейросеть не врать, а чертить
Пошаговый гайд по встраиванию LLM в T-FLEX CAD через C#-генерацию, контур управления и самопроверку. Решаем проблему галлюцинаций и падений. Код и архитектура.
Бесплатные API нейросетей для прототипов: обзор Groq и других сервисов с таблицами лимитов
Полный разбор бесплатных API для прототипов: Groq (LLaMA 3.1, Mixtral), OpenRouter, SambaNova, NVIDIA NIM. Таблицы лимитов, подводные камни, код fallback-страте
Секретные фичи Claude Code: YOLO Classifier, hooks и постоянная память из исходников
Разбор скрытых возможностей Claude Code: YOLO Classifier для автономной работы, система hooks и постоянная память из исходников. Примеры конфигураций.
Архитектура AI RPG: авторитарный бэкенд, structured output и борьба с амнезией LLM
Подробное руководство по созданию AI RPG с детерминированными механиками: FastAPI, pgvector, JSON-контракты, structured output. Решение проблемы дрейфа и амнези
SEO в эпоху AI-поиска: как измерить долю ответов и адаптироваться к AI Overviews в 2026 году
Разбираем, как измерить Share of Voice в AI-поиске, адаптироваться к AI Overviews Google и Яндекс Нейро, и почему GEO заменяет SEO в 2026 году.
LLM-Independent Adaptive RAG: как запускать retrieval без участия языковой модели
Разбираем новый подход от Skoltech/AIRI: Adaptive RAG, который не требует LLM для принятия решений о поиске. Снижаем затраты и галлюцинации.
Профилирование PyTorch: полное руководство по torch.profiler для начинающих
Полное руководство по torch.profiler в PyTorch 2.7: от установки до продвинутого профилирования LLM и Triton kernels. Разбор ошибок, практические примеры, внутр