Учебные материалы
Agent Zero на 84 ГБ VRAM: как заставить агента не врать и не тормозить
Детальный гайд по настройке Agent Zero на мощном железе. Распределение моделей между Ollama и llama.cpp, выбор квантований, борьба с галлюцинациями LLM.
Таксономия дрейфа LLM: как отличить контекстную вариацию от реального изменения поведения модели
Практическое руководство по диагностике дрейфа LLM. Учимся отличать контекстные вариации от системных изменений модели с помощью новой таксономии.
RAG-чатбот для корпоративных знаний: как оживить архивы и инструкции с помощью ИИ
Пошаговое руководство по созданию RAG-чатбота для корпоративных знаний. Извлечение данных из архивов, выбор моделей, развертывание.
RLM: как заставить LLM управлять своим контекстом, пока он не сгнил
Полное руководство по RLM, context folding и scaffolding. Как обучать LLM управлять длинным контекстом и бороться с деградацией качества.
Как методисту создать обучающий курс за месяц с помощью ИИ: пошаговый гайд от практика
Узнайте, как использовать ИИ для создания обучающих курсов за 30 дней. Конкретные шаги, инструменты, промпты и личный опыт.
Сборка мощной рабочей станции для локальных LLM: личный опыт с 3x3090 и 3060 в mid-tower корпусе
Подробный гайд по сборке рабочей станции для локальных LLM с 4 видеокартами (3x RTX 3090 + RTX 3060) в mid-tower корпусе. Решения по охлаждению, питанию 1500W и
VibeVoice-Realtime-0.5B на Orange Pi: дикий гуайд по квантованию, которого нет в интернете
Полное руководство по поиску и квантованию VibeVoice-Realtime-0.5B Stream для Orange Pi и одноплатников. GGUF, ONNX, оптимизация памяти.
3x NVIDIA V620 на 96 ГБ VRAM: постройка локального монстра для ИИ без компромиссов
Подробное руководство по сборке мощной локальной станции с тремя NVIDIA V620 на 96 ГБ VRAM для запуска больших языковых моделей. Аппаратная часть, настройка, те
Minimax 2.1 на чистом CPU: какой квант выбрать, если нет видеокарты
Тестируем Minimax 2.1 на CPU без GPU. Сравниваем q4, q5, q8 квантования. Замеры скорости на DDR4/DDR5. Какой формат выбрать для работы в RAM.
Локальный ИИ на телефоне: как собрать требования сообщества и не сойти с ума
Гид для разработчиков: как собрать требования сообщества для идеального мобильного приложения с локальным ИИ. Архитектура, модели, офлайн-режим.
Генерация игровых миров с помощью Instructor и локальной LLM: полный туториал по созданию RPG-вселенной
Пошаговый гайд по генерации консистентных игровых миров с помощью Instructor, Pydantic и локальной LLM. Создаем RPG-вселенную с SQLite-реестром фактов.
Проблемы при обучении LM с нуля: анализ ошибок потерь (loss) и работа с The Pile
Практический гайд по диагностике странного поведения loss при обучении языковой модели с нуля на The Pile. Решаем проблемы с DDP, потоковой загрузкой и отладкой