Учебные материалы
Анализ внутренней работы Gemma 3 Vision: загадка токена позиции 193 и как исследовать архитектуру VLM
Глубокий разбор внутренней работы Gemma 3 Vision. Методика анализа 10K изображений, матрицы косинусной схожести и разгадка тайны токена позиции 193.
Четыре человека, один сервер и восемь Blackwell: как мы совместно купили железо для локальных SOTA-моделей
Реальный кейс коллаборации: 4 человека, 1 сервер Gigabyte с 8 GPU Blackwell B200, запуск SOTA-моделей локально. Договор, распределение ресурсов, технические дет
Локальная LLM + Vertex AI Search: гибридная архитектура для заземлённого поиска без парсинга
Пошаговая инструкция по подключению локальной LLM к Google Vertex AI Search для создания заземлённых поисковых систем на малых GPU (16 ГБ). Гибридная архитектур
Контекстная амнезия в LangChain Deep Agents: как не дать AI-агенту забыть всё через 20 минут работы
Практическое руководство по сжатию контекста AI-агентов и работе с файловой системой в LangChain Deep Agents SDK. Техники для длительных задач.
Когда Claude пишет CUDA-ядра за вас: как обучать маленькие модели создавать оптимизированные диффузоры
Практический гайд по использованию Claude для обучения маленьких моделей писать оптимизированные CUDA-ядра для диффузионных моделей. Экономия времени и ресурсов
Кэширование эмбеддингов: как ускорить индексацию кодовой базы в 7.6 раза
Полное руководство по кэшированию эмбеддингов для RAG-систем. Ускорьте индексацию кодовой базы в 7.6 раз с помощью семантического кэша, batch-запросов и правиль
Kimi K2.5 в vLLM и SGLang: как убить '(no content)' и утечку тегов на H200
Подробное решение проблем с ответами '(no content)' и утечкой XML-тегов при запуске Kimi K2.5 в vLLM и SGLang на H200 GPU. Настройка tool-call-parser и параметр
Когда номенклатура превращается в бардак: как LLM с Structured Output чистят корпоративные справочники
Практическое руководство по нормализации корпоративных справочников номенклатуры с помощью локальных LLM и Structured Output. Обработка Excel, Ollama, бизнес-ав
Сравнение генераторов изображений 2026: тест на странном промпте со стеклянным бегемотом
Сравнение 12 AI-моделей для генерации изображений в 2026 году. Тест на странном промпте "стеклянный бегемот". Результаты, анализ, выбор лучшего инструмента.
Kakugo: как выжать 120 миллиардов параметров в 3 миллиарда для своего языка
Полный пайплайн дистилляции GPT OSS 120B в 3B модель для низкоресурсного языка. Аппаратные требования, код, методика и подводные камни.
Как заменить мышь на жесты рук: создание управления ПК на Python с OpenCV и MediaPipe
Пошаговый гайд по созданию системы управления компьютером жестами рук на Python с OpenCV и MediaPipe. Замена мыши на жесты в реальном времени.
Агентный инжиниринг: от нуля до продакшена за один репозиторий
Полный гайд по агентному инжинирингу с разбором open-source репозитория. Архитектура, инструменты, внедрение в команде на 2026 год.