Учебные материалы
Как запустить языковую модель на Game Boy Color: экстремальное сжатие трансформеров
Запуск языковой модели на 8-битной консоли: 1-битное квантование, Z80 ассемблер, 8KB RAM. Реальный гайд с кодом и подводными камнями.
Инженерия качества ИИ-агентов: измеряем Factual Correctness с помощью RAGAS (Часть 2)
Глубокий разбор метрики Factual Correctness из RAGAS: claim decomposition, промпты, пошаговый код и подводные камни. Для QA-инженеров AI-агентов.
Выбор локальной LLM для системы мониторинга: интеграция Zabbix с нейросетью
Практическое руководство по выбору и внедрению локальной языковой модели для анализа алертов Zabbix. Критерии, архитектура, ошибки, лучшие модели на май 2026.
Гибридный поиск и реранжирование в production RAG: почему dense retrieval недостаточно
Почему dense retrieval ломает RAG в production. Гайд по гибридному поиску (BM25 + вектор) и реранжированию cross-encoder. Метрики, код, ошибки и production-аспе
Как построить AI-директора: отказ от RAG, граф знаний и типизированная память
Пошаговый гайд по созданию AI-агента-директора на FastAPI, Claude Haiku 4.5 и SQLite. Отказ от RAG в пользу графа знаний и типизированной памяти: архитектура, к
Почему короткий промпт может быть дороже длинного: разбор prefix cache в LLM-агентах
Разбираем парадокс: ужимая промпт для агентов, вы теряете преимущества prefix caching. Рассказываю, как логировать кэш, не стрелять себе в ногу и экономить до 9
Вайбкодинг по-взрослому: как я вывел MVP из головы в прод за 3 дня (и что пошло не так)
Пошаговый гайд по вайбкодингу с Claude Code и Codex. Реальные ошибки, оптимизация WebM, деплой на OpenServer. Личный опыт с 26-летним стажем.
Как создать мультиклиентский центр управления для AI-агентов: Planulix на Go и Flutter
Соберите собственный центр управления для Claude Code, Cursor, Codex и Kimi. Go-шлюз, Flutter UI, VPS — решение проблемы блокировок аккаунтов. Полный гайд с код
Как развернуть Ollama и Open WebUI на VPS без GPU: полный гайд с подводными камнями
Пошаговое руководство по запуску самодельного ChatGPT на CPU VPS с Docker, Ollama, Open WebUI, nginx и SSL. Подводные камни, оптимизация памяти и выбор модели.
Как прикрутить веб-поиск к AI-агенту: Strands Agents SDK + Exa — пошаговое пособие для тех, кто устал от галлюцинаций
Полный гайд по интеграции Strands Agents SDK (AWS) и Exa для AI-агентов с веб-доступом. Код, примеры, ошибки и советы для production.
Gemma 4 в браузере: запуск офлайн с WebGPU и управление роботом через WebSerial — пошаговое руководство
Пошаговое руководство: запустите Gemma 4 полностью в браузере на WebGPU, без интернета. Управляйте роботом через WebSerial. Код, нюансы, примеры.
Автоматическое извлечение параметров из 2D-чертежей: пайплайн с YOLO, кастомным OCR и логикой на правилах
Детальный технический гайд: как объединить детекцию YOLOv12, кастомный TrOCR и грамматику для автоматического снятия размеров с PDF и DWG чертежей. Реальные кей