Гайды по AI и нейросетям

Manual #6059 6 min

Как запустить языковую модель на Game Boy Color: экстремальное сжатие трансформеров

Запуск языковой модели на 8-битной консоли: 1-битное квантование, Z80 ассемблер, 8KB RAM. Реальный гайд с кодом и подводными камнями.

Открыть документ

Manual #6055 1 min

Инженерия качества ИИ-агентов: измеряем Factual Correctness с помощью RAGAS (Часть 2)

Глубокий разбор метрики Factual Correctness из RAGAS: claim decomposition, промпты, пошаговый код и подводные камни. Для QA-инженеров AI-агентов.

Открыть документ

Manual #6053 9 min

Выбор локальной LLM для системы мониторинга: интеграция Zabbix с нейросетью

Практическое руководство по выбору и внедрению локальной языковой модели для анализа алертов Zabbix. Критерии, архитектура, ошибки, лучшие модели на май 2026.

Открыть документ

Manual #6052 9 min

Гибридный поиск и реранжирование в production RAG: почему dense retrieval недостаточно

Почему dense retrieval ломает RAG в production. Гайд по гибридному поиску (BM25 + вектор) и реранжированию cross-encoder. Метрики, код, ошибки и production-аспе

Открыть документ

Manual #6050 9 min

Как построить AI-директора: отказ от RAG, граф знаний и типизированная память

Пошаговый гайд по созданию AI-агента-директора на FastAPI, Claude Haiku 4.5 и SQLite. Отказ от RAG в пользу графа знаний и типизированной памяти: архитектура, к

Открыть документ

Manual #6045 6 min

Почему короткий промпт может быть дороже длинного: разбор prefix cache в LLM-агентах

Разбираем парадокс: ужимая промпт для агентов, вы теряете преимущества prefix caching. Рассказываю, как логировать кэш, не стрелять себе в ногу и экономить до 9

Открыть документ

Manual #6043 8 min

Вайбкодинг по-взрослому: как я вывел MVP из головы в прод за 3 дня (и что пошло не так)

Пошаговый гайд по вайбкодингу с Claude Code и Codex. Реальные ошибки, оптимизация WebM, деплой на OpenServer. Личный опыт с 26-летним стажем.

Открыть документ

Manual #6042 8 min

Как создать мультиклиентский центр управления для AI-агентов: Planulix на Go и Flutter

Соберите собственный центр управления для Claude Code, Cursor, Codex и Kimi. Go-шлюз, Flutter UI, VPS — решение проблемы блокировок аккаунтов. Полный гайд с код

Открыть документ

Manual #6041 10 min

Как развернуть Ollama и Open WebUI на VPS без GPU: полный гайд с подводными камнями

Пошаговое руководство по запуску самодельного ChatGPT на CPU VPS с Docker, Ollama, Open WebUI, nginx и SSL. Подводные камни, оптимизация памяти и выбор модели.

Открыть документ

Manual #6040 9 min

Как прикрутить веб-поиск к AI-агенту: Strands Agents SDK + Exa — пошаговое пособие для тех, кто устал от галлюцинаций

Полный гайд по интеграции Strands Agents SDK (AWS) и Exa для AI-агентов с веб-доступом. Код, примеры, ошибки и советы для production.

Открыть документ

Manual #6035 6 min

Gemma 4 в браузере: запуск офлайн с WebGPU и управление роботом через WebSerial — пошаговое руководство

Пошаговое руководство: запустите Gemma 4 полностью в браузере на WebGPU, без интернета. Управляйте роботом через WebSerial. Код, нюансы, примеры.

Открыть документ

Manual #6033 7 min

Автоматическое извлечение параметров из 2D-чертежей: пайплайн с YOLO, кастомным OCR и логикой на правилах

Детальный технический гайд: как объединить детекцию YOLOv12, кастомный TrOCR и грамматику для автоматического снятия размеров с PDF и DWG чертежей. Реальные кей

Открыть документ

Учебные материалы

Как запустить языковую модель на Game Boy Color: экстремальное сжатие трансформеров

Инженерия качества ИИ-агентов: измеряем Factual Correctness с помощью RAGAS (Часть 2)

Выбор локальной LLM для системы мониторинга: интеграция Zabbix с нейросетью

Гибридный поиск и реранжирование в production RAG: почему dense retrieval недостаточно

Как построить AI-директора: отказ от RAG, граф знаний и типизированная память

Почему короткий промпт может быть дороже длинного: разбор prefix cache в LLM-агентах

Вайбкодинг по-взрослому: как я вывел MVP из головы в прод за 3 дня (и что пошло не так)

Как создать мультиклиентский центр управления для AI-агентов: Planulix на Go и Flutter

Как развернуть Ollama и Open WebUI на VPS без GPU: полный гайд с подводными камнями

Как прикрутить веб-поиск к AI-агенту: Strands Agents SDK + Exa — пошаговое пособие для тех, кто устал от галлюцинаций

Gemma 4 в браузере: запуск офлайн с WebGPU и управление роботом через WebSerial — пошаговое руководство

Автоматическое извлечение параметров из 2D-чертежей: пайплайн с YOLO, кастомным OCR и логикой на правилах