Учебные материалы
Как скрытый слот PCIe 2.0 x4 уничтожил производительность 4x RTX 3090 и как это исправить: полный гайд по диагностике multi-GPU rig
Реальный кейс: слот PCIe 2.0 x4 убил производительность 4x RTX 3090. Узнайте, как диагностировать и исправить проблему с multi-GPU rig. Команды, настройки, сове
Связка rtk + context-mode поверх Serena и Semble: аудит прокси-экономии токенов — профит или оверхед?
Детальный аудит связки rtk + context-mode поверх Serena и Semble: замеры экономии токенов, оверхед по латентности, пошаговая настройка и подводные камни. Резуль
Практическое руководство по LLM Engineering: RAG, реранкеры и оценка — полный гайд с примерами кода
Пошаговое руководство по сборке продакшн-пайплайна RAG: гибридный поиск, реранкеры, LLM-as-Judge. Примеры кода, грабли и советы инженера.
Как внедрить MCP в Enterprise: опыт платформы MWS Octapi с low-code интеграциями
Пошаговое руководство по интеграции MCP-протокола с корпоративными системами на примере low-code платформы MWS Octapi. OpenAPI, SOAP, GraphQL и типичные ошибки.
Как появиться в ответах ChatGPT: пошаговый гайд по созданию личного сайта для LLM за один вечер
Пошаговая инструкция, как за один вечер создать сайт, который ChatGPT и Claude будут цитировать. Форк репозитория, llms.txt, деплой, подводные камни.
ZeroClaw: как мы автоматизировали расчёт отпусков с помощью AI-агента в корпоративном мессенджере
Подробный кейс: ZeroClaw + Mattermost для расчёта отпусков. Интеграция, локальные модели, обработка исключений. Сократили время расчёта с 30 минут до 30 секунд.
Стратум: инженерная методология для превращения LLM в детерминированную систему
Галлюцинации и нестабильность LLM побеждаются архитектурно. Стратум — методология, вдохновлённая советской школой проектирования. Пошаговый гайд с примерами и т
DQ-шаблон с ИИ-агентом и MCP: как мы автоматизировали проверку качества данных (и где споткнулись)
Практический гайд по сборке DQ-шаблона с ИИ-агентом и MCP-сервером: архитектура, пошаговый план, типичные ошибки и как их избежать. Для BI и Data Engineering ко
Как настроить K8s для LLM инференса: DRA, GIE и LLM-D на практике
Настройка Kubernetes для высоконагруженного LLM инференса с DRA, GIE и LLM-D. Практические шаги, архитектура, ошибки. Только реальный опыт 2026.
Масштабирование AI-систем: от GPT-wrapper до распределённой архитектуры
Как превратить простой API-вызов в миллион RPS? Разбираем кэширование, rate limiting, роутинг запросов и распределенный вывод. Гайд для DevOps и архитекторов AI
Сравнение 21 инструмента сборки контекста для AI-агентов: от ripgrep до RAG и LSP (бенчмарк и экономия токенов)
Сравнение ripgrep, srag, ToolTrim, Context Lens и других тулов. Бенчмарк скорости, точности и экономии токенов. Анализ LLM-судьи. Какие инструменты реально спас
Как настроить MiMo-2.5 для кодинга: решение проблемы зацикливания
Пошаговое решение проблемы зацикливания MiMo-2.5 (310B) при локальном кодинге. Правильные кванты, параметры context_length, temperature и repeat_penalty для ста