Учебные материалы
RAG failed: 3 причины плохого поиска и способы их исправления
Разбираем три основные причины провала RAG: чанкинг, эмбеддинги и ретривал. Практические советы с кодом и ссылками на актуальные исследования 2026 года.
24 ГБ ОЗУ на M4 и 64k контекст: какие LLM реально работают без тормозов?
Подробный гайд: какие модели LLM запускать на MacBook M4 с 24 ГБ RAM, чтобы получить 64k контекста и оставить место для браузера. Квантование, инструменты, ошиб
Как внедрить llms.txt на сайт: пошаговое руководство для SEO и AI-цитируемости
Пошаговое руководство по внедрению llms.txt: что это, зачем нужно и как настроить для AI-цитируемости. Примеры кода, ошибки и прогнозы на 2026 год.
AI-агент в SDLC: как он закрывает тикеты без участия человека и почему зелёный дашборд перестал быть правдой
Реальный опыт внедрения AI-агентов в разработку: почему метрики закрытых тикетов обманчивы, как избежать технического долга и не попасться на уловки зелёного да
Макросы как микроавтоматизация: чему игровые мыши учат AI-workflow
Разбираем игровые макросы через призму автоматизации: профили мышей, сценарии ввода, CS2, RPG, RTS и AI-подход к настройке workflow.
От вайбкодинга к агентскому флоу: как перестать писать убер-промпты и начать формировать инфраструктуру для работы с ИИ
Практический гайд Senior DevOps о переходе от вайбкодинга к агентскому флоу. Пошаговая настройка инфраструктуры для ИИ-агентов, типичные ошибки и примеры кода.
Vibe-кодинг: как я создал Android-приложение с помощью ИИ от идеи до продакшена
Подробный опыт DevOps: как я за 2 недели создал Android-приложение (Kotlin, Node.js, Docker) с помощью ИИ, без найма разработчиков. Архитектура, авторизация, БД
Как настроить MTP (Multi-Token Prediction) для Gemma 4 31B в LlamaCPP: решение проблемы с отсутствием отдельного drafter GGUF
Пошаговый гайд по настройке Multi-Token Prediction для Gemma 4 31B в LlamaCPP. Узнайте, как обойти проблему с отсутствием отдельного drafter GGUF и ускорить инф
Корпоративный поиск с LLM: как в Яндексе побеждали галлюцинации A/B тестами и ранжированием
Как построить корпоративный поиск на основе LLM без галлюцинаций. Методология ранжирования и A/B экспериментов от инженеров Яндекса.
Три AI-модели вместо BI-правил: как построить аналитику прибыли по каждому SKU для Ozon и Wildberries
SaaS-архитектура с реверс-инжинирингом API, агентами Claude 4 Opus и тремя моделями для P&L каждого товара на маркетплейсах. Практический гайд.
Как развернуть мультистадийную мультимодальную рекомендательную систему на Amazon EKS: полное руководство с Bloom-фильтрами, кэшированием и Triton Inference Server
Пошаговый гайд по развертыванию 14 моделей на Amazon EKS с NVIDIA Triton, Bloom-фильтрами и in-memory кэшированием. Архитектура, автоскейлинг, ошибки и решения.
Исполняемые бизнес-процессы на BPMN, Camunda и Bitrix24: реальный кейс автоматизации с AI-агентами
Пошаговый гайд по интеграции Camunda и Bitrix24 с AI-агентами. Оркестрация бизнес-процессов, передача контекста, обработка ошибок. Работающий кейс enterprise.