Учебные материалы
Почему LoRA не сработала для русификации Mistral 7B: разбор кейса по суммаризации встреч и рабочие методы
Глубокий разбор: почему LoRA не русифицировала Mistral 7B для суммаризации встреч. Рабочий пайплайн с Whisper v4, pyannote.audio 3.1 и BertScore 0.93. Практичес
LangChain, Home Assistant AI или TuyaClaw: три фреймворка для AI-умного дома, которые я тестировал 3 месяца
Личный опыт использования трех фреймворков AI для умного дома. Техническое сравнение, код, ошибки и четкие рекомендации для разных сценариев.
Запуск маленьких LLM (3-9B) с интернет-доступом на слабом железе: руководство по MCP, RAG и гибридным подходам
Практическое руководство по запуску маленьких LLM с интернет-доступом на 8 ГБ VRAM. Используем Qwen 3.5 4B, MCP, RAG и гибридные подходы для максимума эффективн
Архитектура Computer Vision для модерации: как Wildberries обрабатывает 15 млн карточек в день
Подробный гайд по продакшен-архитектуре Computer Vision для модерации карточек. TensorRT, DALI, Triton и ансамбли моделей для обработки 15 млн изображений ежедн
Как использовать ChatGPT и Claude для медицинского самообследования: реальный кейс с нарушением бинокулярного зрения
Практический гайд по использованию ИИ для самодиагностики нарушения бинокулярного зрения. Примеры промптов, ошибки врачей, этические нюансы.
Как связать машинное зрение, WMS и конвейер: руководство по интеграции на реальном кейсе
Пошаговое руководство по соединению компьютерного зрения, системы управления складом и конвейера для автоматической сортировки. Реальный промышленный кейс с вес
Архитектура civStation: строим VLM-агента для игр без единого API
Подробный гайд по созданию игрового бота на VLM с трехслойной архитектурой. Скриншот-анализ, планирование действий, human-in-the-loop контроль. Без доступа к AP
RL против математического программирования: кто победит в задаче коммивояжёра? Полный эксперимент с кодом
Практический эксперимент: сравниваем обучение с подкреплением (SDPO) и OR-Tools на задаче коммивояжёра. Весь код Python, метрики и честные выводы.
17 AI-агентов вместо отдела: как автоматизировать финансовую отчётность на Claude Code без кода
Практический кейс автоматизации отчётности для 200+ партнёров. Архитектура цепочки из 17 AI-агентов на Claude Code без написания кода. Экономит сотни часов.
Промпт-инжиниринг в продакшене: как заставить нейросеть работать как швейцарские часы (на примере hh.ru)
Разбираем, как перейти от случайных ответов LLM к надежным продакшен-системам. Пошаговый гайд на примере обработки резюме в hh.ru от Senior DevOps инженера. Акт
Как заставить локальную LLM понимать ваш код: техники контекста для разработчиков без облака
Пошаговое руководство по загрузке контекста кодовой базы в локальную LLM. Индексация, эмбеддинги и ручные методы для Qwen2.5 Coder и других моделей.
Провал теста: почему TurboQuant ещё не работает на Android и как собрать llama.cpp под ARM
Подробный отчет о тестировании TurboQuant на Snapdragon и пошаговая сборка llama.cpp под ARM для Android. Флаги компиляции, ошибки GGML type registration.