Учебные материалы
Как настроить MiMo-2.5 для кодинга: решение проблемы зацикливания
Пошаговое решение проблемы зацикливания MiMo-2.5 (310B) при локальном кодинге. Правильные кванты, параметры context_length, temperature и repeat_penalty для ста
TOON vs TRON vs JSON: какой формат данных эффективнее для LLM? Подробное сравнение с бенчмарками
Сравнение TOON, TRON и JSON для LLM. Реальные бенчмарки, экономия токенов, скорость парсинга. Какой формат выбрать для RAG и промптов? Тесты на GPT-4o и Llama 4
Как построить AI-агента: уроки из провала — токены, зацикливание и мультиагентные роли
Разбор трёх фатальных проблем AI-агентов: бесконечные циклы, неконтролируемый расход токенов и почему один агент плох. Решения на LangGraph с мультиагентными ро
Как сократить расход токенов в Hermes Agent: оптимизация фоновых задач через конфиг YAML
Узнайте, как auxiliary блоки Hermes Agent сжирают токены. Настройка роутинга моделей через YAML: пример экономии в 125 раз. Пошаговое руководство с конфигом.
Как добавить кнопку «Спросить у ИИ» на сайт: готовый код для Яндекс Алисы, ChatGPT, Perplexity и Claude
Готовые HTML-кнопки и deeplink-ссылки для интеграции Яндекс Алисы, ChatGPT, Perplexity и Claude на сайт. Повышайте доверие и конверсию с помощью AI-помощников.
Создание Telegram-канала автоматического мониторинга AI-новостей без навыков разработки: опыт продакт-менеджера
Пошаговое руководство по созданию автоматического Telegram-канала мониторинга AI-новостей с помощью n8n, RSS и GPT. Опыт продакт-менеджера.
Бенчмарк LLM на Jetson Orin Nano Super 8GB: производительность 8 моделей в 4 режимах мощности
Тестируем 8 LLM (Qwen2.5, LLaMA 3.2, Nemotron, Phi-4, Gemma 3, Mistral, Command R, DeepSeek) на Jetson Orin Nano Super в 4 режимах мощности. Сравнение скорости,
A/B-тестирование на малых выборках: 26 шагов для повышения чувствительности и валидности — гайд от Avito
Гайд от Avito: как проводить A/B-тесты, когда у вас всего 10–40 наблюдений. 26 практических шагов, код на Python и реальные кейсы. Повышаем чувствительность без
Whisper vs GigaAM для русского ASR: реальные бенчмарки, ловушки WER и выбор для продакшена (CPU/GPU)
Сравнение Whisper large-v3-turbo и GigaAM-v3 Сбера для русского языка. Реальные цифры WER, ловушки метрик, рекомендации по железу: от CPU до GPU. Гайд для прода
Глубокое погружение в veRL: что скрывается под капотом RL post-training, инструменты и фатальный баг NCCL
Детальный разбор фреймворка veRL: архитектура, гибридный parallelism, инструменты. Как обойти критический баг NCCL при пост-тренинге с RL. Опыт форка.
Настройка собственных секретов AWS Secrets Manager для Amazon Bedrock AgentCore: полный гайд
Научитесь настраивать собственные секреты AWS Secrets Manager для Amazon Bedrock AgentCore. Полный гайд с примерами кода, IAM политиками и лайфхаками от DevOps.
Как победить галлюцинации LLM в AI-RPG: гибридный Guard с Embedding, микро-LLM и State Validator
Пошаговое руководство по гибридному Guard для борьбы с галлюцинациями в AI-играх: Embedding Classifier, микро-LLM Extractor и State Validator. Решает проклятие