Гайды по AI и нейросетям

Manual #2739 7 min

Devstral Small 2 на стероидах: как выжать 2-3x скорость в llama.cpp через ngram-mod и draft-логику

Пошаговый гайд по настройке ngram-mod и speculative decoding для 2-3x ускорения Devstral Small 2 в llama.cpp. Конкретные команды, параметры и тесты.

Открыть документ

Manual #2737 9 min

Embedding-модели для compliance-документов: как не провалить проверку из-за плохого RAG

Практический гайд по выбору embedding-моделей для регуляторных документов. Сравнение производительности, чанкинг, рекомендации для продакшена.

Открыть документ

Manual #2734 10 min

Бот-аналитик на локальной LLM: как мы в ecom.tech разгрузили команду и не отправили данные конкурентам

Практическое руководство по созданию локального бота для генерации SQL-запросов. Архитектура, выбор моделей, работа с изолированной БД на примере реального кейс

Открыть документ

Manual #2731 10 min

Музейный гид, который не повторяется: как собрать персональный аудиогид на LLM и TTS

Пошаговый гайд по созданию умного аудиогида для музеев на базе локальных LLM и TTS моделей. Архитектура, промпты и развертывание.

Открыть документ

Manual #2730 8 min

Строим ETL-пайплайн для криминальной статистики: Prefect, Metabase и никаких костылей

Пошаговый гайд по созданию ETL-пайплайна для анализа криминальной статистики с использованием Prefect 3.0, PostgreSQL и Metabase. Код, архитектура, ошибки.

Открыть документ

Manual #2729 7 min

Сравнение логических способностей Kimi k2.5 и Gemini 3.0 Flash: тест на «смерть от интеллекта»

Экспериментальное сравнение логических способностей Kimi k2.5 и Gemini 3.0 Flash на сложных задачах. Тест показывает критическую проблему Gemini с обрезанием вы

Открыть документ

Manual #2726 9 min

Рекрутер против алгоритма: кто из российских ИИ-агентов на самом деле умеет находить людей

Практический разбор российских ИИ-агентов для найма сотрудников. Тестируем скрининг резюме, анализ кандидатов и реальную эффективность на рынке 2026 года.

Открыть документ

Manual #2724 9 min

SEO-переводы на автопилоте: кто реально справляется — Hunyuan-MT-7B, TranslateGemma 4B или платные гиганты?

Тест-драйв моделей перевода для SEO-текстов. Локальные решения против API-гигантов: что выбрать для 15 языков с ограничениями символов.

Открыть документ

Manual #2723 7 min

Текст в картинку с нуля: абляции, рецепт и код, который не сломается

Полный гайд по тренировке тексто-изображение моделей с нуля. Абляции, рецепт обучения, PRX, код. Объясняем, почему всё работает.

Открыть документ

Manual #2721 9 min

Как защитить AI-агентов от wallet-drain атак: разбор реального случая prompt injection с Moltbook

Подробный разбор реальной wallet-drain атаки через prompt injection на AI агентов Moltbook. Практические методы защиты на 2026 год.

Открыть документ

Manual #2720 7 min

Когда сжатие памяти в macOS убивает LLM: полный гайд по отключению

MacBook тормозит с локальными LLM? Виртуальная память съедает производительность. Пошаговое руководство по отключению сжатия памяти в macOS для стабильной работ

Открыть документ

Manual #2718 8 min

Step-3.5-Flash-Int4 в llama.cpp: как заставить модель думать, а не повторять одно и то же

Пошаговая инструкция по настройке llama.cpp для Step-3.5-Flash-Int4: оптимальные параметры температуры, penalty и контекста против зацикливания в reasoning.

Открыть документ

Учебные материалы

Devstral Small 2 на стероидах: как выжать 2-3x скорость в llama.cpp через ngram-mod и draft-логику

Embedding-модели для compliance-документов: как не провалить проверку из-за плохого RAG

Бот-аналитик на локальной LLM: как мы в ecom.tech разгрузили команду и не отправили данные конкурентам

Музейный гид, который не повторяется: как собрать персональный аудиогид на LLM и TTS

Строим ETL-пайплайн для криминальной статистики: Prefect, Metabase и никаких костылей

Сравнение логических способностей Kimi k2.5 и Gemini 3.0 Flash: тест на «смерть от интеллекта»

Рекрутер против алгоритма: кто из российских ИИ-агентов на самом деле умеет находить людей

SEO-переводы на автопилоте: кто реально справляется — Hunyuan-MT-7B, TranslateGemma 4B или платные гиганты?

Текст в картинку с нуля: абляции, рецепт и код, который не сломается

Как защитить AI-агентов от wallet-drain атак: разбор реального случая prompt injection с Moltbook

Когда сжатие памяти в macOS убивает LLM: полный гайд по отключению

Step-3.5-Flash-Int4 в llama.cpp: как заставить модель думать, а не повторять одно и то же