Гайды по AI и нейросетям

Manual #2122 8 min

Почему AI-агенты проваливают реальные рабочие задачи: разбор бенчмарка APEX-Agents и его выводы

Анализ бенчмарка APEX-Agents показывает, почему AI-агенты проваливают офисные задачи. Только 24.3% успеха у GPT-4.5 Turbo. Подробности и выводы.

Открыть документ

Manual #2120 8 min

Когда просто промптов мало: как Amazon затачивает LLM под бизнес-задачи

Разбор реальных кейсов Amazon по настройке LLM. Снижение ошибок на 33%, экономия 80% усилий. Техники SFT, PPO, DPO, GRPO для high-stakes приложений.

Открыть документ

Manual #2119 9 min

Когда ИИ проверяет мистику: как мы искали связь между ролями злодеев и судьбой актёров

Как мы использовали Алису AI и статистику для проверки гипотезы о материальности мысли на примере судеб актёров, игравших злодеев. Методология, результаты и оши

Открыть документ

Manual #2118 8 min

GLM 4.7, MiniMax-M2.1 или DeepSeek 3.2: какую модель впихнуть в IDE в 2025

Технический разбор трёх лучших AI-ассистентов для кода: бенчмарки, практические тесты и рекомендации по выбору для Cline/Roo Code. Только актуальные данные на я

Открыть документ

Manual #2117 9 min

Как запустить модель 14B на нескольких Jetson Orin Nano: распределённые вычисления с llama.cpp и RPC

Подробный гайд по запуску Qwen2.5-coder-14B на трёх Jetson Orin Nano через распределённый llama.cpp RPC-сервер. Архитектура, настройка сети, оптимизация произво

Открыть документ

Manual #2116 12 min

Как собрать бюджетную AI-станцию на Ryzen с 128 ГБ ОЗУ: модели и сценарии для студентов

Пошаговое руководство по сборке AI-станции на Ryzen с 128 ГБ ОЗУ для локального запуска LLM, Whisper, TTS и vision-моделей. Спецификации, оптимизация, конкретны

Открыть документ

Manual #2115 7 min

Drift в пайплайне AI-агента: как сократить 75% токенов на аудит кода

Пошаговое руководство по интеграции Drift в рабочий процесс AI-агента для автоматического получения контекста и сокращения 75% токенов на аудит кода.

Открыть документ

Manual #2114 10 min

Практическое руководство по квантованию моделей Qwen-3-VL: AWQ, INT8 и инструменты для начинающих

Пошаговое руководство по квантованию Qwen-3-VL моделей. AWQ для embedding, INT8 для inference. Настройка под RTX 3090/6000 Pro. Инструменты и ошибки.

Открыть документ

Manual #2111 10 min

Браузерный RAG для юристов: весь пайплайн в браузере, ноль утечек данных

Собираем полностью браузерный RAG-пайплайн на Phi-3.5 с WebGPU. MLC WebLLM, BGE-small, Tesseract.js, IndexedDB. Приватный анализ документов без серверов.

Открыть документ

Manual #2110 7 min

4GB VRAM в браузере: Phi-3.5 против карликов. Кто выживет в WebLLM?

Сравнение производительности Phi-3.5 и миниатюрных LLM в браузере на 4GB видеопамяти. Тесты WebGPU, реальные цифры потребления VRAM, выбор модели для RAG.

Открыть документ

Manual #2106 8 min

Проблема оценки AI-агентов: почему синтетические данные и субъективные метрики тормозят индустрию

Почему оценка AI-агентов сломана в 2026 году. Синтетические данные, стохастичность LLM и субъективные метрики мешают реальному прогрессу.

Открыть документ

Manual #2102 13 min

Конвертер аудиокниг на Qwen3 TTS: от PDF до голосового клона за один вечер

Пошаговый гайд по созданию локального конвертера аудиокниг с Qwen3 TTS. Клонирование голоса, обработка PDF/EPUB, интеллектуальное кэширование. Установка, настро

Открыть документ

Учебные материалы

Почему AI-агенты проваливают реальные рабочие задачи: разбор бенчмарка APEX-Agents и его выводы

Когда просто промптов мало: как Amazon затачивает LLM под бизнес-задачи

Когда ИИ проверяет мистику: как мы искали связь между ролями злодеев и судьбой актёров

GLM 4.7, MiniMax-M2.1 или DeepSeek 3.2: какую модель впихнуть в IDE в 2025

Как запустить модель 14B на нескольких Jetson Orin Nano: распределённые вычисления с llama.cpp и RPC

Как собрать бюджетную AI-станцию на Ryzen с 128 ГБ ОЗУ: модели и сценарии для студентов

Drift в пайплайне AI-агента: как сократить 75% токенов на аудит кода

Практическое руководство по квантованию моделей Qwen-3-VL: AWQ, INT8 и инструменты для начинающих

Браузерный RAG для юристов: весь пайплайн в браузере, ноль утечек данных

4GB VRAM в браузере: Phi-3.5 против карликов. Кто выживет в WebLLM?

Проблема оценки AI-агентов: почему синтетические данные и субъективные метрики тормозят индустрию

Конвертер аудиокниг на Qwen3 TTS: от PDF до голосового клона за один вечер