Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #6275 6 min

Борьба с анизотропией эмбеддингов: как центрирование улучшает косинусное сходство на практике

Проблема анизотропии эмбеддингов: почему косинусное сходство врет? Практическое решение — центрирование векторов. Пример из Obsidian-базы, код Python и метрики.

Открыть документ
Manual #6272 9 min

Когда 128K токенов — это смешно: Обработка документов-гигантов через Bedrock AgentCore и Recursive Language Models

Пошаговый гайд: преодолеваем ограничение контекстного окна с помощью Recursive Language Models, Amazon Bedrock AgentCore и Code Interpreter. Обработка 500+ стра

Открыть документ
Manual #6270 8 min

Как нейросеть выявляет подмену почерка на экзаменах без эталона: технический разбор на Python

Технический гайд по созданию пайплайна на Python для выявления подмены почерка в экзаменационных работах без эталонного образца. Сиамская нейросеть, сегментация

Открыть документ
Manual #6269 8 min

3 навыка Claude для Data Scientist в 2026: как создавать AI-дашборды и автоматизировать анализ

Научитесь создавать AI-дашборды с Claude 4 Opus, автоматизировать анализ данных и настраивать агентные пайплайны. Реальные промпты, ошибки и чек-лист.

Открыть документ
Manual #6265 10 min

LLM Planner: подбор железа и моделей для локального запуска — 60+ сборок, 50+ моделей и 130+ бенчмарков

Планировщик LLM: 50+ моделей, 60+ сборок, 130+ бенчмарков. Как выбрать ПК под нейросети или модель под свой компьютер. Реальные t/s и ссылки на тесты.

Открыть документ
Manual #6263 8 min

Генеративная модель персонализации ARGUS: как Яндекс переосмыслил рекомендательные системы

Глубокий технический разбор генеративной рекомендательной системы ARGUS от Яндекса: токенизация последовательностей, претрейн, каскадная фильтрация и кросс-серв

Открыть документ
Manual #6262 11 min

Как построить production-ready control layer для LLM: 8 компонентов с кодом и бенчмарками

Пошаговое руководство по построению control layer для LLM: InputGuard, TokenBudget, CircuitBreaker и другие. Код, бенчмарки, 0% → 100% pass rate.

Открыть документ
Manual #6260 6 min

Три критика и один судья: как мы строили multi-agent фидбек для художников (и во сколько это обошлось)

Разбор архитектуры multi-agent feedback для художников: 3 LLM-персоны + судья, компромиссы, стоимость токенов и реальные метрики. Опыт продакшна.

Открыть документ
Manual #6255 9 min

Как избежать роста latency и перегрева GPU: проектирование AI-сервисов с изолированным inference bundle

Практическое руководство по проектированию AI-сервисов с изолированным inference bundle. vLLM, SGLang, continuous batching — как избежать просадок производитель

Открыть документ
Manual #6254 8 min

Schema-enforced execution с tool_use: как повысить надежность структурированных ответов Claude до 95%

Гайд по schema-enforced execution и tool_use Claude: поднимаем надежность структурированных ответов с 65% до 95%+. Примеры кода, ловушки и evals.

Открыть документ
Manual #6253 9 min

AMD BC-250 для дешёвого локального LLM: разблокировка CUs через регистры amdgpu

Как превратить $30 карту на чипе PS5 в 36-ядерный AI-ускоритель. Регистр CC_GC_SHADER_ARRAY_CONFIG, прошивка VBIOS, сборка llama.cpp с Vulkan — полный гайд 2026

Открыть документ
Manual #6251 8 min

Развертывание real-time ASR с Voxtral-Mini-4B на Amazon SageMaker и vLLM: пошаговое руководство

Пошаговый гайд по запуску Voxtral-Mini-4B на SageMaker с vLLM: bidirectional streaming, WebSocket, настройка инстансов, типичные ошибки и их решение.

Открыть документ