Учебные материалы
Борьба с анизотропией эмбеддингов: как центрирование улучшает косинусное сходство на практике
Проблема анизотропии эмбеддингов: почему косинусное сходство врет? Практическое решение — центрирование векторов. Пример из Obsidian-базы, код Python и метрики.
Когда 128K токенов — это смешно: Обработка документов-гигантов через Bedrock AgentCore и Recursive Language Models
Пошаговый гайд: преодолеваем ограничение контекстного окна с помощью Recursive Language Models, Amazon Bedrock AgentCore и Code Interpreter. Обработка 500+ стра
Как нейросеть выявляет подмену почерка на экзаменах без эталона: технический разбор на Python
Технический гайд по созданию пайплайна на Python для выявления подмены почерка в экзаменационных работах без эталонного образца. Сиамская нейросеть, сегментация
3 навыка Claude для Data Scientist в 2026: как создавать AI-дашборды и автоматизировать анализ
Научитесь создавать AI-дашборды с Claude 4 Opus, автоматизировать анализ данных и настраивать агентные пайплайны. Реальные промпты, ошибки и чек-лист.
LLM Planner: подбор железа и моделей для локального запуска — 60+ сборок, 50+ моделей и 130+ бенчмарков
Планировщик LLM: 50+ моделей, 60+ сборок, 130+ бенчмарков. Как выбрать ПК под нейросети или модель под свой компьютер. Реальные t/s и ссылки на тесты.
Генеративная модель персонализации ARGUS: как Яндекс переосмыслил рекомендательные системы
Глубокий технический разбор генеративной рекомендательной системы ARGUS от Яндекса: токенизация последовательностей, претрейн, каскадная фильтрация и кросс-серв
Как построить production-ready control layer для LLM: 8 компонентов с кодом и бенчмарками
Пошаговое руководство по построению control layer для LLM: InputGuard, TokenBudget, CircuitBreaker и другие. Код, бенчмарки, 0% → 100% pass rate.
Три критика и один судья: как мы строили multi-agent фидбек для художников (и во сколько это обошлось)
Разбор архитектуры multi-agent feedback для художников: 3 LLM-персоны + судья, компромиссы, стоимость токенов и реальные метрики. Опыт продакшна.
Как избежать роста latency и перегрева GPU: проектирование AI-сервисов с изолированным inference bundle
Практическое руководство по проектированию AI-сервисов с изолированным inference bundle. vLLM, SGLang, continuous batching — как избежать просадок производитель
Schema-enforced execution с tool_use: как повысить надежность структурированных ответов Claude до 95%
Гайд по schema-enforced execution и tool_use Claude: поднимаем надежность структурированных ответов с 65% до 95%+. Примеры кода, ловушки и evals.
AMD BC-250 для дешёвого локального LLM: разблокировка CUs через регистры amdgpu
Как превратить $30 карту на чипе PS5 в 36-ядерный AI-ускоритель. Регистр CC_GC_SHADER_ARRAY_CONFIG, прошивка VBIOS, сборка llama.cpp с Vulkan — полный гайд 2026
Развертывание real-time ASR с Voxtral-Mini-4B на Amazon SageMaker и vLLM: пошаговое руководство
Пошаговый гайд по запуску Voxtral-Mini-4B на SageMaker с vLLM: bidirectional streaming, WebSocket, настройка инстансов, типичные ошибки и их решение.