Гайды по AI и нейросетям

Manual #7116 7 min

Почему векторный RAG не справляется с памятью агентов: контекстный граф даёт 89% точности против 50%

Разбираем, почему векторный RAG проваливается в мультиагентной памяти, и как контекстный граф даёт 89% против 50%. Бенчмарки, код, ошибки.

Открыть документ

Manual #7115 6 min

Ретрофит legacy-сервисов: как добавить A2A и MCP поверх REST API без переписывания кода

Как надеть A2A и MCP поверх старого REST API, не трогая исходники. Пошаговая архитектура от AWS, примеры кода, ошибки и enterprise-кейсы. Адаптация для 2026 год

Открыть документ

Manual #7112 7 min

Почему GBDT всё ещё лучше LLM для real-time фрод-детекции: полный бенчмарк с открытым кодом

Сравниваем GBDT и LLM для real-time платежного фрода: задержки, стоимость, детерминизм. Бенчмарк с открытым кодом на GitHub. Узнайте, почему GBDT по-прежнему ко

Открыть документ

Manual #7110 8 min

Оптимизация обучения моделей на SageMaker с NVIDIA Blackwell: практические настройки batch size, precision и checkpointing

Пошаговый гайд по оптимизации обучения LLM на SageMaker с GPU Blackwell: как подобрать batch size, включить FP8 и настроить checkpointing, чтобы сэкономить до 4

Открыть документ

Manual #7107 7 min

Как запустить 3 AI-агента с разными LLM на одном старом GPU (GTX 1080 8GB): решение проблемы нехватки памяти

Пошаговое руководство по запуску трёх разных LLM-агентов на GTX 1080 8GB. Квантование моделей, offloading на CPU, оптимизация памяти. Рабочие конфиги и скрипты.

Открыть документ

Manual #7106 8 min

Создаём REPL для LLM на чистом Bash: туториал с curl, jq и pipes

Создайте интерактивный REPL для LLM из стандартных Unix-инструментов: curl, jq, pipes. Минимум зависимостей, максимум контроля для DevOps.

Открыть документ

Manual #7105 6 min

Запуск GLM 5.2 GGUF на consumer железе: 492GB модель на Threadripper и RTX 5090

Как запустить гигантскую модель GLM 5.2 (492B параметров) на домашнем ПК с Threadripper и RTX 5090. GGUF, Unsloth квантование, offloading, cmake и реальные бенч

Открыть документ

Manual #7098 9 min

Как валидировать NVIDIA H100 PCIe: сравнение с H100 NVL на сервере YADRO (бенчмарки и команды)

Полный гайд по валидации NVIDIA H100 PCIe: vLLM, NCCL, пропускная способность памяти. Сравнение с H100 NVL на сервере YADRO G4208P G3. Команды и типичные ошибки

Открыть документ

Manual #7097 8 min

Loop Engineering: как автоматизировать промптинг AI-агентов с помощью пяти базовых блоков

Разбираем методологию loop engineering от Anthropic и Addy Osmani. Пять примитивов для построения самоподдерживающихся AI-пайплайнов. Сравнение Claude Code и Co

Открыть документ

Manual #7096 6 min

Q4 против Q8 для Gemma 4 31B на 4090: тупой бенчмарк, который всё расставил по местам

Сравнение Q4-dynamic и Q8_0 для Gemma 4 31B на RTX 4090: VRAM, tok/s, точность tool-calling. Результаты тестов и практический выбор квантизации.

Открыть документ

Manual #7095 9 min

Сравнение AI-агентов на сложной задаче: реальный бенчмарк Depixelizing Pixel Art

Тестируем Claude Codex, Cursor, DeepAgents CLI и других AI-агентов на задаче восстановления пиксельной графики. Честный бенчмарк с кодом, промптами и результата

Открыть документ

Manual #7094 8 min

Запуск GLM-5.2 с MTP speculative decoding на 4× DGX Spark: сборка vLLM и Triton ядра

Пошаговый гайд по сборке vLLM с поддержкой MTP speculative decoding для GLM-5.2 на кластере из 4 DGX Spark. Настройка AWQ весов, Triton ядер и распределённого и

Открыть документ

Учебные материалы

Почему векторный RAG не справляется с памятью агентов: контекстный граф даёт 89% точности против 50%

Ретрофит legacy-сервисов: как добавить A2A и MCP поверх REST API без переписывания кода

Почему GBDT всё ещё лучше LLM для real-time фрод-детекции: полный бенчмарк с открытым кодом

Оптимизация обучения моделей на SageMaker с NVIDIA Blackwell: практические настройки batch size, precision и checkpointing

Как запустить 3 AI-агента с разными LLM на одном старом GPU (GTX 1080 8GB): решение проблемы нехватки памяти

Создаём REPL для LLM на чистом Bash: туториал с curl, jq и pipes

Запуск GLM 5.2 GGUF на consumer железе: 492GB модель на Threadripper и RTX 5090

Как валидировать NVIDIA H100 PCIe: сравнение с H100 NVL на сервере YADRO (бенчмарки и команды)

Loop Engineering: как автоматизировать промптинг AI-агентов с помощью пяти базовых блоков

Q4 против Q8 для Gemma 4 31B на 4090: тупой бенчмарк, который всё расставил по местам

Сравнение AI-агентов на сложной задаче: реальный бенчмарк Depixelizing Pixel Art

Запуск GLM-5.2 с MTP speculative decoding на 4× DGX Spark: сборка vLLM и Triton ядра