Учебные материалы
Запуск GLM 5.2 GGUF на consumer железе: 492GB модель на Threadripper и RTX 5090
Как запустить гигантскую модель GLM 5.2 (492B параметров) на домашнем ПК с Threadripper и RTX 5090. GGUF, Unsloth квантование, offloading, cmake и реальные бенч
Как валидировать NVIDIA H100 PCIe: сравнение с H100 NVL на сервере YADRO (бенчмарки и команды)
Полный гайд по валидации NVIDIA H100 PCIe: vLLM, NCCL, пропускная способность памяти. Сравнение с H100 NVL на сервере YADRO G4208P G3. Команды и типичные ошибки
Loop Engineering: как автоматизировать промптинг AI-агентов с помощью пяти базовых блоков
Разбираем методологию loop engineering от Anthropic и Addy Osmani. Пять примитивов для построения самоподдерживающихся AI-пайплайнов. Сравнение Claude Code и Co
Q4 против Q8 для Gemma 4 31B на 4090: тупой бенчмарк, который всё расставил по местам
Сравнение Q4-dynamic и Q8_0 для Gemma 4 31B на RTX 4090: VRAM, tok/s, точность tool-calling. Результаты тестов и практический выбор квантизации.
Сравнение AI-агентов на сложной задаче: реальный бенчмарк Depixelizing Pixel Art
Тестируем Claude Codex, Cursor, DeepAgents CLI и других AI-агентов на задаче восстановления пиксельной графики. Честный бенчмарк с кодом, промптами и результата
Запуск GLM-5.2 с MTP speculative decoding на 4× DGX Spark: сборка vLLM и Triton ядра
Пошаговый гайд по сборке vLLM с поддержкой MTP speculative decoding для GLM-5.2 на кластере из 4 DGX Spark. Настройка AWQ весов, Triton ядер и распределённого и
grep, граф или LSP: что дешевле и точнее для контекста кодового агента? Результаты 936 прогонов на Apache Superset
Результаты 936 прогонов на Apache Superset: grep, граф или LSP — какой метод сбора контекста дешевле и точнее для кодового агента? Неожиданные выводы.
Сравнение LLM для продающих ботов на русском: тест 10 моделей и лучшие по цене/качеству (DeepSeek V4 Flash)
Сравнение 10 моделей LLM для продающих ботов на русском языке. Цена/качество, реальные цифры, скандал с MiniMax M2.7. DeepSeek V4 Flash — лучший выбор по соотно
Как изолировать ИИ-агент в Docker Sandbox: пошаговое руководство по безопасности
Пошаговое руководство по безопасной изоляции AI-агента в Docker-песочнице: защита OAuth-токенов, файловой системы, настройка seccomp, user namespaces и gVisor.
Anchor Detection для RAG: параллельный поиск + один LLM вызов – архитектура и код
Гайд по production-ready RAG с anchor detection: как собрать параллельные ретриверы, агрегировать результаты и выполнить один LLM-реранкинг без потери качества
Как отучить LLM придумывать цифры: метод борьбы с галлюцинациями в анализе данных с помощью Claude Desktop и MCP-сервера
Пошаговый гайд по устранению выдуманных цифр при анализе таблиц: настройка Claude Desktop и MCP-сервера для точных данных.
Spring Data JDBC Skill для AI-агентов: как получить качество Opus за копейки
Гайд: как с помощью Spring Data JDBC и дешевых LLM добиться точности Opus при работе с базами данных. Экономьте токены, не жертвуя надежностью.