Учебные материалы
Реальные vs теоретические метрики LLM на on-premise: как мы считали ресурсы для GPT-OSS-120B на RTX Pro 6000 и почему калькуляторы врут в 5 раз
Почему онлайн-калькуляторы для расчета ресурсов LLM врут в 5 раз? Тестируем GPT-OSS-120B на RTX Pro 6000 Blackwell: реальные показатели VRAM, latency, throughpu
Динамическое извлечение данных из документов с помощью Amazon Bedrock: on-demand и batch пайплайны
Гайд по Amazon Bedrock для извлечения данных из документов: on-demand и batch пайплайны, динамический выбор модели, оптимизация промптов. Актуально на июнь 2026
Когда утилизация GPU обманчива: скрытые проблемы подсистемы хранения, замедляющие AI-инференс
Высокая утилизация GPU не гарантирует скорость инференса. Разбираем, как деградация RAID, неоптимальная архитектура хранилища и ошибки мониторинга крадут деньги
Тест моделей LLM: Qwen3-235B остаётся лучшей по цене/качеству спустя год — подробности батча
Провёл собственный батч-тест четырёх LLM: Qwen3-235B, DeepSeek V4 Flash, Gemma 4, MiniMax. Результаты: Qwen3-235B держит лидерство спустя год. Разбор методики,
Как обойти региональные блокировки Claude Code и Antigravity на Linux: настройка VPS, прокси и Node.js
Пошаговое руководство по настройке VPS с Privoxy для обхода региональных блокировок AI-инструментов Claude Code 2.0 и Antigravity на Linux. Нюансы DNS, WebSocke
Структурированный промпт-инжиниринг: как автоматизировать создание промптов через скиллы Claude (pepper-prompt-engineer)
Как перестать писать промпты вручную и начать их генерировать. Разбор скилла pepper-prompt-engineer: структура SKILL.md, пошаговая автоматизация, частые ошибки.
Собираем Telegram-бота с RAG на Cloudflare Workers без векторной БД: пошаговый туториал с кодом
Пошаговый гайд: создаем дешевого RAG-бота на Cloudflare Workers с Jaccard similarity вместо эмбеддингов. Экономим бюджет, храним базу знаний в маркдауне. Готовы
Профилирование PyTorch: от nn.Linear до fused MLP — практическое руководство с разбором трасс
Научитесь профилировать MLP в PyTorch, читать трассы профайлера и применять fusion с torch.compile и Triton. Реальный кейс с ускорением до 3x.
Как создать браузерную игру с помощью Claude Fable 5 одним промптом: симулятор админа AI-канала
Пошаговый гайд по созданию браузерной игры-симулятора администратора AI-канала с помощью Claude Fable 5 за один промпт. Без навыков кода — только идея и Fable.
Как сократить расход токенов в MCP: замеры и оптимизация схем инструментов Claude
Научитесь точно замерять и сокращать расход токенов на схемы MCP для Claude. Пошаговый план, цифры, примеры кода и типовые ошибки. Экономьте до 70% контекста.
DiffusionGemma: как Google превратил Gemma в генератор изображений (и как это повторить)
Гайд по DiffusionGemma 2.0: установка, API, примеры кода, тонкая настройка. Сравнение с Stable Diffusion, советы по оптимизации на 2026 год.
Глубокий парсинг PDF для RAG: как извлекать текст из многостраничных документов без потери качества
Руководство по двухуровневому парсингу PDF для RAG: текстовый слой + layout-анализ. Реальные кейсы ошибок, сравнение инструментов и пошаговый пайплайн на июнь 2