Учебные материалы
Homelab-оптимизация: замена трёх LLM на одну MoE 122B — бенчмарки, квантования и выводы
Практический кейс оптимизации homelab: как заменить три отдельные LLM на одну MoE-модель Qwen3.5-122B, сравнение квантований IQ3, бенчмарки скорости и качества.
Лучшие GGUF модели для Mac M4 16 ГБ: итоги тестирования 331 модели и почему MoE побеждают
Полное тестирование 331 GGUF модели на Mac M4 16 ГБ. Обнаружили, почему Mixture of Experts (MoE) модели доминируют при ограниченной памяти. Список Pareto-оптима
Prompt-инжиниринг для геймдева: как точные фразы и обход base64 генерируют 400 игровых спрайтов
Практический гайд по prompt-инжинирингу для геймдева. Как конкретные фразы и обход бага с base64 в Gemini 3 Flash экономят часы на создании ассетов.
Разработка ИИ-агента с нуля: архитектура MicroClaw, защита от утечек данных и оптимизация токенов
Практический гайд по разработке ИИ-агента с архитектурой MicroClaw. Защита от утечек данных, оптимизация токенов, пошаговый план на 2026 год.
Почему веса text-davinci-003 - священный грааль для локального AI и как их запустить
Почему веса text-davinci-003 так ценны для локального AI и пошаговое руководство по их запуску на своем компьютере с помощью GGUF квантования и Ollama.
Квантование LLM с нуля: инструкция по запуску 80B модели на ноутбуке без потери качества
Пошаговое руководство по квантованию больших языковых моделей для запуска на consumer-железе. Объяснение принципов, инструменты и практические советы на 2026 го
Production-ready ИИ-агент: архитектура, инструменты и best practices для запуска в продакшен
Подробное руководство по созданию production-ready ИИ-агентов: архитектура ReAct, инструменты, безопасность, наблюдаемость и оценка для запуска в продакшен.
GGUF vs MLX на Mac: итоговое сравнение производительности с исправлениями и выбор runtime
Полное сравнение GGUF и MLX на Apple Silicon. Исправление ошибок bf16→fp16, тесты 5 runtime, выбор оптимального для локальных LLM. Актуально на март 2026 года.
Кейс: как команда без ML-опыта за 6 месяцев запустила голосового ассистента на Qwen 8B и BERT
Практический кейс по созданию голосового ассистента на Qwen 8B и BERT командой без ML-опыта. Архитектура RAG, задержки 1.5-2 сек, пошаговый план развертывания.
Как заставить LLM считать точно: практический гайд по генерации кода для вычислений
Узнайте, как заставить LLM считать точно через генерацию кода. Практические методы обхода ограничений трансформеров для вычислений в 2026 году.
От XML к инсайтам: полный data science workflow с ИИ на примере анализа Apple Health данных
Практический гайд по автоматизации анализа данных Apple Health с AI. Парсинг XML, EDA, генерация кода с Claude и Cursor. Полный pipeline за несколько часов.
Автоматизация Яндекс.Директ: как AI и скрипты на Python берут рутину на себя
Полный гайд по автоматизации Яндекс.Директ для IT-проектов: отключаем рутину, пишем скрипт на Python для управления ставками через API, сравниваем с Автостратег