Учебные материалы
Как собрать RAG-агента для объяснения настолок без тяжёлых библиотек
Практический гайд по созданию лёгкого RAG-агента для объяснения правил настольных игр без сложных фреймворков. Работающий pet-проект на Python.
Int4 QAT против PTQ: почему Kimi выбрала квантование для K2 и как это повлияло на latency
Глубокий технический разбор: почему Kimi выбрала квантование для модели K2, как QAT влияет на latency MoE-архитектур и что это значит для инференса.
Как запустить 355-миллиардную модель на железе 2015 года: полное руководство по оптимизации
Подробный гайд по запуску огромных LLM (GLM-4, MoE) на CPU через llama.cpp. Квантование, оптимизация памяти, настройка для старых систем.
Как настроить Reko для автоматической обработки YouTube-плейлистов
Полное руководство по настройке Reko для автоматической обработки YouTube-плейлистов. Скачивание, транскрибация, локальные модели и скриптинг.
Как подключить MCP-сервер ВкусВилла к Claude или GPT: пошаговая инструкция
Подробная инструкция по подключению MCP-сервера ВкусВилла к Claude и GPT. Настройка API, интеграция через MCP Inspector и Manus, решение проблем.
Как «мыслят» Llama-3 и Qwen-2.5: сравниваем геометрию внутренних представлений
Глубокий анализ различий в «стиле мышления» Llama-3 и Qwen-2.5 через визуализацию внутренних представлений. Практическое сравнение для инженеров.
Локальные LLM на практике: Строим мультимодальный краулер событий с нуля
Пошаговое руководство по созданию автономного мультимодального краулера событий на локальных LLM с GLM-4.6V. Полный код, архитектура и нюансы развертывания.
Как построить семантический пайплайн для LLM: от ETL к итеративной обработке данных
Пошаговое руководство по построению семантического пайплайна для LLM: извлечение, преобразование, загрузка данных и итеративная обработка для контроля качества.
Почему большие языковые модели не понимают, чего вы на самом деле хотите
Глубокий анализ фундаментальной проблемы LLM — отсутствие понимания глобального намерения. Примеры, исследования и практические выводы для промпт-инжиниринга.
Интерактивный калькулятор и симуляции в Google Search: как это работает
Полное руководство по интерактивным калькуляторам в Google Search. Как Gemini 3 создает UI на лету, примеры промптов, технические детали и будущее генеративного
Детектор AI-фото от Wildberries: Как отличить Midjourney от реальности и не облажаться
Полное руководство по детекции AI-изображений на Wildberries. Узнайте, как работает детектор, как проверить фото самостоятельно и избежать проблем с нейросетевы
Перестань задавать вопросы ИИ: как писать промпты как техзадание (рецепт для авторов и менеджеров)
Перестаньте задавать вопросы ИИ. Узнайте, как составлять промпты как полноценные технические задания: универсальный рецепт для авторов и менеджеров.