Учебные материалы
Фреймворк миграции LLM от AWS: как системно переходить между моделями в production
Пошаговый фреймворк миграции LLM от AWS: оценка, конвертация промптов, A/B тесты и автоматизация. Как менять модели без потери качества.
Как реализовать per-user OAuth для MCP-серверов с Keycloak и Telegram-ботом: архитектура Auth Proxy
Гайд по внедрению per-user OAuth для мультитенантных AI-агентов. Используем Keycloak, Telegram-бот и Auth Proxy для безопасного доступа к MCP-серверам.
Как затащить Amazon Bedrock AgentCore в VPC и не обжечься: гайд по настройке Gateway для приватных ресурсов
Полный гайд по настройке Amazon Bedrock AgentCore Gateway для безопасного доступа к приватным ресурсам через VPC: два режима, три сценария, пошаговая инструкция
Мультимодальный RAG без мультимодальных эмбеддингов: метод Proxy-Pointer и открытый код
Архитектура Proxy-Pointer: текстовые эмбеддинги + иерархическое дерево блоков для поиска по изображениям. Полный open-source пайплайн. Пошаговый гайд.
Архитектура рефлексирующего ИИ-агента: как встроить медленное мышление в быстрые системы (с кодом на Python)
Пошаговый гайд с кодом на Python: как встроить рефлексию в ИИ-агента, чтобы снизить галлюцинации и каскадные ошибки. Архитектура, компоненты, примеры.
Как найти и восстановить скрытые сессии Claude Code на macOS: пошаговое руководство
Пошаговое руководство по поиску и восстановлению сессий Claude Code на macOS. Пути хранения, команды, автоматизация бэкапов и типичные ошибки. Актуально для вер
Кредитный скоринг: как не попасть в ловушку немонотонных и нестабильных переменных — Python-гайд с кровью и кодом
Пошаговый гайд с кодом: как детектить немонотонность и дрифт популяции в Credit Scoring. Population Stability Index, Python, real cases.
Qwen 27B на 3090 как локальный агент: успешные конфигурации и подводные камни (AutoRound vs llama.cpp)
Полный гайд по запуску Qwen 3.5 27B на одной RTX 3090. Сравнение AutoRound и llama.cpp, speculative decoding до 100+ tok/s, типичные ошибки и их решения.
Когда малая модель для кодинга валит всё: разбор 5 фатальных ошибок локальных агентов
Почему OpenCode 12B и другие малые LLM проваливают автономное программирование? Разбор failure points: markdown fences, потеря контекста, галлюцинации. Решения
Промпты для Nano Banana 2 (Gemini 3 Flash Image): формула CAD+Physics для фотореалистичных изображений
Научитесь создавать фотореалистичные изображения с Nano Banana 2. Подробный гайд по формуле CAD+Physics, subsurface scattering и токенам внимания. Примеры промп
Как я сократил счёт за Cursor в 10 раз: MCP-серверы на страже бюджета
Пошаговая настройка трёх MCP-серверов, которые радикально уменьшают расход токенов Cursor без потери производительности. Актуально на 2026.
Оптимизация KV-кэша для Qwen 3.6-35B-A3B: PPL, KL divergence и асимметричные K/V на M5 Max
Глубокое тестирование методов экономии KV-кэша для Qwen 3.6-35B-A3B на M5 Max: PPL, KL divergence и асимметричное квантование K/V. Результаты до 1M контекста.