Учебные материалы
Архитектура сайта под управлением ИИ: MCP-сервер, LLM и версионирование контента — разбор по косточкам
Как построить сайт, которым управляет нейросеть? Разбираем MCP-сервер, интеграцию Claude/GPT, валидацию кода и версионирование. Практические примеры.
RAG-стек 2026: как заменить энкодеры и реранкеры на LLM — полный гайд по новому пайплайну
Пошаговый гайд по замене BERT-энкодеров и cross-encoders на fine-tuned LLM в RAG-пайплайне. SGLang, embedding via LLM, реранкинг без отдельной модели. На 20.06.
Как дать локальному AI-агенту веб-доступ без платных API: пошаговая настройка SearXNG + Scrapling
Настройка бесплатного веб-доступа для локального AI-агента: SearXNG + Scrapling. Пошаговое руководство по сборке метапоиска и парсинга без платных API. Экономия
Как собрать ИИ-персонажа на Python: OpenRouter, долгосрочная память и голос за выходные
Пошаговый гайд с кодом по созданию ИИ-персонажа с долгосрочной памятью и голосом. OpenRouter, векторная БД, edge-tts. Hack your weekend.
Python 3.14: JIT-компилятор и отключение GIL — как ускорить скрипты без изменения кода
Практический гайд по ускорению скриптов в Python 3.14: JIT-компилятор и отключение GIL. Бенчмарки, нюансы, подводные камни. Реальный прирост производительности
Как защитить данные от опасных AI-скиллов: разбор атаки на ~/.aws/credentials и другие секреты
Разбираем, как вредоносные навыки ИИ-агентов воруют облачные credentials из ~/.aws/credentials. Практические методы защиты: песочницы, политики, мониторинг.
GPU-Resident Top-K для Agentic RAG: как запустить similarity search на GPU и ускорить retrieval в 8.57x
Куда уходит 90% времени в RAG? В копирование через PCIe. Пишем CUDA kernel для GPU-resident top-K и ускоряем retrieval в 8.57x на старой GTX 1080. Полный гайд.
Устойчивый LLM-пайплайн: реализация fallback провайдера через FSM с llm-nano-vm
Как построить отказоустойчивый LLM-пайплайн с конечным автоматом и llm-nano-vm. Код, примеры, ошибки. Fallback OpenAI -> Anthropic -> Ollama локально.
Агентский NorthMiniCode в OpenCode на домашнем сервере: собираем llama.cpp с cohere2_moe и разгоняем два RTX 5060 Ti
Пошаговое руководство по развертыванию агентской модели NorthMiniCode для OpenCode на домашнем сервере. Сборка llama.cpp с поддержкой cohere2_moe, настройка дву
Как ревьюить AI-код: стратегии автоматизации и ручного контроля в 2026
Практическое руководство по код-ревью AI-сгенерированного кода в 2026: двухконтурная схема, инструменты, чеклист и типичные ошибки. Спасите проект от каскада не
MosaicLeaks: как сохранить приватность данных в Deep Research агентах
Узнайте о новой угрозе MosaicLeaks — утечке данных через внешние запросы AI-агентов. Метод PA-DR: пошаговый гайд по защите приватности без потери точности.
Как я строил AI-мастера для D&D и не умер от переполнения контекста
Реальный кейс разработки AI Dungeon Master: как мы решили проблему амнезии LLM и сломанного баланса в кампаниях. Архитектура structured output и гибридной памят