Гайды по AI и нейросетям

Manual #6965 8 min

Архитектура сайта под управлением ИИ: MCP-сервер, LLM и версионирование контента — разбор по косточкам

Как построить сайт, которым управляет нейросеть? Разбираем MCP-сервер, интеграцию Claude/GPT, валидацию кода и версионирование. Практические примеры.

Открыть документ

Manual #6964 8 min

RAG-стек 2026: как заменить энкодеры и реранкеры на LLM — полный гайд по новому пайплайну

Пошаговый гайд по замене BERT-энкодеров и cross-encoders на fine-tuned LLM в RAG-пайплайне. SGLang, embedding via LLM, реранкинг без отдельной модели. На 20.06.

Открыть документ

Manual #6962 6 min

Как дать локальному AI-агенту веб-доступ без платных API: пошаговая настройка SearXNG + Scrapling

Настройка бесплатного веб-доступа для локального AI-агента: SearXNG + Scrapling. Пошаговое руководство по сборке метапоиска и парсинга без платных API. Экономия

Открыть документ

Manual #6961 5 min

Как собрать ИИ-персонажа на Python: OpenRouter, долгосрочная память и голос за выходные

Пошаговый гайд с кодом по созданию ИИ-персонажа с долгосрочной памятью и голосом. OpenRouter, векторная БД, edge-tts. Hack your weekend.

Открыть документ

Manual #6958 8 min

Python 3.14: JIT-компилятор и отключение GIL — как ускорить скрипты без изменения кода

Практический гайд по ускорению скриптов в Python 3.14: JIT-компилятор и отключение GIL. Бенчмарки, нюансы, подводные камни. Реальный прирост производительности

Открыть документ

Manual #6956 7 min

Как защитить данные от опасных AI-скиллов: разбор атаки на ~/.aws/credentials и другие секреты

Разбираем, как вредоносные навыки ИИ-агентов воруют облачные credentials из ~/.aws/credentials. Практические методы защиты: песочницы, политики, мониторинг.

Открыть документ

Manual #6953 9 min

GPU-Resident Top-K для Agentic RAG: как запустить similarity search на GPU и ускорить retrieval в 8.57x

Куда уходит 90% времени в RAG? В копирование через PCIe. Пишем CUDA kernel для GPU-resident top-K и ускоряем retrieval в 8.57x на старой GTX 1080. Полный гайд.

Открыть документ

Manual #6950 8 min

Устойчивый LLM-пайплайн: реализация fallback провайдера через FSM с llm-nano-vm

Как построить отказоустойчивый LLM-пайплайн с конечным автоматом и llm-nano-vm. Код, примеры, ошибки. Fallback OpenAI -> Anthropic -> Ollama локально.

Открыть документ

Manual #6949 5 min

Агентский NorthMiniCode в OpenCode на домашнем сервере: собираем llama.cpp с cohere2_moe и разгоняем два RTX 5060 Ti

Пошаговое руководство по развертыванию агентской модели NorthMiniCode для OpenCode на домашнем сервере. Сборка llama.cpp с поддержкой cohere2_moe, настройка дву

Открыть документ

Manual #6942 7 min

Как ревьюить AI-код: стратегии автоматизации и ручного контроля в 2026

Практическое руководство по код-ревью AI-сгенерированного кода в 2026: двухконтурная схема, инструменты, чеклист и типичные ошибки. Спасите проект от каскада не

Открыть документ

Manual #6941 6 min

MosaicLeaks: как сохранить приватность данных в Deep Research агентах

Узнайте о новой угрозе MosaicLeaks — утечке данных через внешние запросы AI-агентов. Метод PA-DR: пошаговый гайд по защите приватности без потери точности.

Открыть документ

Manual #6940 6 min

Как я строил AI-мастера для D&D и не умер от переполнения контекста

Реальный кейс разработки AI Dungeon Master: как мы решили проблему амнезии LLM и сломанного баланса в кампаниях. Архитектура structured output и гибридной памят

Открыть документ

Учебные материалы

Архитектура сайта под управлением ИИ: MCP-сервер, LLM и версионирование контента — разбор по косточкам

RAG-стек 2026: как заменить энкодеры и реранкеры на LLM — полный гайд по новому пайплайну

Как дать локальному AI-агенту веб-доступ без платных API: пошаговая настройка SearXNG + Scrapling

Как собрать ИИ-персонажа на Python: OpenRouter, долгосрочная память и голос за выходные

Python 3.14: JIT-компилятор и отключение GIL — как ускорить скрипты без изменения кода

Как защитить данные от опасных AI-скиллов: разбор атаки на ~/.aws/credentials и другие секреты

GPU-Resident Top-K для Agentic RAG: как запустить similarity search на GPU и ускорить retrieval в 8.57x

Устойчивый LLM-пайплайн: реализация fallback провайдера через FSM с llm-nano-vm

Агентский NorthMiniCode в OpenCode на домашнем сервере: собираем llama.cpp с cohere2_moe и разгоняем два RTX 5060 Ti

Как ревьюить AI-код: стратегии автоматизации и ручного контроля в 2026

MosaicLeaks: как сохранить приватность данных в Deep Research агентах

Как я строил AI-мастера для D&D и не умер от переполнения контекста