Гайды по AI и нейросетям

Manual #3310 9 min

Step 3.5 Flash: тихая революция в агентских задачах на 90K контексте

Практическое сравнение Step 3.5 Flash, Gemini 3.0 Pro и Claude 4.6 на реальных агентских задачах с длинным контекстом. Результаты тестов, промпты и рекомендации

Открыть документ

Manual #3307 7 min

MCP: Полное руководство по Resources (ресурсам) — как дать LLM «глаза» для чтения данных

Подробный гайд по MCP Resources — объясняем разницу с Tools, показываем код на FastMCP, учим давать LLM «глаза» для чтения файлов, баз данных и API.

Открыть документ

Manual #3304 7 min

Tiny-NPU: собираем свой нейропроцессор для LLM на SystemVerilog с нуля

Собираем аппаратный ускоритель LLM с нуля на SystemVerilog: архитектура systolic array, симуляция, запуск GPT-2 и LLaMA на собственном NPU

Открыть документ

Manual #3297 6 min

Dora CLI: как настроить AI-агента для навигации по кодовой базе с помощью SCIP-индексации

Полный гайд по настройке Dora CLI и SCIP-индексации для AI-агентов. Решаем проблему потери контекста у Claude Code и других ассистентов. Пошаговые инструкции на

Открыть документ

Manual #3294 8 min

Gemini 3 Deep Think: как пробиться в закрытый клуб научного ИИ и что с ним делать

Полный гайд по получению доступа к Gemini 3 Deep Think API для исследований. Примеры реального применения в науке, инженерии и анализе данных.

Открыть документ

Manual #3288 10 min

Как построить самообучающегося ИИ-агента: от MVP до прибыльной системы (код, схемы, метрики)

Практическое руководство по созданию самообучающегося ИИ-агента с кодом, архитектурой и бизнес-метриками. Реальный кейс снижения затрат на 40%.

Открыть документ

Manual #3286 8 min

6 месяцев провальных экспериментов с RL Fine-tuning: пошаговый разбор ошибок и советы для начинающих

Практический опыт 6 месяцев неудачных экспериментов с RL Fine-tuning. Конкретные ошибки SFT/RLFT, пошаговый разбор и советы для начинающих на 2026 год.

Открыть документ

Manual #3281 6 min

REAP против q2: когда память важнее точности? Реальные тесты на 120B моделях

Практическое сравнение REAP и низкого квантования (q2, q4) для моделей >30GB. Тесты потребления RAM, скорости генерации и качества ответов на реальном железе.

Открыть документ

Manual #3278 6 min

Как настроить DDoS-защиту и WAF, чтобы не блокировать легитимных ботов и нейрокраулеров

Практическое руководство по настройке DDoS-защиты и WAF в 2026 году без блокировки поисковых роботов и AI-краулеров. Шаги, правила, ошибки.

Открыть документ

Manual #3276 9 min

Cache-aware prefill–decode disaggregation: как ускорить обработку длинного контекста в LLM на 40%

Новая методика оптимизации инференса LLM с длинным контекстом: 40% QPS, снижение TTFT, принцип разделения нагрузки

Открыть документ

Manual #3273 7 min

Промпт-инъекции — это только верхушка айсберга: почему ваша ИИ-система взломана, даже если вы думаете, что она защищена

Экспертный анализ: почему алаймент и промпт-гардрейлы не защищают от реальных угроз. Уязвимости шаблонизаторов, закладки в данных, системные промпты.

Открыть документ

Manual #3271 6 min

Как собрать бюджетную систему для локальных AI-агентов: 2x AMD R9700, 64GB VRAM и Clojure-разработка

Как собрать систему с 2x AMD R9700, 64GB VRAM для локальных AI-агентов и разработки на Clojure. Пошаговый гайд по железу и софту на 2026 год.

Открыть документ

Учебные материалы

Step 3.5 Flash: тихая революция в агентских задачах на 90K контексте

MCP: Полное руководство по Resources (ресурсам) — как дать LLM «глаза» для чтения данных

Tiny-NPU: собираем свой нейропроцессор для LLM на SystemVerilog с нуля

Dora CLI: как настроить AI-агента для навигации по кодовой базе с помощью SCIP-индексации

Gemini 3 Deep Think: как пробиться в закрытый клуб научного ИИ и что с ним делать

Как построить самообучающегося ИИ-агента: от MVP до прибыльной системы (код, схемы, метрики)

6 месяцев провальных экспериментов с RL Fine-tuning: пошаговый разбор ошибок и советы для начинающих

REAP против q2: когда память важнее точности? Реальные тесты на 120B моделях

Как настроить DDoS-защиту и WAF, чтобы не блокировать легитимных ботов и нейрокраулеров

Cache-aware prefill–decode disaggregation: как ускорить обработку длинного контекста в LLM на 40%

Промпт-инъекции — это только верхушка айсберга: почему ваша ИИ-система взломана, даже если вы думаете, что она защищена

Как собрать бюджетную систему для локальных AI-агентов: 2x AMD R9700, 64GB VRAM и Clojure-разработка