Гайды по AI и нейросетям

Manual #4800 9 min

Structured Prompting и Graph RAG: как заставить Llama 8B работать как 70B без тонкой настройки

Практический гайд: как с помощью Structured Prompting и Graph RAG заставить маленькую Llama 3.1 8B выдавать результаты как 70B модель. Конкретные inference-трюк

Открыть документ

Manual #4799 9 min

Как запустить VLA-модель для роботов на embedded-платформе: гайд по асинхронному инференсу от NXP

Подробное руководство по развертыванию Vision-Language-Action моделей на embedded-платформах NXP с асинхронным инференсом для реального управления роботами.

Открыть документ

Manual #4798 8 min

Архитектура Claude Code: как управлять контекстом, Subagents и писать эффективный CLAUDE.md

Глубокий разбор архитектуры Claude Code от Senior DevOps. Узнайте, как управлять контекстом, использовать Subagents и писать эффективный CLAUDE.md для AI-разраб

Открыть документ

Manual #4797 8 min

AI-агент сдал курс на Stepik на 100%: техническая реализация и уроки автономного обучения

Технический разбор эксперимента: как агент на Python, Playwright и Claude Opus 4 автономно прошел курс на Stepik. Архитектура, код и главные ошибки.

Открыть документ

Manual #4796 8 min

LangChain: практическое руководство по мониторингу AI-агентов в production

Полное руководство по мониторингу AI-агентов LangChain в production. Настройка LangSmith, трассировка, метрики, обработка ошибок. Актуально на март 2026.

Открыть документ

Manual #4795 6 min

Реальный кейс: как AI-агент Meta устроил утечку данных и что делать, чтобы избежать этого

Подробный разбор инцидента Sev 1 в Meta с AI-агентом OpenClaw. Практическое руководство по безопасности AI-агентов на 2026 год.

Открыть документ

Manual #4791 8 min

Как заставить 8B модель работать как 70B: структурированный Chain-of-Thought и сжатие контекста для Graph RAG

Структурированный Chain-of-Thought и сжатие контекста графами позволяют малым LLM выполнять complex reasoning. Практический гайд для multi-hop QA с Llama 3.1 и

Открыть документ

Manual #4785 8 min

Конец эпохи TGI: на что перейти — vLLM или llama.cpp? Сравнение и гайд по миграции

TGI от Hugging Face перешел в режим поддержки. Разбираем, что лучше в 2026: vLLM или llama.cpp? Подробное сравнение и пошаговая миграция для DevOps-инженеров.

Открыть документ

Manual #4784 8 min

Как бенчмаркать локальные LLM: сравнение моделей в кодинге, знаниях и рассуждениях

Полное руководство по объективному сравнению локальных языковых моделей. Узнай, как использовать OpenCompass, LM Evaluation Harness и другие инструменты для оце

Открыть документ

Manual #4783 7 min

Как обучить свой GPT-трансформер с нуля на бюджетном CPU за 39 минут: полный гайд

Пошаговое руководство по обучению GPT-трансформера с нуля на обычном процессоре без GPU. Код, данные, оптимизации для PyTorch 2.4.

Открыть документ

Manual #4779 7 min

Оптимизация serving massive MoE моделей: benchmark Qwen3.5-397B на 8x H20 с SGLang

Практическое руководство по оптимизации serving massive MoE моделей. Benchmark Qwen3.5-397B на 8x H20 с SGLang для экономии compute budget.

Открыть документ

Manual #4776 8 min

Как исправить ошибку 'Failed to parse at pos' в llama.cpp: полное руководство по откату и патчу

Полное руководство по исправлению ошибки парсера в llama.cpp, включая откат коммита 34df42f7b, использование флага --skip-chat-parsing и ручной патч chat.cpp.

Открыть документ

Учебные материалы

Structured Prompting и Graph RAG: как заставить Llama 8B работать как 70B без тонкой настройки

Как запустить VLA-модель для роботов на embedded-платформе: гайд по асинхронному инференсу от NXP

Архитектура Claude Code: как управлять контекстом, Subagents и писать эффективный CLAUDE.md

AI-агент сдал курс на Stepik на 100%: техническая реализация и уроки автономного обучения

LangChain: практическое руководство по мониторингу AI-агентов в production

Реальный кейс: как AI-агент Meta устроил утечку данных и что делать, чтобы избежать этого

Как заставить 8B модель работать как 70B: структурированный Chain-of-Thought и сжатие контекста для Graph RAG

Конец эпохи TGI: на что перейти — vLLM или llama.cpp? Сравнение и гайд по миграции

Как бенчмаркать локальные LLM: сравнение моделей в кодинге, знаниях и рассуждениях

Как обучить свой GPT-трансформер с нуля на бюджетном CPU за 39 минут: полный гайд

Оптимизация serving massive MoE моделей: benchmark Qwen3.5-397B на 8x H20 с SGLang

Как исправить ошибку 'Failed to parse at pos' в llama.cpp: полное руководство по откату и патчу