Гайды по AI и нейросетям

Manual #1756 7 min

Llama, Ministral или GPT-OSS20B: какая локальная модель лучше генерирует синтетические данные в 2026?

Тесты и бенчмарки синтетической генерации данных на локальных LLM в 2026 году. Какая модель лучше для BERT и приватных датасетов без облаков.

Открыть документ

Manual #1755 9 min

64 ГБ RAM, чистая CPU и MoE-модели: кто выживает в спартанских условиях

Практический гайд: какие MoE-модели реально работают на 64 ГБ RAM без видеокарты. Тесты GLM-4.7-Flash, Nemotron-3-Nano-30B-A3B, Qwen3-Coder-30B-A3B для кодинга,

Открыть документ

Manual #1754 8 min

RTX 3090 для LLM: сборка кластера, замена термопасты, тесты SLI и драйверы Nvidia

Практическое руководство по сборке бюджетного кластера для LLM на RTX 3090. Замена термопасты, тесты SLI, выбор драйверов Nvidia и оптимизация PCIe.

Открыть документ

Manual #1753 8 min

Консалтинг без утечек: собираем локальную фабрику анализа документов за £30K

Полный гайд по сборке рабочей станции на 3× RTX Pro 6000 для анализа конфиденциальных документов. RAG архитектура, долгоконтекстные модели, бизнес-автоматизация

Открыть документ

Manual #1752 8 min

Claude Code против Llama-4 Scout: когда 1М токенов — это иллюзия, а LiteLLM — единственный путь

Экспертный разбор реальной работы сверхдлинного контекста. Настройка vLLM + LiteLLM прокси, коллапс эффективного контекста и практические тесты качества рассужд

Открыть документ

Manual #1751 9 min

Когда память кончается: как заставить локальный AI помнить больше 8К токенов

Техническое решение проблемы ограниченного контекста через агентские подпрограммы, суммаризацию и скользящее окно контекста для локальных LLM.

Открыть документ

Manual #1747 8 min

Модифицированные GPU под локальные LLM: когда апгрейд памяти становится экстремальным спортом

Полное руководство по модифицированным GPU с увеличенной VRAM для локальных LLM. Безопасность, производительность, где искать 4090 48GB и 5090 96GB на Alibaba.

Открыть документ

Manual #1745 11 min

Как построить систему оценки AI-агентов: от точности ответов до анализа пути исполнения

Полное руководство по созданию системы оценки AI-агентов: от метрик точности до анализа execution path. Практические шаги, фреймворк тестирования, гиперпараметр

Открыть документ

Manual #1743 7 min

Цепочки инструментов в продакшене: когда агенты съедают все токены и становятся непредсказуемыми

Почему многошаговые агенты становятся непредсказуемыми в продакшене. Как снизить расход токенов и сделать выполнение детерминированным. Практические паттерны.

Открыть документ

Manual #1741 5 min

Anthropic Messages API в llama.cpp: Запускаем локальный Claude без головной боли

Пошаговая инструкция по настройке локального Claude через Anthropic Messages API в llama.cpp. Конфигурация сервера, примеры запросов и решение проблем.

Открыть документ

Manual #1740 8 min

Как Джефф Эмануэль управляет 20+ ИИ-агентами для 2696 коммитов в неделю: архитектура, MCP Agent Mail и Beads

Как Джефф Эмануэль управляет командой из 20+ ИИ-агентов, которые делают 2696 коммитов в неделю. MCP Agent Mail, Beads, Claude Code и $4600 на подписки.

Открыть документ

Manual #1739 7 min

Perplexity AI: Собираем персональный мозг из Google Drive, GitHub и Notion

Полное руководство по созданию персональной AI-базы знаний в Perplexity с интеграцией Google Drive, GitHub и Notion. Архитектура, краулеры, векторный поиск.

Открыть документ

Учебные материалы

Llama, Ministral или GPT-OSS20B: какая локальная модель лучше генерирует синтетические данные в 2026?

64 ГБ RAM, чистая CPU и MoE-модели: кто выживает в спартанских условиях

RTX 3090 для LLM: сборка кластера, замена термопасты, тесты SLI и драйверы Nvidia

Консалтинг без утечек: собираем локальную фабрику анализа документов за £30K

Claude Code против Llama-4 Scout: когда 1М токенов — это иллюзия, а LiteLLM — единственный путь

Когда память кончается: как заставить локальный AI помнить больше 8К токенов

Модифицированные GPU под локальные LLM: когда апгрейд памяти становится экстремальным спортом

Как построить систему оценки AI-агентов: от точности ответов до анализа пути исполнения

Цепочки инструментов в продакшене: когда агенты съедают все токены и становятся непредсказуемыми

Anthropic Messages API в llama.cpp: Запускаем локальный Claude без головной боли

Как Джефф Эмануэль управляет 20+ ИИ-агентами для 2696 коммитов в неделю: архитектура, MCP Agent Mail и Beads

Perplexity AI: Собираем персональный мозг из Google Drive, GitHub и Notion