Гайды по AI и нейросетям

Manual #6489 8 min

Сравнение характеристик GPU для локального LLM: почему пропускная способность — не всё (реалити-чек)

Разбираем мифы о выборе GPU для локальных LLM. Почему пропускная способность памяти — не единственный критерий, и как не попасться на маркетинговые уловки. Реал

Открыть документ

Manual #6485 9 min

М1 Max 64GB: какой движок инференции реально быстрее в 2026? Бенчмарк MLX, llama.cpp и RunAnywhere.ai

Сравнение производительности MLX, llama.cpp, RunAnywhere.ai и vLLM-MLX на M1 Max 64GB. Результаты тестов с MLX-Chronos, анализ скорости, контекста и квантования

Открыть документ

Manual #6484 6 min

Почему стоит хостить не только инференс, но и тулинг вокруг локальных LLM: гайд по полной инфраструктуре

Гайд по построению полноценной инфраструктуры для локальных LLM: мониторинг, оркестрация, управление версиями, CI/CD. Почему одного инференса мало и как не прог

Открыть документ

Manual #6483 6 min

Запуск Qwen 3.6 35B MoE на Mac M1 Max: локальный AI-помощник для кода с Zoo Code

Пошаговый гайд по установке Qwen 3.6 35B MoE на Mac M1 Max через Zoo Code. Настройка локального AI-ассистента для кода без облачных затрат.

Открыть документ

Manual #6482 9 min

Бюджетный ИИ-сервер своими руками: сборка на 2× Tesla V100 32GB за 200 000 ₽ (бенчмарки 108 моделей)

Пошаговое руководство по сборке дешевого локального сервера на двух Tesla V100 32GB. Цены, комплектуха, грабли, сравнение с облаком и реальные тесты 108 LLM.

Открыть документ

Manual #6481 10 min

ИИ-агент внутри T-FLEX CAD: как заставить нейросеть не врать, а чертить

Пошаговый гайд по встраиванию LLM в T-FLEX CAD через C#-генерацию, контур управления и самопроверку. Решаем проблему галлюцинаций и падений. Код и архитектура.

Открыть документ

Manual #6476 7 min

Бесплатные API нейросетей для прототипов: обзор Groq и других сервисов с таблицами лимитов

Полный разбор бесплатных API для прототипов: Groq (LLaMA 3.1, Mixtral), OpenRouter, SambaNova, NVIDIA NIM. Таблицы лимитов, подводные камни, код fallback-страте

Открыть документ

Manual #6473 5 min

Секретные фичи Claude Code: YOLO Classifier, hooks и постоянная память из исходников

Разбор скрытых возможностей Claude Code: YOLO Classifier для автономной работы, система hooks и постоянная память из исходников. Примеры конфигураций.

Открыть документ

Manual #6472 7 min

Архитектура AI RPG: авторитарный бэкенд, structured output и борьба с амнезией LLM

Подробное руководство по созданию AI RPG с детерминированными механиками: FastAPI, pgvector, JSON-контракты, structured output. Решение проблемы дрейфа и амнези

Открыть документ

Manual #6470 9 min

SEO в эпоху AI-поиска: как измерить долю ответов и адаптироваться к AI Overviews в 2026 году

Разбираем, как измерить Share of Voice в AI-поиске, адаптироваться к AI Overviews Google и Яндекс Нейро, и почему GEO заменяет SEO в 2026 году.

Открыть документ

Manual #6469 6 min

LLM-Independent Adaptive RAG: как запускать retrieval без участия языковой модели

Разбираем новый подход от Skoltech/AIRI: Adaptive RAG, который не требует LLM для принятия решений о поиске. Снижаем затраты и галлюцинации.

Открыть документ

Manual #6468 8 min

Профилирование PyTorch: полное руководство по torch.profiler для начинающих

Полное руководство по torch.profiler в PyTorch 2.7: от установки до продвинутого профилирования LLM и Triton kernels. Разбор ошибок, практические примеры, внутр

Открыть документ

Учебные материалы

Сравнение характеристик GPU для локального LLM: почему пропускная способность — не всё (реалити-чек)

М1 Max 64GB: какой движок инференции реально быстрее в 2026? Бенчмарк MLX, llama.cpp и RunAnywhere.ai

Почему стоит хостить не только инференс, но и тулинг вокруг локальных LLM: гайд по полной инфраструктуре

Запуск Qwen 3.6 35B MoE на Mac M1 Max: локальный AI-помощник для кода с Zoo Code

Бюджетный ИИ-сервер своими руками: сборка на 2× Tesla V100 32GB за 200 000 ₽ (бенчмарки 108 моделей)

ИИ-агент внутри T-FLEX CAD: как заставить нейросеть не врать, а чертить

Бесплатные API нейросетей для прототипов: обзор Groq и других сервисов с таблицами лимитов

Секретные фичи Claude Code: YOLO Classifier, hooks и постоянная память из исходников

Архитектура AI RPG: авторитарный бэкенд, structured output и борьба с амнезией LLM

SEO в эпоху AI-поиска: как измерить долю ответов и адаптироваться к AI Overviews в 2026 году

LLM-Independent Adaptive RAG: как запускать retrieval без участия языковой модели

Профилирование PyTorch: полное руководство по torch.profiler для начинающих