Гайды по AI и нейросетям

Manual #6398 4 min

Почему контекст падает до 14K при включении MTP на Qwen 27B с одной 3090: разбор проблемы и возможные решения

Почему включение MTP в llama.cpp режет контекст Qwen3.6-27B до 14K на одной RTX 3090? Диагностика, расчет памяти и способы исправить.

Открыть документ

Manual #6395 9 min

Бюджетный инференс Qwen 3.6-27B: сборка на двух RTX 3060 за $400

Как запустить Qwen 3.6-27B с производительностью 30-50 t/s на двух б/у RTX 3060. Конфигурация за $400, настройка vLLM, подводные камни и альтернативы.

Открыть документ

Manual #6391 9 min

Память на миллион токенов — не панацея: как мы оптимизировали контекст ИИ-агента в реальном кейсе

Почему 1M токенов не спасает память агента. Разбор четырехуровневой системы управления контекстом на примере AI-консультанта по 1С. Код, нюансы, ошибки.

Открыть документ

Manual #6388 1 min

Повторение нейронных клеточных автоматов: 22 эксперимента, потолок IoU 0.44 и уроки работы с AI-агентом

Детальный технический отчет: 22 эксперимента по обучению Growing Neural CA с LittleLM на PyTorch. Потолок IoU 0.44, архитектура, код, ошибки и уроки работы с AI

Открыть документ

Manual #6387 5 min

Qwen3.6 27B in Action: Building a HTML5 Game Console – Developer Experience Review

Практический обзор Qwen3.6 27B: как я создал полноценную HTML5 игровую консоль с меню, играми и сохранениями. Детали промпт-инжиниринга, ошибки и результаты.

Открыть документ

Manual #6385 9 min

Prompt injection при подключении локальных LLM к инструментам: как не дать нейросети убить ваш сервер

Как атакующие внедряют вредоносные промпты в ваш локальный AI и заставляют его удалять файлы? Разбираем механизм, показываем уязвимости и даём пошаговый план за

Открыть документ

Manual #6381 6 min

Выключаем Siri: как я заставил NPU Intel Arrow Lake распознавать речь быстрее, чем вы чихнете

Пошаговый гайд по использованию NPU Intel Arrow Lake для локального распознавания речи (ASR) в умном доме. OpenVINO, Whisper, Home Assistant - реальный опыт, бе

Открыть документ

Manual #6380 9 min

Почему смена модели не чинит AI-агента: диагностика проблем оркестрации и обвязки

82% проблем AI-агентов вызваны оркестрацией и обвязкой. Чек-лист диагностики + реальный кейс: improvement completion rate на 62% без смены модели. Инструменты и

Открыть документ

Manual #6379 7 min

Как построить AI-техподдержку на n8n: ветки обработки инцидентов, задач и консультаций (Часть 2)

Подробный гайд по построению AI-техподдержки в n8n: три ветки обработки (инциденты, задачи, консультации). Пошаговые workflow, системные промпты и реальные прим

Открыть документ

Manual #6375 8 min

Как построить трекинг посетителей на fisheye-камерах: от детекции до бизнес-событий

Пошаговый гайд по видеоаналитике для магазинов самообслуживания: калибровка fisheye, детекция YOLO, трекинг SORT, бизнес-события. Код, грабли, инсайты.

Открыть документ

Manual #6373 9 min

Как выбрать RAM для сервера локального инференса: 128 ГБ 3200 МГц vs 256 ГБ 2133 МГц для dual RTX 3090 и MoE моделей

Гайд по выбору оперативной памяти для сервера инференса: баланс частоты и объёма для MoE моделей, EPYC 7642 и двух RTX 3090. Практические тесты и рекомендации.

Открыть документ

Manual #6372 12 min

AI-агент, который не спит: почта, Telegram, systemd и LLM под одной крышей

Собираем полностью автономного AI-агента на локальном сервере: LLM, почта, Telegram, systemd и долговременная память. Подробное руководство с кодом и без облачн

Открыть документ

Учебные материалы

Почему контекст падает до 14K при включении MTP на Qwen 27B с одной 3090: разбор проблемы и возможные решения

Бюджетный инференс Qwen 3.6-27B: сборка на двух RTX 3060 за $400

Память на миллион токенов — не панацея: как мы оптимизировали контекст ИИ-агента в реальном кейсе

Повторение нейронных клеточных автоматов: 22 эксперимента, потолок IoU 0.44 и уроки работы с AI-агентом

Qwen3.6 27B in Action: Building a HTML5 Game Console – Developer Experience Review

Prompt injection при подключении локальных LLM к инструментам: как не дать нейросети убить ваш сервер

Выключаем Siri: как я заставил NPU Intel Arrow Lake распознавать речь быстрее, чем вы чихнете

Почему смена модели не чинит AI-агента: диагностика проблем оркестрации и обвязки

Как построить AI-техподдержку на n8n: ветки обработки инцидентов, задач и консультаций (Часть 2)

Как построить трекинг посетителей на fisheye-камерах: от детекции до бизнес-событий

Как выбрать RAM для сервера локального инференса: 128 ГБ 3200 МГц vs 256 ГБ 2133 МГц для dual RTX 3090 и MoE моделей

AI-агент, который не спит: почта, Telegram, systemd и LLM под одной крышей