Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4085 8 min

Развертывание Vision-Language модели NVIDIA Cosmos на Jetson: полный туториал с vLLM

Пошаговый туториал по развертыванию VLM NVIDIA Cosmos на Jetson AGX Thor/Orin с vLLM. JetPack 6.0+, оптимизация памяти, работа с камерой и примеры кода.

Открыть документ
Manual #4078 8 min

Как заменить двухмодельную агентную настройку на Qwen3.5 35B-A3B на Mac M1: гайд по производительности и квантованию

Пошаговый гайд по замене двухмодельной агентной настройки на Qwen3.5 35B-A3B на Mac M1. Квантование Q4_K_XL, настройка llama.cpp server, тесты производительност

Открыть документ
Manual #4077 8 min

Чиним лаги ChatGPT на длинных диалогах: перехватываем API и обрезаем историю

Пошаговый гайд по оптимизации фронтенда ChatGPT: перехватываем fetch API, обрезаем историю сообщений и убираем лаги на диалогах 500+ сообщений. Код и объяснения

Открыть документ
Manual #4076 9 min

Заголовок: ломаем догму 'длиннее reasoning - лучше'. Как DTR ускоряет локальные LLM в 2 раза без потери качества

Полное руководство по DTR и Think@n стратегии для ускорения локальных LLM. Экономия 50% вычислений без потери точности. Актуально на 2026 год.

Открыть документ
Manual #4075 8 min

Multi-Directional Refusal Suppression: как подавить отказы в LLM с помощью самоорганизующихся карт

Глубокий разбор метода Multi-Directional Refusal Suppression для подавления отказов в языковых моделях с помощью самоорганизующихся карт (SOM). Технический гайд

Открыть документ
Manual #4074 6 min

Как уйти от шаблонного AI-дизайна: 5 приёмов для уникального вида сайтов

Разрабатываем сайты, которые не похожи на пластиковый AI-лендинг. Конкретный пайплайн из пяти шагов для дизайнеров и разработчиков.

Открыть документ
Manual #4073 9 min

Claude Skills: инструкция по созданию переиспользуемых промптов и победа над рутиной

Полное руководство по Claude Skills от Anthropic. Узнайте, как создавать skill.md файлы для автоматизации рутинных задач с Claude 4.5. Примеры, ошибки, FAQ.

Открыть документ
Manual #4072 9 min

Как построить гибридного чат-бота с ИИ за 5000 руб. в месяц: обзор подходов и выбор стека

Практический гайд по архитектуре гибридного чат-бота. Детальный разбор затрат: SaaS, open-source, кастомные решения. Учет 152-ФЗ и выбор стека.

Открыть документ
Manual #4070 7 min

Оптимизация ML inference на Databricks: partitioned tables vs liquid clustering vs salting на боевом кейсе

Реальный кейс ускорения инференса с 24 до 6 часов: сравниваем partitioned tables, liquid clustering и salting на Databricks с метриками производительности.

Открыть документ
Manual #4069 8 min

Тест производительности Qwen3.5-35B в multi-agent задачах: почему он справился, а другие sub-100B модели — нет

Детальный разбор эксперимента: почему только Qwen3.5-35B справился с multi-agent workflow, а другие модели sub-100B провалились. Анализ reasoning effort, пошаго

Открыть документ
Manual #4066 7 min

Как включить обработку изображений в Qwen 3.5 через OpenCode и Llama.cpp: готовое решение

Полное руководство по активации многомодальности в Qwen 3.5. Готовая JSON-конфигурация для OpenCode и Llama.cpp, шаги установки и решение типичных ошибок.

Открыть документ
Manual #4064 5 min

RAG-бот для BIM на GigaChat: как архитектор без навыков кода автоматизировал работу с документами

История архитектора, который без программирования создал RAG-бота для работы с BIM-документами на GigaChat. Как он это сделал и какие результаты получил.

Открыть документ