Гайды по AI и нейросетям

Manual #5371 9 min

Развертывание NVIDIA Nemotron 3 Super 120B на одной видеокарте: полное руководство и тесты на реальных задачах

Пошаговое руководство по запуску MoE-модели Nemotron 3 Super 120B на одной RTX PRO 6000. Тесты производительности, интеграция с Luxms BI и расчет стоимости влад

Открыть документ

Manual #5369 6 min

Лайфхак: как увеличить контекстное окно Gemma 4 до 60K+ токенов с помощью Q8 mmproj

Практическое руководство по замене F16 mmproj на Q8_0 для экономии памяти и увеличения контекстного окна Gemma 4 до 60K+ токенов. Актуально на апрель 2026 года.

Открыть документ

Manual #5368 8 min

Архитектурный паттерн против галлюцинаций LLM: разделение анализа и генерации вместо усиления промптов

Глубокое руководство по архитектурному паттерну, который снижает галлюцинации LLM на 70-80% без дорогих моделей. Пошаговый план внедрения на 2026 год.

Открыть документ

Manual #5366 10 min

Архитектура системы из 11 AI-агентов для автоматизации тестирования: подробный кейс

Подробный кейс: как построить мультиагентную систему из 11 AI-агентов для автоматизации тестирования с интеграцией Jira, Figma, GitLab. Метрики и шаги.

Открыть документ

Manual #5365 7 min

Как удалить цензуру из MoE-моделей: техника abliteration для Qwen3.5-397B на Mac Studio

Пошаговое руководство по удалению цензуры из MoE-модели Qwen3.5-397B с помощью техники abliteration на Mac Studio. Работа с весами, кастомизация и нюансы.

Открыть документ

Manual #5363 8 min

Gemma4-31B против Gemini 3.1 Pro: как добиться рекордной производительности через Harness

Пошаговое руководство по настройке Gemma4-31B с помощью фреймворка Harness для достижения уровня производительности Gemini 3.1 Pro. Методы квантования, оптимиза

Открыть документ

Manual #5359 8 min

Fine-tuning Gemma 2B для структурированного извлечения JSON: полный разбор кода и 432 примера

Полное руководство по тонкой настройке Gemma 2B для извлечения структурированных данных из регуляторных документов. Код, датасет и рост точности с 75% до 94%.

Открыть документ

Manual #5357 7 min

Голосовой умный дом на локальном AI: бесшовная интеграция Ollama и Whisper

Пошаговая инструкция по развертыванию локальной системы голосового управления умным домом с использованием Ollama и Whisper. Решаем проблемы с VRAM, ошибкой Unk

Открыть документ

Manual #5355 7 min

Как запустить GPT-OSS-120B на Mac с 64GB памяти: эксперименты с 3-битным квантованием и Lloyd-Max

Детальный гайд по запуску 120B модели на Mac с 64GB ОЗУ. Используем 3-битное квантование Lloyd–Max, Hadamard rotations и оптимизацию доступа MoE.

Открыть документ

Manual #5354 11 min

Proxy-Pointer RAG: пошаговое руководство по гибридному методу для масштабируемого и точного поиска

Полное руководство по Proxy-Pointer RAG на 2026 год. Узнайте, как совместить векторный и лексический поиск для масштабируемых RAG-систем с минимальными затратам

Открыть документ

Manual #5353 7 min

От вайбкодинга к продакшену: как я создал шахматный сервис с ИИ (3300 промптов, 100k строк кода)

Практический кейс: как с помощью 3300 промптов и AI-кодинга я создал production-сервис для игры в шахматы с ИИ. Этапы, ошибки, метрики и инструменты 2026 года.

Открыть документ

Manual #5351 7 min

Fastest QWEN Coder 80B: Apex Quantization для 3x ускорения inference

Полное руководство по ускорению QWEN Coder 80B с помощью Apex Quantization. Увеличьте скорость inference в 3 раза с минимальной потерей точности. Актуально на 0

Открыть документ

Учебные материалы

Развертывание NVIDIA Nemotron 3 Super 120B на одной видеокарте: полное руководство и тесты на реальных задачах

Лайфхак: как увеличить контекстное окно Gemma 4 до 60K+ токенов с помощью Q8 mmproj

Архитектурный паттерн против галлюцинаций LLM: разделение анализа и генерации вместо усиления промптов

Архитектура системы из 11 AI-агентов для автоматизации тестирования: подробный кейс

Как удалить цензуру из MoE-моделей: техника abliteration для Qwen3.5-397B на Mac Studio

Gemma4-31B против Gemini 3.1 Pro: как добиться рекордной производительности через Harness

Fine-tuning Gemma 2B для структурированного извлечения JSON: полный разбор кода и 432 примера

Голосовой умный дом на локальном AI: бесшовная интеграция Ollama и Whisper

Как запустить GPT-OSS-120B на Mac с 64GB памяти: эксперименты с 3-битным квантованием и Lloyd-Max

Proxy-Pointer RAG: пошаговое руководство по гибридному методу для масштабируемого и точного поиска

От вайбкодинга к продакшену: как я создал шахматный сервис с ИИ (3300 промптов, 100k строк кода)

Fastest QWEN Coder 80B: Apex Quantization для 3x ускорения inference