Гайды по AI и нейросетям

Manual #6812 9 min

Локальный AI‑ассистент на роботе Reachy Mini: разворачиваем speech-to-speech без облака

Полное руководство по развертыванию голосового ассистента на роботе Reachy Mini без облачных сервисов. Silero VAD, Parakeet-TDT, Gemma 4, Qwen3-TTS — все на бор

Открыть документ

Manual #6811 7 min

End-to-End Encrypted ML Inference with Fully Homomorphic Encryption on Amazon SageMaker

Пошаговое руководство по развертыванию полностью гомоморфного шифрования (FHE) для ML-инференса на Amazon SageMaker. Реальная privacy-архитектура с кодом и нюан

Открыть документ

Manual #6808 7 min

Сравнение Qwen, Codex и Claude в реальной задаче: стоит ли переходить на китайские модели для экономии?

Тест Qwen 3.6 Plus, Codex и Claude Opus 4.7 на Go-профилировании: качество ответов, цена, подводные камни. Стоит ли экономить на китайских моделях?

Открыть документ

Manual #6807 5 min

IVF vs HNSW: Разбор алгоритмов векторного поиска с Python-кодом и бенчмарками

Подробный гайд по алгоритмам приближенного поиска соседей IVF и HNSW. Реализация на Python с FAISS, тесты скорости и точности, нюансы настройки. Для RAG и семан

Открыть документ

Manual #6797 11 min

Как подключить Obsidian к LLM через MCP: пошаговое руководство

Подключите нейросеть к заметкам Obsidian за 10 минут. Используйте Claude, локальную LLM или любую модель через MCP-протокол. Готовый код и репозиторий.

Открыть документ

Manual #6795 6 min

Fable 5 заблокирована правительством США: почему локальные open-source модели становятся главной альтернативой

После блокировки Fable 5 и Mythos 5 правительство США отрезало доступ к топ-моделям. Единственный выход — локальные GGUF-модели с HuggingFace. Гайд: выбор, уста

Открыть документ

Manual #6793 7 min

Оптимизация графов знаний LightRAG для юридического домена: решение проблем топологии и шума

Практическое руководство по оптимизации LightRAG для юридических текстов: решаем проблемы низкой связности, шума извлечения и двуязычного расщепления. Код, пром

Открыть документ

Manual #6788 8 min

Pythia-6.9B: как я научил её говорить на 13 языках за 550 шагов (и вы тоже сможете)

Пошаговый гайд: дообучение Pythia-6.9B с LoRA на двух датасетах (OpenAssistant + Alpaca). Как получить модель, понимающую 13 языков, за 550 шагов. Код, результа

Открыть документ

Manual #6785 5 min

Создаем ассистента для подготовки к встречам и follow-up на Amazon Quick и Cisco Webex MCP серверах

Пошаговый гайд по созданию AI-ассистента для подготовки к встречам и follow-up с использованием MCP серверов Amazon Quick и Cisco Webex. Код, архитектура, ошибк

Открыть документ

Manual #6782 9 min

Прокачай свой AI-бэкенд: пишем LLM-роутер на NestJS, который выживет при любой аварии у провайдера

Пошаговый гайд по созданию отказоустойчивого LLM-роутера на NestJS. Код, стратегии роутинга, fallback, обработка ошибок. Экономьте до 50% на API.

Открыть документ

Manual #6781 9 min

Оптимизация LLM-запросов с помощью контекстного профилировщика: снижаем расход токенов

Практическое руководство по использованию контекстного профилировщика для сокращения расхода токенов в LLM. Анализ, настройка, примеры и типичные ошибки.

Открыть документ

Manual #6779 9 min

Реальные vs теоретические метрики LLM на on-premise: как мы считали ресурсы для GPT-OSS-120B на RTX Pro 6000 и почему калькуляторы врут в 5 раз

Почему онлайн-калькуляторы для расчета ресурсов LLM врут в 5 раз? Тестируем GPT-OSS-120B на RTX Pro 6000 Blackwell: реальные показатели VRAM, latency, throughpu

Открыть документ

Учебные материалы

Локальный AI‑ассистент на роботе Reachy Mini: разворачиваем speech-to-speech без облака

End-to-End Encrypted ML Inference with Fully Homomorphic Encryption on Amazon SageMaker

Сравнение Qwen, Codex и Claude в реальной задаче: стоит ли переходить на китайские модели для экономии?

IVF vs HNSW: Разбор алгоритмов векторного поиска с Python-кодом и бенчмарками

Как подключить Obsidian к LLM через MCP: пошаговое руководство

Fable 5 заблокирована правительством США: почему локальные open-source модели становятся главной альтернативой

Оптимизация графов знаний LightRAG для юридического домена: решение проблем топологии и шума

Pythia-6.9B: как я научил её говорить на 13 языках за 550 шагов (и вы тоже сможете)

Создаем ассистента для подготовки к встречам и follow-up на Amazon Quick и Cisco Webex MCP серверах

Прокачай свой AI-бэкенд: пишем LLM-роутер на NestJS, который выживет при любой аварии у провайдера

Оптимизация LLM-запросов с помощью контекстного профилировщика: снижаем расход токенов

Реальные vs теоретические метрики LLM на on-premise: как мы считали ресурсы для GPT-OSS-120B на RTX Pro 6000 и почему калькуляторы врут в 5 раз