Учебные материалы
Локальный AI‑ассистент на роботе Reachy Mini: разворачиваем speech-to-speech без облака
Полное руководство по развертыванию голосового ассистента на роботе Reachy Mini без облачных сервисов. Silero VAD, Parakeet-TDT, Gemma 4, Qwen3-TTS — все на бор
End-to-End Encrypted ML Inference with Fully Homomorphic Encryption on Amazon SageMaker
Пошаговое руководство по развертыванию полностью гомоморфного шифрования (FHE) для ML-инференса на Amazon SageMaker. Реальная privacy-архитектура с кодом и нюан
Сравнение Qwen, Codex и Claude в реальной задаче: стоит ли переходить на китайские модели для экономии?
Тест Qwen 3.6 Plus, Codex и Claude Opus 4.7 на Go-профилировании: качество ответов, цена, подводные камни. Стоит ли экономить на китайских моделях?
IVF vs HNSW: Разбор алгоритмов векторного поиска с Python-кодом и бенчмарками
Подробный гайд по алгоритмам приближенного поиска соседей IVF и HNSW. Реализация на Python с FAISS, тесты скорости и точности, нюансы настройки. Для RAG и семан
Как подключить Obsidian к LLM через MCP: пошаговое руководство
Подключите нейросеть к заметкам Obsidian за 10 минут. Используйте Claude, локальную LLM или любую модель через MCP-протокол. Готовый код и репозиторий.
Fable 5 заблокирована правительством США: почему локальные open-source модели становятся главной альтернативой
После блокировки Fable 5 и Mythos 5 правительство США отрезало доступ к топ-моделям. Единственный выход — локальные GGUF-модели с HuggingFace. Гайд: выбор, уста
Оптимизация графов знаний LightRAG для юридического домена: решение проблем топологии и шума
Практическое руководство по оптимизации LightRAG для юридических текстов: решаем проблемы низкой связности, шума извлечения и двуязычного расщепления. Код, пром
Pythia-6.9B: как я научил её говорить на 13 языках за 550 шагов (и вы тоже сможете)
Пошаговый гайд: дообучение Pythia-6.9B с LoRA на двух датасетах (OpenAssistant + Alpaca). Как получить модель, понимающую 13 языков, за 550 шагов. Код, результа
Создаем ассистента для подготовки к встречам и follow-up на Amazon Quick и Cisco Webex MCP серверах
Пошаговый гайд по созданию AI-ассистента для подготовки к встречам и follow-up с использованием MCP серверов Amazon Quick и Cisco Webex. Код, архитектура, ошибк
Прокачай свой AI-бэкенд: пишем LLM-роутер на NestJS, который выживет при любой аварии у провайдера
Пошаговый гайд по созданию отказоустойчивого LLM-роутера на NestJS. Код, стратегии роутинга, fallback, обработка ошибок. Экономьте до 50% на API.
Оптимизация LLM-запросов с помощью контекстного профилировщика: снижаем расход токенов
Практическое руководство по использованию контекстного профилировщика для сокращения расхода токенов в LLM. Анализ, настройка, примеры и типичные ошибки.
Реальные vs теоретические метрики LLM на on-premise: как мы считали ресурсы для GPT-OSS-120B на RTX Pro 6000 и почему калькуляторы врут в 5 раз
Почему онлайн-калькуляторы для расчета ресурсов LLM врут в 5 раз? Тестируем GPT-OSS-120B на RTX Pro 6000 Blackwell: реальные показатели VRAM, latency, throughpu