Инструменты
Подборка AI-инструментов. Только то, что работает.
Голосовой агент с RAG на GTX 1650: как уложиться в 400 мс при 4 ГБ VRAM
Пошаговый гайд по созданию голосового агента с иерархическим RAG на GTX 1650 (4 ГБ VRAM). Код, оптимизации Zero-Copy Memory, задержка менее 400 мс.
MacBook превращается в стенографиста: как собрать полностью локальный рекордер встреч с Whisper и Llama
Полное руководство по созданию приватного рекордера встреч для Mac на базе Whisper и Llama. Аудио не покидает устройство, полный контроль над данными.
Structured Outputs в Amazon Bedrock: как создать валидные JSON-ответы без ручной проверки
Как использовать Structured Outputs в Amazon Bedrock для получения валидных JSON-ответов от LLM без ручной валидации. Примеры и сравнение с альтернативами.
PersonaPod: ваш личный подкаст-франкенштейн, который говорит вашим голосом
Создайте персонализированный подкаст из RSS-лент с вашим клонированным голосом. PersonaPod на llama.cpp и MaskGCT TTS - установка, настройка, примеры.
Superlinear: практический гайд по запуску модели с субквадратичным вниманием для контекста 10M токенов
Пошаговое руководство по запуску Superlinear — модели с субквадратичным вниманием O(L^(3/2)) для контекста до 10 миллионов токенов на одном GPU.
PromptSec: легковесная Go-библиотека, которая затыкает дыры для prompt injection
Обзор PromptSec — легковесной Go-библиотеки для локальной защиты от prompt injection. Паттерн-матчинг, ~0.3 мс, сравнение с Lakera Guard. Актуально на 06.02.202
Anagnorisis: семантический поиск по медиатеке без слежки стримингов
Разверните приватную систему поиска по музыке и видео с LAION CLAP, SigLIP и Jina v3. Сравнение моделей эмбеддингов для медиатек.
AI Jukebox на RunPod: как запустить ACE-Step 1.5 за один клик и принимать Bitcoin-голоса
Пошаговая инструкция по запуску музыкального AI Jukebox с моделью ACE-Step 1.5 на RunPod. One-click деплой, Bitcoin Lightning голосование, генерация музыки.
Hugging Face Community Evals: как создавать и проверять бенчмарки моделей через PR
Как работает система Community Evals на Hugging Face для прозрачного тестирования AI-моделей через Pull Request и автоматическую верификацию результатов в 2026
1376 реальных терминалов для тестирования AI-агентов: релиз SETA, который меняет правила игры
Обзор SETA — коллекции из 1376 открытых терминальных сред для реалистичного тестирования AI-агентов. Установка, использование, альтернативы.
Minicpm-o 4.5: 9 миллиардов параметров, которые помещаются в ваш карман (и работают в реальном времени)
Обзор Minicpm-o 4.5 — 9B мультимодальной модели с дуплексным голосом и распознаванием видео в реальном времени. Тесты на Macbook M3, сравнение с аналогами, прим
Квантование и запуск 1T параметров на CPU: полный разбор Kimi-k2.5 на AMD EPYC с llama.cpp
Технический разбор запуска MoE-модели Kimi-k2.5 (1.03T) на CPU через llama.cpp. Квантование Q4_K_S, производительность 10-12 tok/s, настройка podman и асинхронн