Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

D

DFlash: Как ускорить LLM-инференс в 2 раза с помощью блочного спекулятивного декодирования

Обзор DFlash - революционного метода ускорения LLM-инференса через diffusion-style декодирование. Сравнение с vLLM, TensorRT-LLM, интеграция с SGLang.

Обзор
T

TensorTonic: Когда математика для ML перестала быть скучной

TensorTonic — образовательная платформа с реализацией 100+ ML алгоритмов и 60+ тем по математике. Обзор возможностей, сравнение с альтернативами и для кого подх

Обзор
D

Drift: Как научить AI-агента понимать ваш код с помощью MCP и 150+ детекторов паттернов

Open-source инструмент Drift с MCP-сервером и 150+ детекторами паттернов помогает AI-агентам понимать вашу кодовую базу без токенного перерасхода. Установка: np

Обзор
L

LiveKit: скрытый мотор ChatGPT Voice и как собрать на нём свой голосовой AI

Разбираем LiveKit — инфраструктуру ChatGPT Voice. Как работает WebRTC для AI-диалогов, сравнение с альтернативами и запуск своего голосового ассистента в 2026 г

Обзор
D

Drift MCP: как дать AI-агенту интуицию senior-разработчика без сжигания бюджета на токены

Обзор Drift MCP - инструмента, который сокращает расход токенов AI агентов на 60% через статический анализ кода и семантическую модель кодовой базы.

Обзор
K

KernelAI: 43 локальные модели в кармане, или Как превратить iPhone в AI-сервер

Запускаем Gemma 3, Llama 3.2 и 41 другую модель на iPhone без интернета. Потребление ОЗУ 400-600 МБ, поддержка vision и TTS. Полный обзор на 23.01.2026.

Обзор
P

PromptBridge-0.6b: собираем свою фабрику промптов для Stable Diffusion

Полное руководство по созданию своей модели для генерации промптов для Stable Diffusion на базе Qwen3-0.6b с примером работающего пайплайна

Обзор
С

Соединил iPhone и Mac в суперкомпьютер: как заставить Llama-3.3 70B работать на 12 ГБ RAM

Практический гайд по объединению памяти iPhone и Mac для запуска Llama-3.3 70B через MLX и exo. Тестируем USB vs Wi-Fi, ограничения wired memory и ускоренные яд

Обзор
O

Observer: превращаем телефон в умный локальный ассистент с фоновым мониторингом экрана

Observer - opensource-инструмент для iOS и Android с PiP-плеером, локальными LLM и интеграцией с компьютером. Превращает телефон в умного ассистента.

Обзор
U

Unsloth для эмбеддингов: инструкция по тонкой настройке EmbeddingGemma и Qwen3 в 3 раза быстрее

Практическое руководство по тонкой настройке EmbeddingGemma, Qwen3 Embedding и BGE M3 с ускорением до 3.3x и экономией VRAM через Unsloth. Готовые ноутбуки, инт

Обзор
Q

Qwen3-TTS: полный гайд по запуску открытых моделей для синтеза, дизайна и клонирования голоса на 10 языках

Полное руководство по Qwen3-TTS. Установка, сравнение моделей VoiceDesign и CustomVoice, примеры кода для синтеза и клонирования голоса на русском и других язык

Обзор
A

ABC-Bench: первый бенчмарк, где AI-агенты терпят крах на Docker и pip install

Обзор ABC-Bench — первого бенчмарка для оценки AI-агентов в полном цикле backend-разработки. Код на GitHub, датасет на Hugging Face. Результаты шокируют: 50% пр

Обзор