Инструменты
Подборка AI-инструментов. Только то, что работает.
DFlash: Как ускорить LLM-инференс в 2 раза с помощью блочного спекулятивного декодирования
Обзор DFlash - революционного метода ускорения LLM-инференса через diffusion-style декодирование. Сравнение с vLLM, TensorRT-LLM, интеграция с SGLang.
TensorTonic: Когда математика для ML перестала быть скучной
TensorTonic — образовательная платформа с реализацией 100+ ML алгоритмов и 60+ тем по математике. Обзор возможностей, сравнение с альтернативами и для кого подх
Drift: Как научить AI-агента понимать ваш код с помощью MCP и 150+ детекторов паттернов
Open-source инструмент Drift с MCP-сервером и 150+ детекторами паттернов помогает AI-агентам понимать вашу кодовую базу без токенного перерасхода. Установка: np
LiveKit: скрытый мотор ChatGPT Voice и как собрать на нём свой голосовой AI
Разбираем LiveKit — инфраструктуру ChatGPT Voice. Как работает WebRTC для AI-диалогов, сравнение с альтернативами и запуск своего голосового ассистента в 2026 г
Drift MCP: как дать AI-агенту интуицию senior-разработчика без сжигания бюджета на токены
Обзор Drift MCP - инструмента, который сокращает расход токенов AI агентов на 60% через статический анализ кода и семантическую модель кодовой базы.
KernelAI: 43 локальные модели в кармане, или Как превратить iPhone в AI-сервер
Запускаем Gemma 3, Llama 3.2 и 41 другую модель на iPhone без интернета. Потребление ОЗУ 400-600 МБ, поддержка vision и TTS. Полный обзор на 23.01.2026.
PromptBridge-0.6b: собираем свою фабрику промптов для Stable Diffusion
Полное руководство по созданию своей модели для генерации промптов для Stable Diffusion на базе Qwen3-0.6b с примером работающего пайплайна
Соединил iPhone и Mac в суперкомпьютер: как заставить Llama-3.3 70B работать на 12 ГБ RAM
Практический гайд по объединению памяти iPhone и Mac для запуска Llama-3.3 70B через MLX и exo. Тестируем USB vs Wi-Fi, ограничения wired memory и ускоренные яд
Observer: превращаем телефон в умный локальный ассистент с фоновым мониторингом экрана
Observer - opensource-инструмент для iOS и Android с PiP-плеером, локальными LLM и интеграцией с компьютером. Превращает телефон в умного ассистента.
Unsloth для эмбеддингов: инструкция по тонкой настройке EmbeddingGemma и Qwen3 в 3 раза быстрее
Практическое руководство по тонкой настройке EmbeddingGemma, Qwen3 Embedding и BGE M3 с ускорением до 3.3x и экономией VRAM через Unsloth. Готовые ноутбуки, инт
Qwen3-TTS: полный гайд по запуску открытых моделей для синтеза, дизайна и клонирования голоса на 10 языках
Полное руководство по Qwen3-TTS. Установка, сравнение моделей VoiceDesign и CustomVoice, примеры кода для синтеза и клонирования голоса на русском и других язык
ABC-Bench: первый бенчмарк, где AI-агенты терпят крах на Docker и pip install
Обзор ABC-Bench — первого бенчмарка для оценки AI-агентов в полном цикле backend-разработки. Код на GitHub, датасет на Hugging Face. Результаты шокируют: 50% пр