Инструменты
Подборка AI-инструментов. Только то, что работает.
Natural Language Autoencoders от Anthropic: как заглянуть в голову Gemma 3
Natural Language Autoencoders от Anthropic: декодируем внутренние состояния Gemma 3 в текст. Примеры, сравнение с альтернативами, инструкция по запуску.
ZAYA1-8B: Острый скальпель вместо кувалды — обзор компактной LLM от Zyphra
Разбираем ZAYA1-8B: почему 8B модель от Zyphra обходит конкурентов, как запустить локально и стоит ли переходить с Llama 3. Тесты, архитектура, советы.
Как запустить модель 397B в 14 ГБ ОЗУ: реализация Paged MoE на Mac Studio
Подробный обзор реализации Paged MoE для запуска Qwen3-397B на Mac Studio с 14 ГБ ОЗУ. Сравнение с Flash-MoE и Apple LLM in a Flash, шаги и результаты.
Как создать AI-подкаст и загрузить в Spotify за 10 минут: разбираем новый CLI-инструмент PodAgent
Spotify выпустил PodAgent CLI для генерации подкастов через ИИ. Установка, пример промпта, сравнение с NotebookLM. Создайте свой первый AI-подкаст за 10 минут.
Codex CLI /goal: как работает автономный AI-агент на GPT-5.5 и сколько это реально стоит
Разбор команды /goal в Codex CLI с GPT-5.5: как работает Ralph loop, permission profiles, реальный расход токенов и стоимость. Сравнение с Claude Code и Cursor.
OpenSeeker-v2: открытый Deep Research агент, который выучили на 10 000 примерах без RL — и это работает
OpenSeeker-v2 — открытый агент для глубокого поиска, обученный на 10 600 синтетических примерах без RL. Сравнение с OpenAI, установка и примеры использования.
useknockout: бесплатная open-source альтернатива remove.bg и Topaz с удалением фона, апскейлом и реставрацией лиц — деплой на Modal за одну команду
Обзор бесплатного инструмента useknockout для удаления фона, апскейла и реставрации лиц. Сравнение с remove.bg и Topaz, деплой на Modal одной командой. Кому под
ZAYA1-8B: Первая крупная LLM на железе AMD — что она умеет и стоит ли качать
ZAYA1-8B — frontier 8B модель, обученная на GPU AMD. Разбираемся с возможностями, запускаем локально и сравниваем с Llama 3, Qwen 2.5 и Gemma 4.
Gemma 4 26B на двух машинах: Decoupled Attention с помощью Larql для обхода лимитов локальной памяти
Как запустить Gemma 4 26B на двух слабых GPU с помощью Larql и техники Decoupled Attention. Рабочий код, сравнение с альтернативами, пример конфигурации.
Multi-Token Prediction на Qwen3-27B: ускорение в 2.5x с Unsloth UD XL и квантованными GGUFs
Как запустить Multi-Token Prediction на Qwen3-27B с Unsloth UD XL и получить 2.5x прироста скорости. Инструкция, бенчмарки, сравнение с vLLM и llama.cpp.
FSRS для Obsidian: как забывать реже, а учиться — в своем хранилище
Обзор плагина FSRS для Obsidian: алгоритм нового поколения, до 30% меньше повторений, все данные в .md файлах. Сравнение с Anki и RemNote.
Solidity LM на основе Qwen 3.6 превзошёл Opus: как запустить модель 27B для смарт-контрактов
Новинка: Solidity LM на Qwen 3.6 - 27B модель обходит Opus. Гайд по запуску, сравнение с альтернативами и примеры для разработчиков смарт-контрактов.