Инструменты для работы с AI

N

Natural Language Autoencoders от Anthropic: как заглянуть в голову Gemma 3

Natural Language Autoencoders от Anthropic: декодируем внутренние состояния Gemma 3 в текст. Примеры, сравнение с альтернативами, инструкция по запуску.

Обзор

Z

ZAYA1-8B: Острый скальпель вместо кувалды — обзор компактной LLM от Zyphra

Разбираем ZAYA1-8B: почему 8B модель от Zyphra обходит конкурентов, как запустить локально и стоит ли переходить с Llama 3. Тесты, архитектура, советы.

Обзор

К

Как запустить модель 397B в 14 ГБ ОЗУ: реализация Paged MoE на Mac Studio

Подробный обзор реализации Paged MoE для запуска Qwen3-397B на Mac Studio с 14 ГБ ОЗУ. Сравнение с Flash-MoE и Apple LLM in a Flash, шаги и результаты.

Обзор

К

Как создать AI-подкаст и загрузить в Spotify за 10 минут: разбираем новый CLI-инструмент PodAgent

Spotify выпустил PodAgent CLI для генерации подкастов через ИИ. Установка, пример промпта, сравнение с NotebookLM. Создайте свой первый AI-подкаст за 10 минут.

Обзор

C

Codex CLI /goal: как работает автономный AI-агент на GPT-5.5 и сколько это реально стоит

Разбор команды /goal в Codex CLI с GPT-5.5: как работает Ralph loop, permission profiles, реальный расход токенов и стоимость. Сравнение с Claude Code и Cursor.

Обзор

O

OpenSeeker-v2: открытый Deep Research агент, который выучили на 10 000 примерах без RL — и это работает

OpenSeeker-v2 — открытый агент для глубокого поиска, обученный на 10 600 синтетических примерах без RL. Сравнение с OpenAI, установка и примеры использования.

Обзор

u

useknockout: бесплатная open-source альтернатива remove.bg и Topaz с удалением фона, апскейлом и реставрацией лиц — деплой на Modal за одну команду

Обзор бесплатного инструмента useknockout для удаления фона, апскейла и реставрации лиц. Сравнение с remove.bg и Topaz, деплой на Modal одной командой. Кому под

Обзор

Z

ZAYA1-8B: Первая крупная LLM на железе AMD — что она умеет и стоит ли качать

ZAYA1-8B — frontier 8B модель, обученная на GPU AMD. Разбираемся с возможностями, запускаем локально и сравниваем с Llama 3, Qwen 2.5 и Gemma 4.

Обзор

G

Gemma 4 26B на двух машинах: Decoupled Attention с помощью Larql для обхода лимитов локальной памяти

Как запустить Gemma 4 26B на двух слабых GPU с помощью Larql и техники Decoupled Attention. Рабочий код, сравнение с альтернативами, пример конфигурации.

Обзор

M

Multi-Token Prediction на Qwen3-27B: ускорение в 2.5x с Unsloth UD XL и квантованными GGUFs

Как запустить Multi-Token Prediction на Qwen3-27B с Unsloth UD XL и получить 2.5x прироста скорости. Инструкция, бенчмарки, сравнение с vLLM и llama.cpp.

Обзор

F

FSRS для Obsidian: как забывать реже, а учиться — в своем хранилище

Обзор плагина FSRS для Obsidian: алгоритм нового поколения, до 30% меньше повторений, все данные в .md файлах. Сравнение с Anki и RemNote.

Обзор

S

Solidity LM на основе Qwen 3.6 превзошёл Opus: как запустить модель 27B для смарт-контрактов

Новинка: Solidity LM на Qwen 3.6 - 27B модель обходит Opus. Гайд по запуску, сравнение с альтернативами и примеры для разработчиков смарт-контрактов.

Обзор