Инструменты
Подборка AI-инструментов. Только то, что работает.
Finam выпустил финансовые бенчмарки для LLM: теперь модели сдают CFA и торгуют акциями
Обзор новых финансовых бенчмарков от Finam AI Lab для тестирования LLM на знание рынка, экзаменов CFA и российской экономики. Сравнение с FinQA, примеры использ
Сравнение 49 AI-агентов для кода: как выбрать лучший инструмент и запустить бенчмарк SanityHarness
Обзор бенчмарка SanityHarness для тестирования 49 AI-агентов для программирования, включая Kimi K2.5. Как запустить тесты и выбрать лучший инструмент.
Как Tesserack превращает LLM в компилятор наград для обучения агентов: кейс с Pokémon Red
Как инструмент Tesserack использует LLM для генерации детерминированных функций вознаграждения из гайдов. Пример с 675 тестами для Pokémon Red.
Nemotron-Personas-Brazil: как NVIDIA создаёт бразильцев из воздуха для ваших AI-приложений
Практическое руководство по использованию датасета NVIDIA с 6 млн персонажей на бразильском португальском. Создавайте локализованные AI-приложения без проблем с
Nemotron-Personas-Singapore: Синтетические сингапурцы NVIDIA и битва за суверенный ИИ
Как использовать синтетический датасет Nemotron-Personas-Singapore от NVIDIA для создания ИИ с сингапурским колоритом. Лицензия CC BY 4.0, практическое применен
MiniMax-M2.1-REAP: новые квантования 139B и 172B моделей для локального запуска
Обзор новых квантований REAP для MiniMax M2.1: 139B и 172B параметров для локального запуска. Сравнение версий, требования к железу, практическое применение.
Офлайн-ассистент за 11 минут: RunAnywhere SDK + форк Expo — больше никаких облачных API
Практический гайд по созданию полностью офлайн голосового ассистента с локальными моделями без облачных API. RunAnywhere SDK + форк Expo для быстрого старта.
Subquadratic Attention: как NVIDIA взломала 1M контекст на одном RTX 5090
Разбор технологии subquadratic attention от NVIDIA: как получить контекст 1M токенов на 30B модели с одной видеокартой. Архитектура, бенчмарки, сравнение с альт
LingBot-Depth: модель, которая заставляет роботов видеть стекло и зеркала
Как LingBot-Depth решает проблему прозрачных объектов для роботов. Архитектура ViT-Large, датасет 3M изображений, рост успешности захвата на 40%.
Prism от OpenAI: ваш научный соавтор, который не спит и не сомневается
Что такое Prism от OpenAI для учёных? Как использовать AI для написания статей, обзора литературы и оформления. Сравнение с другими инструментами в 2026 году.
Drummer's Rocinante X 12B v1: безумная модель для тех, кому надоел скучный Claude
Обзор Drummer's Rocinante X 12B v1 - творческой модели для ролевых игр, которая работает локально и не уступает Claude. Сравнение, установка, примеры диалогов.
ST-CardGen: как я перестал мучиться с ручным созданием карточек для SillyTavern
Обзор open-source тула ST-CardGen для автоматического создания персонажей SillyTavern с поддержкой KoboldCPP, ComfyUI и локальных LLM. Настройка, примеры, альте