Инструменты
Подборка AI-инструментов. Только то, что работает.
Gemini 3 от Google: разбор рекордных бенчмарков и нового кодирующего приложения
Анализ Gemini 3 от Google: рекорды в бенчмарках, запуск кодирующего приложения и исследовательская версия Deepthink. Сравнение с альтернативами на 2026 год.
P1-235B-A22B: как использовать первую золотую медалистку IPhO для решения научных задач
Как использовать модель P1-235B-A22B, показавшую результат уровня GPT-5 на физических тестах, для решения научных задач. Обзор возможностей, сравнение и примеры
LangSmith Fetch: отладка агентов прямо из терминала — установка и использование CLI
Установка и использование LangSmith Fetch CLI для отладки AI-агентов без переключения контекста. Полное руководство по работе с трейсами LangSmith из терминала.
Flux.2 против Midjourney и Nano Banana Pro: тесты, промпты и где генерировать изображения дешевле
Тесты Flux.2, Midjourney и Nano Banana Pro на реальных промптах. Где дешевле генерировать изображения в 2026 году? Сравнение качества, скорости и стоимости.
DeepAgents CLI: кодирующий агент, который работает в терминале. Тестируем на Terminal Bench 2.0 и сравниваем с Claude Code
Обзор DeepAgents CLI — автономного кодирующего агента для терминала. Установка через uvx, тест на Terminal Bench 2.0 (42.5%), сравнение производительности с Cla
DeepEyesV2: когда картинки говорят, а модель их слушает и ищет
Как использовать DeepEyesV2 для анализа изображений и поиска информации. Сравнение с Qwen2.5-VL, инструкция по установке и примеры применения.
Кроссмодальный поиск на практике: как работает Amazon Nova Multimodal Embeddings и примеры кода
Разбираем Amazon Nova Multimodal Embeddings — единую модель для текста, изображений, видео и аудио. Примеры кода, сравнение с альтернативами и кто выиграет от в
MiroThinker v1.0: инструкция по запуску ИИ-агента с 600 вызовами инструментов и контекстом 256К токенов
Полное руководство по запуску MiroThinker v1.0 - автономного ИИ-агента с контекстом 256K токенов и поддержкой 600 вызовов инструментов. Сравнение с GPT-5-high,
DeepSeek-V3.2 локально: китайский сюрприз, который работает на вашем ноутбуке
Полный гайд по запуску DeepSeek-V3.2 на своем компьютере. Квантование моделей, сравнение с GPT-5.2, тесты производительности и реальные примеры кода.
SentinLLM: 100 строк кода против утечек персональных данных в RAG
Обзор SentinLLM - Python-библиотеки для скрабинга персональных данных перед отправкой в LLM. Сравнение с Presidio, примеры использования для RAG-систем.
Qwen2.5 7B против задач ARC-AGI: как маленькая модель ломает большие головоломки
Практический гайд по созданию retrieval-системы на Qwen2.5 7B для декомпозиции сложных задач ARC-AGI на примитивы. Архитектура, калибровка, метрики на январь 20
Как заставить локальные модели работать умнее: mcpx и экономия 40K токенов контекста
Практическое руководство по реализации паттерна Anthropic Advanced Tool Use с mcpx для локальных моделей. Экономьте 40K токенов контекста, избегайте перегрузки