Новости AI

07.06.2026

Whistlebench: новый бенчмарк на предательство ИИ — стоит ли доверять моделям?

Whistlebench — скандальный тест на лояльность ИИ. Llama и GPT молчат, а Claude, Gemini и Grok сливают информацию. Разбор этических дилемм и последствий.

Читать →

07.06.2026

Grok Voice Think Fast 1.0: xAI запускает real-time голосового агента, который изменит Starlink-автоматизацию

xAI представил Grok Voice Think Fast 1.0 — real-time голосовой AI с задержкой менее 200 мс. Как это повлияет на Starlink и рынок голосовых ассистентов? Читайте

Читать →

07.06.2026

Кризис воспроизводимости в AI-бенчмарках: разбор на примере конкурса по низкодозовой компьютерной томографии

Почему победители конкурса ICASSP-2024 по низкодозовой КТ не смогли повторить свои результаты? Расследование проблемы reproducibility в медицинском AI.

Читать →

07.06.2026

Cohere Coder на вашем ноуте: как я залез в ранний доступ и сжег 32 гигабайта RAM

Как получить ранний доступ к кодинг-модели Cohere и запустить локально. Реальный опыт, тесты на HumanEval, сравнение с Copilot и китайскими аналогами.

Читать →

07.06.2026

Судьи против AI-исков: как нейросети порождают лавину судебных дел и как их распознать

Галлюцинации нейросетей плодят иски с вымышленными прецедентами. Судьи в отчаянии. Разбираем, как отличать AI-тексты в юриспруденции и защитить себя.

Читать →

07.06.2026

Реальные квартиры против симуляторов: почему Hello Robot Stretch стал главным сборщиком данных для домашних роботов

Разбор платформы Hello Robot Stretch 4: почему реальные данные из домов критичны для обучения AI, какие проблемы встают перед разработчиками и чему учиться у пи

Читать →

07.06.2026

Meta строит дата-центры в палатках: как ускорить развертывание AI-инфраструктуры по примеру Tesla и xAI

Meta разворачивает шесть гигантских палаток для дата-центров на 200 МВт газовых турбин. Разбираем, как тактика быстрого развертывания Tesla и модульные решения

Читать →

07.06.2026

Claude Code без карты: почему Anthropic принципиально не строит долгосрочный roadmap и что это значит для разработчиков

Эксклюзив: продакт-лид Claude Code Cat Wu объясняет, почему Anthropic не публикует дорожную карту, как рост 80x изменил лимиты и при чём тут суперкомпьютер Spac

Читать →

07.06.2026

Anthropic тестирует отключение Claude Code в Pro-тарифе: что это значит для разработчиков и как реагировать

Anthropic тестирует удаление Claude Code из Pro-подписки. Разбираем, почему это происходит, как это повлияет на разработчиков и что делать: переходить на Max, и

Читать →

07.06.2026

VAKRA Benchmark: основные причины провала AI-агентов в корпоративных сценариях

Разбор провалов AI-агентов на VAKRA: потеря контекста в цепочках API, неспособность адаптироваться, слепое доверие данным. Что вскрыл бенчмарк IBM Research.

Читать →

07.06.2026

ROI-маски в УЗИ классификации: почему обрезка изображений не всегда улучшает результат — эксперимент на 64 моделях

Исследование на 64 моделях показало: использование ROI-масок в УЗИ может как помогать, так и вредить. Разбираем, когда контекст важнее фокуса.

Читать →

07.06.2026

3×RTX 3090: битва титанов 2025 года — какую локальную модель выбрать, когда 72 ГБ VRAM решают всё

Сравнение лучших открытых LLM 2025 года для конфигурации 3×RTX 3090. Бенчмарки, квантизация, скорость и качество — что реально работает на 72 ГБ VRAM.

Читать →