Представьте: вы работаете, а ИИ уже сделал за вас рутину
Обычные AI-помощники — это как послушные собаки: ждут команды «сидеть» или «голос». А что, если компьютер сам поймет, что вам нужно, ещё до того, как вы открыли рот? Именно такую штуку построил стартап IrisGo под крылом фонда Andrew Ng AI Fund. Идея до цинизма проста и сложна одновременно: Siri наоборот.
За проектом стоит экс-инженер Apple, который, видимо, насмотрелся на то, как Купертино сдаёт позиции в AI-гонке. В нашем материале о провалах Apple мы разбирали, почему компания теряет инициативу. Возможно, именно разочарование внутри корпорации толкнуло инженера на собственный стартап. И судя по инвестициям Эндрю Нг — не зря.
Как учится агент: уроки на ваших кликах
IrisGo работает в фоне, записывая последовательности действий: открытие почты, создание папок, очистку рабочего стола, заполнение форм. Никакого видео — только поток событий мыши и клавиатуры. Нейросеть находит паттерны и предлагает завернуть их в макрос. Но не в статичный скрипт — агент адаптируется под изменения интерфейса.
И тут начинается самое интересное. Если вы когда-нибудь пробовали UI-TARS от ByteDance — локального агента, который щёлкает интерфейсы как орехи, то поймёте разницу. UI-TARS работает по принципу «увидел — кликнул» без обучения на пользователе. IrisGo же строит персональную модель поведения. Тот же Screen Vision учит на демонстрациях — но там вы вручную показываете каждый шаг. Здесь — система сама определяет, что пора предложить автоматизацию.
Звучит как утопия, но есть нюанс: проактивность требует доверия. Если агент ошибётся и сделает что-то не то — вы рискуете данными. IrisGo пока обещает «песочницу» и обязательное подтверждение перед первым запуском нового сценария.
Почему Andrew Ng делает ставку на проактивность?
Фонд Andrew Ng AI Fund уже вложился в IrisGo на seed-раунде. Нг не раз говорил, что будущее AI — в агентах, которые действуют, а не просто отвечают. В обзоре AI-агентов недели мы видели, как EvoCUA пытается «думать» перед действием. IrisGo идёт дальше: его агент не размышляет над каждым чихом, а полагается на обученную модель поведения. Это быстрее, но менее гибко в нестандартных ситуациях.
Параллельно Илон Маск через xAI строит систему Macrohard для управления целыми компаниями. Масштабируемость — вот где IrisGo может дать фору. Вместо того, чтобы автоматизировать каждую мелочь, можно делегировать целые рабочие процессы. Но пока стартап не раскрывает, как он планирует переходить от автоматизации одиночных задач к комплексным бизнес-процессам.
Siri наоборот: уроки для Apple и Google
Купертино явно «проспало» рынок проактивных агентов. Партнёрство с Google и Gemini может вдохнуть новую жизнь в Siri, но это всё ещё реактивная система. IrisGo же предлагает философию, от которой в своё время отказалась Apple: дать агенту доступ к рабочему столу и разрешить действовать без спроса (почти).
Кстати, некоторые команды уже используют open-source решения вроде фреймворка Iris Agent, где видна каждая шестерёнка. Но IrisGo — это чёрный ящик с хорошим UX. Выбор между прозрачностью и удобством.
Риски и подводные камни
Когда агент знает ваши привычки — он становится мишенью для атак. Если вредоносное ПО получит доступ к IrisGo, злоумышленник будет знать, как вы работаете, и сможет подменять сценарии. Разработчики обещают локальную обработку и шифрование модели на устройстве. Но это не панацея.
Ещё одна проблема — обучение на «шумных» данных. Если вы работаете хаотично, агент выучит хаос и будет предлагать нелогичные макросы. Тут важен баланс между адаптивностью и устойчивостью.
| Сравнение проактивных агентов | Обучение на пользователе | Проактивность |
|---|---|---|
| IrisGo | Автоматическое фоновое | Да (предлагает сценарии) |
| UI-TARS (ByteDance) | Нет (только инструкции) | Нет (ждёт команды) |
| EvoCUA | Нет (планирование) | Частично (сам строит план) |
| Screen Vision | Да (ручные демо) | Нет (только по запросу) |
Что дальше? Прогноз, а не вывод
IrisGo выйдет в публичный доступ — по слухам — в июле 2026 года. Сначала только на macOS. Если команда решит проблему доверия и случайных ошибок, мы увидим взрывной рост проактивных ассистентов. Но есть и обратный сценарий: пользователи испугаются и закопают идею под горами паранойи.
Мой совет — не бросайтесь в омут с головой. Дайте агенту доступ только к одному приложению, например к файловому менеджеру. Пусть сначала автоматизирует сортировку загрузок. Когда убедитесь, что он не накосячил — расширяйте права. Лучше медленное завоевание доверия, чем пожар на рабочем столе.