Zerotap - автономный AI-ассистент для Android с Ollama и контролем экрана | AiManual
AiManual Logo Ai / Manual.
25 Янв 2026 Инструмент

Zerotap: Android превращается в автономный AI-ассистент с контролем экрана

Обзор Zerotap: как превратить Android в приватного AI-ассистента с поддержкой Ollama, контролем экрана и MCP серверами. Полная автономность и приватность.

Что случилось с нашими телефонами?

Откройте любой современный Android. Что вы видите? Десятки приложений, которые хотят доступа к камере, микрофону, контактам. Каждый запрос отправляется в облако, каждый диалог анализируется для "улучшения пользовательского опыта". Звучит знакомо?

Zerotap делает обратное. Это не просто ещё один AI-чат для Android. Это полноценный ассистент, который работает локально, контролирует экран вашего телефона как человек, и при этом никуда не отправляет ваши данные. Никаких облаков. Никаких серверов Google или OpenAI. Только ваш телефон и выбранная вами модель.

💡
На 25 января 2026 года Zerotap поддерживает Ollama 0.7.0+ с новыми моделями Llama 3.3 70B, Qwen2.5 72B и Mistral-Large 2. Последнее обновление добавило нативную поддержку MCP серверов и улучшенный парсинг экрана.

Как работает эта штука?

Представьте: вы говорите "Найди последнее фото с кошкой и отправь его маме". Zerotap видит экран (через стандартные API доступности Android), понимает структуру интерфейса, находит галерею, листает фотографии, распознаёт кошку (через локальную модель компьютерного зрения), открывает WhatsApp, находит контакт "Мама" и отправляет фото. Всё это без единого запроса в интернет.

Техническая магия под капотом

  • Контроль экрана через Accessibility API - не требует root, но нужны разрешения (как и любой ассистент для людей с ограниченными возможностями)
  • Поддержка Ollama 0.7.0+ - работает с любыми моделями, которые поддерживает Ollama, включая свежие Llama 3.3
  • Интеграция с OpenRouter - если вдруг нужна облачная модель, но с единым API
  • MCP (Model Context Protocol) серверы - расширяемая система инструментов: от чтения файлов до управления умным домом
  • Локальное выполнение команд - скриншоты, нажатия, свайпы, текст ввод - всё происходит на устройстве

Важно: Zerotap не умеет обходить защиту приложений. Банковские приложения, Google Pay, защищённые мессенджеры остаются недоступными для автоматизации. Это не баг, а фича - так разработчики избегают проблем с безопасностью.

Чем Zerotap отличается от других решений?

Давайте сравним с популярными альтернативами. Offloom, например, тоже работает локально, но это просто чат. Он не контролирует экран. Tasker и AutoTools дают автоматизацию, но без AI. Голосовые ассистенты вроде того, что мы разбирали в статье про Todoist Ramble, требуют облачной обработки.

Инструмент Локальный AI Контроль экрана Требует интернет
Zerotap Да (Ollama) Полный контроль Нет
Google Assistant Нет Ограниченный Да
Tasker + AutoTools Нет Частичный Нет
Локальные решения из нашего туториала Да Нет Нет

Что можно делать прямо сейчас?

Вот реальные сценарии, которые работают в Zerotap на январь 2026:

1 Умная сортировка уведомлений

"Прочитай все уведомления от мессенджеров и оставь только важные". Zerotap анализирует текст уведомлений через локальную модель (например, Qwen2.5-Coder 32B), определяет срочность, свайпает ненужное. Ваши данные о переписке никуда не уходят.

2 Автоматизация рутинных задач

"Каждое утро в 8:00 открой Spotify, найди плейлист 'Утренний заряд', включи его, затем открой календарь и прочитай планы на день". Работает через MCP сервер планировщика - расширение, которое устанавливается в два клика.

3 Экранный скрапинг с пониманием контекста

"Найди на этом экране все цены и отсортируй их по возрастанию". Zerotap парсит UI-дерево, извлекает текст, передаёт в модель с промптом "Найди числа, которые похожи на цены", сортирует результаты. Полезно для сравнения товаров в маркетплейсах.

Как это выглядит на практике?

Установка простая: качаете APK с GitHub (пока нет в Google Play из-за политики автоматизации), даёте разрешения доступности. Настраиваете подключение к Ollama - либо локально на телефоне (нужен мощный девайс), либо к серверу в локальной сети.

Конфигурационный файл выглядит так:

{
  "ollama": {
    "base_url": "http://192.168.1.100:11434",
    "model": "llama3.3:70b",
    "vision_model": "llava:latest"
  },
  "mcp_servers": [
    "file_system",
    "calendar",
    "home_assistant"
  ],
  "screen_parsing": {
    "enabled": true,
    "max_depth": 20,
    "include_screenshots": true
  }
}

Серьёзно, вот и вся настройка. Дальше просто говорите или пишете, что нужно сделать.

Производительность: Llama 3.3 70B на Snapdragon 8 Gen 4 (2025) даёт около 15 токенов в секунду. Для большинства задач хватает. Если нужна скорость - берите Qwen2.5 14B, она летает даже на средних процессорах.

Кому это нужно? (И кому нет)

Берите Zerotap, если:

  • Параноик по приватности (в хорошем смысле)
  • Хотите автоматизировать рутину на телефоне без облачных сервисов
  • Уже используете Ollama на ПК и хотите расширить экосистему
  • Разрабатываете локальных AI-монстров и нужен мобильный фронтенд

Не берите, если:

  • Ждёте скорости как у ChatGPT - локальные модели медленнее
  • Не готовы настраивать Ollama (хотя это стало проще в 2026)
  • Нужна интеграция с экосистемой Google/Alexa
  • У вас телефон слабее Snapdragon 7 Gen 3 - будет тормозить

Что будет дальше?

Разработчики Zerotap анонсировали на 2026 год голосовую активацию (полностью локальную, через Whisper.cpp) и интеграцию с распределённым inference между устройствами. Представьте: ваш телефон использует вычислительные мощности ноутбука и умных колонок для сложных задач.

Но главное - Zerotap показывает, что приватный AI на мобильных устройствах возможен уже сейчас. Не в 2030 году. Не на суперкомпьютерах. На вашем телефоне, который лежит в кармане.

Цена? Бесплатно и open-source. Хотя на Patreon можно задонатить разработчикам - проект живёт на энтузиазме. И да, если решитесь попробовать, начинайте с маленьких моделей. Llama 3.2 3B отлично справляется с базовыми командами, а весит всего 2 ГБ. Не нужно сразу качать 70B версию.

Ваш телефон умнее, чем вы думаете. Просто ему не давали шанса это показать.