Что такое Computer Use от Google и в чем различие от Operator от OpenAI и Comet от Perplexity

Что такое Computer Use от Google и в чем различие от Operator от OpenAI и Comet от Perplexity

Google выпустил Computer Use на Gemini 2.5 Pro для автоматизации действий в браузере. Его стали сравнивать с Operator от OpenAI и Comet от Perplexity. Разбираемся, чем они отличаются по возможностям, доступности и сценариям для компаний.

Что такое Computer Use, Operator и Comet

Computer Use — специализированный агент на базе Gemini 2.5 Pro, который «видит» экран по скриншотам и генерирует действия в браузере: клик, ввод текста, скролл, drag&drop и прочее. Не смотря на название, пока представлен только для работы в браузере. Модель доступна разработчикам через API Gemini в Google AI Studio и Vertex AI и, по заявлениям Google, показывает лучшие результаты на ряде бенчмарков веб-и мобильного контроля, с меньшей задержкой. Демо-версия есть на Browserbase.

Что такое Computer Use от Google и в чем различие от Operator от OpenAI и Comet от Perplexity

При этом в инфополе уже есть два громких ориентира:

  • OpenAI Operator — «исполнитель» задач в собственном браузере внутри ChatGPT, сейчас в статусе research preview для подписчиков Pro в США. Это агент для обычных в том числе пользователей: ставите задачу → он сам открывает сайты, кликает, заполняет формы и доводит до результата, запрашивая подтверждение на рисковые шаги.
  • Comet — новый ИИ-браузер Perplexity, который недавно стал доступен всем бесплатно (с ограничениями). Он может выполнять действия за вас в вебе: если вы авторизованы, собирать инфу со страницы и со всех вкладок и сделать саммари.

Давайте без кликбейта и маркетинга: чем именно они отличаются и какой вариант выбрать под ваши кейсы?

В чем же отличие Computer Use от Comet, Operator?

Сравнение Computer Use от Google, Operator от OpenAI и Comet от Perplexity
Сравнение Computer Use от Google, Operator от OpenAI и Comet от Perplexity

Я не буду погружаться в технические нюансы, а расскажу в чем отличие от того же агента Operator от OpenAI и от ИИ-браузера Comet от Perplexity.

  • Computer Use позволяет создавать Агенты управления браузером. Вы можете автоматизировать ваши повторяющиеся задачи в браузере — ввод данных или заполнение форм на веб-сайтах. Вроде как можно автоматизировать тестирование веб-приложений. Так же можно проводить исследования на разных сайтах. Например, сбор информации о продуктах, ценах и обзорах с сайтов электронной коммерции для информирования о покупке.
  • Comet от Perplexity можно использовать бесплатно, хоть и с ограничениями (вроде 4 запроса в час), Operator от OpenAI стоит уже 200$ в месяц как часть подписки, Computer Use от Google -сколько использовал, столько заплатил — доступно по API Gemini, потому уже отсекает обычных пользователей. Но на Vertex AI прайсинг свой.
  • Computer Use от Google можно настроить как своего корпоративного агента, а предыдущие два все-таки для одного обычного пользователя. Компании и разработчики могут собирать СВОИХ операторов под свои процессы (внутренние ЛК, сайты без API), со своими правилами безопасности, логами и подтверждениями — и запускать это массово для сотрудников/клиентов. А тот же ИИ-браузер Comet как оказалось, легко взламывается промпт-инъекциями, ему вы уже не доверите корпоративные секретные данные.

Что ж, давайте срезюмируем коротко про каждого участника:

Gemini 2.5 Computer Use (Google)

  • Это специализированная модель и инструмент «Computer Use» в Google AI Studio (API) и Vertex AI, генерирует пошаговые действия в браузере на основе скриншотов.
  • Подойдет разработчикам и компаниям, которым нужно собирать своих операторов под процессы, с логированием и политиками подтверждений.

Operator (OpenAI)

Что такое Computer Use от Google и в чем различие от Operator от OpenAI и Comet от Perplexity
  • Это агент в экосистеме ChatGPT, который открывает свой браузер, кликает, заполняет формы и просит подтверждение на рискованные шаги; статус — research preview для Pro в США. Нужно $200/мес (план Pro) для доступа.
  • Подойдет продвинутым пользователям/креаторам, кому нужен «универсальный исполнитель» без разработки инфраструктуры.

Comet (Perplexity)

Что такое Computer Use от Google и в чем различие от Operator от OpenAI и Comet от Perplexity
  • Это самостоятельный Chromium-браузер с ИИ-помощником, который умеет анализировать веб-страницы, извлекать данные и выполнять действия (при авторизации) — сейчас доступен бесплатно для всех; часть продвинутых функций — по подписке.
  • Подойдет для массовых пользователей и ресерчеров, кому нужен «умный» браузер из коробки.

Реализация / Примеры кода

Ниже — минимальный скелет: как дернуть Computer Use через Gemini API (идея та же и в Vertex AI; действия исполняет ваш «исполнитель», которому вы доверяете).

# Тест-код: запрос к Gemini 2.5 Computer Use # 1) Отправляем инструкцию + (опционально) контекстные скриншоты/URL. # 2) Модель возвращает план и список UI-действий (tool calls). # 3) Ваш рантайм исполняет действия (эмуляция кликов/ввода в браузере), # собирает новые скриншоты/состояние и отсылает обратно до достижения цели. from gemini import Client, ComputerUse client = Client(api_key=GEMINI_KEY) cu = ComputerUse(model=”gemini-2.5-computer-use-preview”) session = cu.start( goal=”Найти ноутбуки до $1200, отсортировать по рейтингу и выгрузить таблицу (название, цена, рейтинг).” ) while True: actions = session.next_actions() # [{“type”:”click”,”selector”:”…”} …] if not actions: break browser_results = execute_in_headless_browser(actions) # ваша реализация session.feedback(browser_results) data = session.result() # структурированные итоги print(data)

Документация: Gemini API Computer Use, Vertex AIComputer Use. Вам нужно реализовать уровень исполнения действий и безопасные политики подтверждений.

Где запускать демо:

  • Browserbase опубликовал готовый шаблон (Stagehand + Gemini 2.5 Computer Use) и публичные демо — быстро проверить автономные веб-таски.

Как использовать Computer Use от Google

  • Начните с быстрых copilots: возьмите 2–3 рутинных сценария (заполнение форм, выгрузка цен), соберите агента на Gemini Computer Use, добавьте политики подтверждений и анти-петли (timeouts/guardrails). Измеряйте метрики: экономия человеко-часов, стабильность, процент успешных сценариев.
  • Оцените TCO: стоимость токенов/времени выполнения в Vertex AI Agent Builder + стоимость поддержки рантайма исполнения. Оценить стоимость можно здесь или вот еще страница цен на Vertex
  • Для редакций/аналитиков попробуйте Comet как рабочий браузер с ИИ: он уже бесплатен, удобен для ресерча и сводок. Еще удобно зайти например в телеграм веб и исследовать всю сводку новостей или попросить ответить на сообщения.

P.S: Вы можете поддержать меня в моем канале НейроProfit — там я пишу более простым языком о том, в чем разбираюсь сама. ИИ-сервисы и LLM тестирую сама, так что накопилось достаточно проверенных нейросетей.

Начать дискуссию