Компания OpenAI анонсировала запуск ChatGPT Agent — инновационного ИИ-агента, способного самостоятельно выполнять сложные задачи в интернете и генерировать файлы, такие как презентации PowerPoint и таблицы Excel. Это обновление, представленное 17 июля, объединяет возможности предыдущих инструментов OpenAI, таких как Operator для навигации по сайтам и Deep Research для глубокого анализа данных, делая ChatGPT не просто чат-ботом, а полноценным «супер-ассистентом» для повседневных и рабочих нужд.
Согласно официальному анонсу на сайте OpenAI, ChatGPT Agent работает в виртуальной среде, имитирующей компьютер пользователя. Он может просматривать веб-сайты, кликать по элементам, заполнять формы, анализировать информацию из десятков источников и даже создавать отчёты. Например, агент способен спланировать ужин на четверых, заказать ингредиенты, проанализировать данные конкурентов и подготовить слайд-дек для презентации.
«ChatGPT теперь может работать за вас на своём собственном компьютере», — отметили в OpenAI, подчёркивая, что агент сочетает разговорные способности с практическими действиями.
Запуск начался для подписчиков тарифов Pro, Plus и Team, с возможностью активации в меню инструментов ChatGPT. Пользователи Pro получают до 400 запросов в месяц, в то время как для других тарифов лимит составляет 40. OpenAI планирует расширить доступ для Enterprise и Education позже летом. Как сообщает TechCrunch, агент использует модель GPT-4o и показывает выдающиеся результаты на бенчмарках: 41,6% на тесте Humanity’s Last Exam и 27,4% на сложном математическом FrontierMath с использованием инструментов.
Особое внимание уделено безопасности. OpenAI ввела мониторинг в реальном времени, классификаторы для выявления рисков (например, связанных с биологическими или химическими угрозами) и отказ от памяти чата, чтобы предотвратить утечки данных через атаки вроде prompt injection. Агент всегда запрашивает подтверждение пользователя перед чувствительными действиями, такими как вход в аккаунты или отправка форм, и отказывается от задач, связанных с фишингом или обманом. «Мы предпочитаем осторожность возможностям», — заявили в компании.
Эксперты отмечают, что это шаг к «агентному ИИ», где модели не просто отвечают на вопросы, а самостоятельно решают задачи. WIRED приводит пример: агент может спланировать свидание, проверив календарь и забронировав столик, или создать отчёт по финансовым данным Nvidia. Однако, как показывают тесты, сложные задачи могут занимать от 5 до 25 минут, и на старте агент не поддерживает покупки или внешние API.
По данным OpenAI, модель показывает впечатляющие результаты:
- 41.6% на тесте Humanity’s Last Exam (в два раза лучше предыдущих моделей)
- 27.4% на FrontierMath при использовании инструментов (против 6.3% у o4-mini)
Компания классифицировала модель как «высокие возможности» в биологической и химической сферах, внедрив дополнительные меры безопасности, включая мониторинг в реальном времени.
OpenAI обещает дальнейшие обновления, включая интеграцию памяти и расширение инструментов. Это может усилить конкуренцию с Microsoft Office и Google Workspace, особенно учитывая партнёрство OpenAI с Microsoft. Пока что агент доступен только в США для Pro-пользователей, но глобальный роллаут ожидается в ближайшее время.
Что касается доступов:
- Pro — 400 запросов в месяц
- Plus и Team — 40 запросов в месяц
- Enterprise и Education — позже летом
Функция памяти временно отключена для предотвращения атак через инъекции промптов.
Этот запуск подчёркивает эволюцию ChatGPT от простого чат-бота к универсальному инструменту продуктивности, который может изменить подход к работе и повседневным задачам. Подробности доступны на официальном сайте OpenAI и в отчётах TechCrunch и WIRED.
Если вы уже пробовали ChatGPT Agent, поделитесь впечатлениями — как он справляется с вашими задачами?