Американская организация OpenAI, занимающаяся разработками в области искусственного интеллекта, презентовала Operator — ИИ-агента, который взаимодействует с сайтами как человек и может выполнять различные задачи в интернете по требованию пользователя. Сообщение об этом появилось на сайте компании.
«Сегодня мы представили предварительный обзор исследования Operator, агент, который может выходить в Интернет, чтобы выполнять задачи для вас. Powering Operator — это Computer-Using Agent (CUA), модель, которая объединяет возможности зрения GPT-4o с передовыми рассуждениями посредством обучения с подкреплением», — говорится в сообщении OpenAI.
ИИ-агент может бронировать авиабилеты в интернете, подбирать товары, заказывать покупки, открывать нужные программы и сервисы, выполнять прочие задачи в интернете по желанию пользователя. В компании рассказали, что Operator обучен взаимодействию с графическими пользовательскими интерфейсами — кнопками, меню и текстовыми полями, которые пользователь видит на экране. Это даёт ему гибкость при выполнении цифровых задач без использования API.
Агент способен разбивать задачи на многошаговый план, адаптироваться и корректировать себя при возникновении сложностей. Разработчики заявили, что эта возможность «знаменует следующий шаг» в развитии искусственного интеллекта. По их словам, это позволит моделям использовать те инструменты, на которые люди полагаются ежедневно.
«Хотя CUA всё ещё находится на ранней стадии и имеет ограничения, он устанавливает новые передовые результаты эталонных тестов, достигая 38,1% успеха на OSWorld для задач полного использования компьютера и 58,1% на WebArena и 87% на WebVoyager для веб-задач», — заявили разработчики.
Ранее новые разработки в сфере ИИ представил Сбер. Глава правления компании Герман Греф рассказал президенту России Владимиру Путину об умных кольцах, которые работают с помощью нейросети GigaChat и могут принести пользу в области здравоохранения.