Operator: o agente da OpenAI

Já pensou em ter um assistente de IA que pode executar tarefas em seu nome sem exigir nenhuma entrada manual? Essa é a tendência no mundo da IA com o desenvolvimento de agentes baseados nos LLMs disponíveis.
O desenvolvimento mais recente desta tendência é o Operator, o primeiro agente lançado oficialmente pela OpenAI depois de muita especulação. Mas, se você esperava um agente revolucionário, talvez se decepcione. O Operator pode interagir com páginas da web e executar tarefas repetitivas do navegador com facilidade. Embora essas tarefas sejam importantes, elas não devem impressionar muito o mundo da IA.
O que é Operator?
O Operator é um novo agente de IA chamado Computer-Using Agent (CUA). Ele é diretamente alimentado pelos recursos de visão e raciocínio avançado do GPT-4o por meio de aprendizado por reforço. Essa tecnologia permite que o Operator “veja” e “interaja” com interfaces gráficas de usuário, permitindo que ele execute ações na web sem exigir integrações de API personalizadas.
Através destas capacidades, o Operator pode lidar com uma ampla gama de tarefas. Segundo a OpenAI, elas vão desde o preenchimento de formulários até a criação de memes. Tudo isso é feito usando seu navegador para interagir com páginas da web. A capacidade de usar as mesmas interfaces e ferramentas com as quais os humanos interagem amplia a utilidade da IA. Com isso, o uso do novo agente deve economizar tempo nas tarefas diárias. A novidade também promete abrir novas oportunidades de engajamento para as empresas.

Exemplo de interação do Operator com o navegador (fonte).
Principais Casos de uso
O Operator foi criado para acessar a web. Ele pode executar tarefas repetitivas do navegador com facilidade, como realizar pedidos ou criar memes. Os usuários podem personalizar seus fluxos de trabalho adicionando instruções, definindo preferências para sites específicos e salvando prompts para acesso rápido. O Operator também é multitarefas. Ou seja, ele pode executar várias tarefas simultaneamente, como interagir em diversas conversas.
Acesso limitado por enquanto
Disponível apenas para usuários pró dos Estados Unidos, o Operator está atualmente em uma prévia inicial da pesquisa. Embora ele já seja capaz de lidar com uma ampla gama de tarefas, ele continua aprendendo e pode cometer erros. O feedback antecipado dos usuários desempenhará um papel vital no aprimoramento de sua precisão, confiabilidade e segurança.
Parceria com grandes empresas
Apesar de o acesso à novidade ser restrito para os usuários comuns, a OpenAI já anunciou que está colaborando com empresas como DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber e outras para garantir o acesso ao Operator. Na prática, isso provavelmente significa que essas empresas estão negociando ($$) para aparecerem nos resultados das buscas do novo agente. Este anúncio está em linha com a guinada da OpenAI em busca de lucros. No entanto, do ponto de vista de avanços tecnológicos que beneficiem o público, o primeiro agente oficial da empresa parece ser apenas mais uma tecnologia criada para mostrar propaganda e buscar cliques.