ChatGPT ganha agente revolucionário que navega na web e cria apresentações

OpenAI lançou recentemente o ChatGPT Agent, uma nova funcionalidade que permite a IA da companhia executar tarefas multi-passos controlando seu próprio navegador. Essa atualização combina as capacidades das ferramentas Operator e Deep Research, permitindo que o ChatGPT navegue em sites, execute códigos, ecrie documentos, além de planejar refeições ou atualizar planilhas financeiras.
O sistema usa uma combinação de browsers web, terminal e conexões de API para completar as tarefas. O ChatGPT Agent executa suas ações em um ambiente virtual privado, sem acesso ao dispositivo do usuário. A IA pode ser interrompida a qualquer momento ou ter o controle assumido pelo usuário.
- Criação de apresentações PowerPoint
- Planejamento de refeições
- Atualização de planilhas financeiras
- Navegação em sites e pesquisa
Apesar das promessas, o ChatGPT Agent ainda enfrenta limitações. Em testes, a IA teve dificuldade para executar tarefas complexas que exigem cadeias longas de ações. No entanto, em benchmarks específicos, o sistema alcançou desempenho superior a outros modelos de IA.
Para garantir segurança, o ChatGPT Agent inclui proteções contra ataques de prompt injection e exige confirmação do usuário para ações críticas. O recurso está disponível apenas para assinantes Pro, Plus e Enterprise, com planos para chegar ao mercado europeu em breve.