Enquanto várias tecnológicas apostam em Large Language Models (LLM) para explorar o potencial da IA na escrita e execução de código, a Google continua a desenvolver este tipo de tecnologias para simular tarefas básicas normalmente realizadas num browser.
O projeto, internamente designado por Project Jarvis, tem como objetivo criar um assistente virtual capaz de simular muitos dos procedimentos que os utilizadores realizam online.
A ideia da Google é continuar a disponibilizar aplicações que substituam as pessoas em tarefas mais ‘mundanas’ ou repetitivas. A empresa já tem ferramentas com este perfil associadas ao seu Workspace, por exemplo, para resumos e textos automáticos para o Gmail e Docs.
Navegar e fazer compras com um único comando
O ecossistema de serviços disponibilizados pela Google depende, em grande medida, da navegação online, independentemente do tipo de dispositivo a partir do qual as pessoas acedem.
Isto significa que este tipo de tarefas, por muito irrelevantes que possam parecer, acabam por ter um potencial de crescimento no negócio da empresa.
Informações avançadas pelo The Information dão conta de que a Google pretende assim disponibilizar ferramentas que permitam, com um comando, assumir o controlo de um computador, que passa a ser operado por esse assistente virtual.
A partir daí, a ideia é automatizar a navegação na Internet e realizar tarefas como comprar produtos ou reservar voos através do Chrome, por exemplo.
O artigo do The Information indica que estas novas ferramentas têm uma base de funcionamento semelhante à funcionalidade Recall, da Microsoft, apoiando-se no registo sucessivo de screenshots e na interpretação das imagens dos ecrãs para a tomada de decisões.
O chamado Project Jarvis poderá ser disponibilizado ainda em dezembro, quando estiver disponível a versão mais recente do Gemini LLM.