Uma equipa de investigadores da Apple anunciou a criação de um novo modelo de inteligência Artificial (IA). Aquilo que a distingue dos seus principais concorrentes é a sua capacidade de compreender entidades presentes num ecrã.
Esta tecnologia irá assim "ver" e compreender referências ambíguas a entidades presentes num ecrã, bem como o seu contexto. O principal objetivo desta abordagem é permitir interações mais naturais com assistentes de voz.
ReALM é a IA da Apple capaz de perceber aquilo que o utilizador vê no ecrã do equipamento
Esta equipa de investigadores da Apple apelidou a sua recente descoberta de ReALM. Esta socorre-se de grandes modelos de linguagem para converter tarefas complexas de referência a resolução num problema de modelagem de linguagem pura.
"Ser capaz de compreender o contexto, incluindo referências, é essencial para uma assistente de conversação. Permitir que o utilizador faça perguntas sobre o que vê no ecrã é uma etapa crucial para garantir uma verdadeira experiência de viva-voz com assistentes de voz."
Conforme explica esta equipa da Apple, o objetivo passa por dotar a IA de ferramentas que lhe permitam ler e compreender o contexto daquilo que o utilizador está a ver no ecrã. Isto permite uma interação mais simples e eficaz, poupando ao utilizador a tarefa de ter de descrever em texto ou voz tudo aquilo que está a ver.
Os seus autores mostram-se bastante confiantes nas potencialidades do seu novo modelo de IA. Aliás, eles referem que a ReALM é capaz de superar o modelo GTP-4 neste tipo de tarefas.
Ainda assim, eles admitem que ainda existem algumas limitações nesta tecnologia. Em especial com referências visuais mais complexas como a distinção de várias imagens.
Para superar esta limitação, a Apple teria provavelmente de adotar técnicas mais complexas. Uma delas passaria pelo suporte multimodal para que a sua IA pudesse interagir com diferenças métodos de introdução de informação.
Este é um passo importante para a entrada da Apple no mundo da Inteligência Artificial. A empresa norte-americana está, atualmente, em desvantagem face às suas principais concorrentes pelo facto de ainda não ter incorporado esta tecnologia nos seus produtos.
Tim Cook, CEO da Apple, já afirmou que a empresa irá revelar mais sobre este tema ainda este ano. Com a conferência WWDC a acontecer no início de junho, esse poderá ser o palco escolhido pela empresa para apresentar o seu trabalho nesta área.