A Waymo é, provavelmente, a principal empresa de ‘robotaxis’ verdadeiramente funcionais, com serviços de transporte já em funcionamento em áreas limitadas a algumas áreas e cidades dos EUA.
A empresa, que nasceu como parte de uma ideia da Google para o desenvolvimento de um carro autónomo, acaba de anunciar um novo projeto que utiliza a tecnologia de IA Gemini para proporcionar às suas viaturas a tomada de decisões ao nível das trajetórias a seguir.
O projeto tem como base um novo modelo de treino denominado End-to-End Multimodal Model for Autonomous Driving (EMMA), criado a partir de modelos LLM do Gemini, em concreto o multimodal large language model (MLLM) da Google.
Decisões mais inteligentes
O novo projeto da Waymo foi apresentado através de um documento que detalha a forma como a tecnologia do Gemini poderá melhorar o funcionamento dos ‘robotaxis’.
De acordo com informações do The Verge, esse documento começa por detalhar como os sistemas de condução autónoma desenvolveram componentes para funções específicas - por exemplo, perceção, mapeamento, planeamento e previsão.
Uma vez que o histórico destes componentes revelou alguns problemas na comunicação entre eles e, por consequência, na adaptação a novos ambientes, os modelos de linguagem como o da Gemini permitem adicionar mais ‘conhecimento’ e uma capacidade de raciocínio superior.
Traduzido para a realidade dos serviços da Waymo, a ideia é que os seus veículos autónomos deixem de limitar a sua ação a áreas e cidades concretas, bem delimitadas, passando a poder operar em áreas adicionais, usando os algoritmos para gerar decisões ‘inteligentes’ sobre trajetórias e formas de evitar obstáculos.
Com esta nova solução baseada em tecnologia do Google Gemini, a Waymo pretende dar o passo seguinte no aperfeiçoamento dos seus veículos autónomos, adicionando-lhes capacidades de ‘pensarem’ como um condutor, reproduzindo o raciocínio humano.