A jovem Alexis “Lexi” Bogan, de 21 anos, precisou remover um perigoso tumor da parte posterior do seu cérebro em agosto do ano passado. Felizmente, Lexi recuperou-se da cirurgia com saúde. Infelizmente, ela perdeu a sua voz neste processo. Agora, graças a recursos de Inteligência Artificial (IA), ela encontrou um novo meio de comunicar-se com sua própria voz.
Uma aplicação "devolveu" a voz a Lexi
A voz de Lexi era muito bonita. A jovem chegou a fazer parte do coral da sua escola. Em agosto do ano passado, ela precisou remover um tumor vascular do tamanho de uma bola de golfe que estava a pressionar o tronco cerebral e estava emaranhado nos vasos sanguíneos e nos nervos cranianos.
Durante a recuperação, ao retirar o tubo respiratório, Lexi percebeu que tinha grande dificuldade para falar. Infelizmente, a localização e a gravidade do tumor, juntamente com a complexidade da cirurgia de 10 horas prejudicaram o seu controle sobre os músculos da língua e as cordas vocais, impedindo a capacidade de comer e falar, conforme explicou a neurocirurgiã pediátrica Dra. Konstantina Svokos, do grupo hospitalar Lifespan de Rhode Island.
A vida de Lexi voltaria a mudar quando a equipa do hospital a convidou para ser a paciente piloto para experimentar a nova tecnologia Voice Engine da OpenAI, capaz de clonar vozes. O sistema de IA foi treinado a partir de um vídeo antigo no qual a jovem explicava como fazer uma salada de macarrão. Embora tivesse apenas 15 segundos, o vídeo foi o suficiente para que a tecnologia conseguisse clonar o tom e as inflexões da voz de Lexi.
Em abril deste ano, os médicos equiparam a paciente com uma aplicação para telemóvel personalizada. Ela digita algumas palavras ou frases no seu smartphone e a app lê instantaneamente em voz alta. O sucesso do experimento fez com que Lexi tornasse-se uma das primeiras pessoas – a única com sua condição – a conseguir recriar uma voz perdida com o Voice Engine da OpenAI.
Nada de voz robótica
Um dos maiores avanços da nova tecnologia é proporcionar uma voz que não fique robótica e artificial, mas que seja um clone quase perfeito que devolva parte da identidade do paciente.
“É quase como se uma parte da minha identidade tivesse sido tirada quando perdi a voz. [...] Acho incrível poder ter aquele som novamente. [...] Ajudou a aumentar a minha confiança para onde estava antes de tudo isso acontecer”, disse Lexi, numa entrevista à página APNews.
Atualmente, a jovem já utilizou a tecnologia para tarefas do quotidiano, como mandar vir comida ou falar ao telefone, e até para conversar com as crianças da pré-escola onde trabalha como professora auxiliar. Nesta altura, ela digitou “ha ha ha ha” e esperou uma resposta robótica. Para sua surpresa, parecia sua risada antiga.
Os riscos e o potencial do Voice Engine
Com o avanço das ferramentas capazes de clonar vozes, como o Voice Engine, especialistas alertam sobre os riscos da utilização dessa tecnologia para fraudes, como golpes ou até criação de fake news nos períodos eleitorais.
A utilização que a equipa de médicos do grupo hospitalar Lifespan de Rhode Island fez da tecnologia parece justificar sua existência, com o potencial de ajudar muitos outros pacientes que tenham sofrido com acidentes vasculares cerebrais debilitantes, cancro da garganta ou doenças neurogenerativas.
“Esperamos que a Lexi seja pioneira à medida que a tecnologia se desenvolve”, disse o Dr. Rohaid Ali, residente de neurocirurgia na Faculdade de Medicina da Universidade Brown e no Hospital Rhode Island, numa entrevista ao APNews.
Como medida de segurança, a OpenAI não disponibilizou o Voice Engine publicamente e está a agir com cautela na expansão do uso da ferramenta.
“Queremos ter a certeza de que todos cuja voz é utilizada no serviço consentem continuamente. Queremos ter a certeza de que não será utilizado em contextos políticos. Portanto, adotamos uma abordagem muito limitada em relação a quem fornecemos a tecnologia”, disse Jeff Harris, líder do produto da OpenAI.
De acordo com Harris, o próximo passo da OpenAI é desenvolver um recurso de segurança de “autenticação de voz” que possibilite que os utilizadores repliquem apenas a sua própria voz.