Xiaomi Own My Voice: a tecnologia de voz para ajudar as pessoas com distúrbios da fala

Rui Bacelar

23 maio 2022, 13:02

Tempo de leitura: 4 min.

A Xiaomi deu agora a conhecer a sua tecnologia de voz para ajudar as pessoas com distúrbios da fala. Mais concretamente, o projeto "Own My Voice" permite que os recetores de voz possuam vozes únicas e personalizadas.

Esta é uma das mais recentes apostas da Xiaomi, uma empresa de eletrónica de consumo e fabrico inteligente com smartphones e hardware inteligente ligado a uma plataforma IoT no seu núcleo. Agora, a tecnológica acaba de revelar a sua mais recente aplicação de algoritmos avançados e tecnologia de voz auto desenvolvida para o campo da acessibilidade.

Xiaomi revela nova tecnologia de Text-To-Speech

A tecnologia Text-To-Speech de estilo espontâneo, desenvolvida pelo Xiaomi AI Lab, é utilizada para gerar uma voz única e personalizada para um utilizador com perturbações da fala.

O utilizador pode agora comunicar com outros utilizando "a sua própria voz". Isto em vez de uma típica voz eletrónica geralmente monótona. Assim, como parte do projeto de pré-investigação "Own My Voice" liderado pelo Comité Técnico da Xiaomi, esta tentativa bem-sucedida demonstra o empenho da Xiaomi na "Tecnologia para o Bem". De igual modo, visa alcançar a sua missão de "deixar que todos no mundo desfrutem de uma vida melhor através de tecnologia inovadora".

Tecnologia Text to Speech desenvolvida pelo Xiaomi AI Lab

A Xiaomi preocupa-se com as pessoas e esforça-se por satisfazer as suas necessidades através da inovação tecnológica. Descobriu, aliás, o desejo de muitos utilizadores com distúrbios da fala em possuir as suas vozes únicas para a comunicação diária.

Para tal, criou a equipa do projeto "Own My Voice" para convidar um utilizador com distúrbios da fala como o recetor da voz. Zhu Xi, responsável do Comité Tecnológico sobre “Tecnologia para o Bem” da Xiaomi Corporation, disse: "Estamos entusiasmados por explorar os múltiplos valores que a inovação tecnológica nos traz, tais como responder às exigências dos utilizadores em relação à sua identidade e à construção da identidade".

Mais de 200 voluntários dentro da Xiaomi "doaram" a sua voz

De modo a gerar a voz mais adequada e personalizada para o destinatário, a equipa recrutou mais de 200 voluntários dentro da Xiaomi para doarem as suas vozes. Em seguida, utilizaram o algoritmo de correspondência de vozes para fazer corresponder as características das vozes doadas pelos voluntários com as da voz do destinatário.

Assim sendo, através desta abordagem, encontraram a voz mais adequada como o som básico de referência de voz para o destinatário. Em seguida, tendo em conta a personalização e proteção da privacidade, a voz real escolhida foi manipulada com modificações acústicas complexas para formar um som de voz novo e original.

No passo seguinte, utilizaram a tecnologia Text-To-Speech de estilo espontâneo para treinar o modelo AI. Aqui fazendo com que esta nova voz ganhasse gradualmente um ritmo natural e uma entoação capaz de expressar com verdade a emoção e o tom de um humano.

Em suma, o projeto "Own My Voice" combina uma variedade dos algoritmos mais avançados com a tecnologia de fala auto desenvolvida da Xiaomi para assegurar a especificidade, segurança e elevada genuinidade da voz sintetizada. Desse modo, criando uma ideia de síntese de fala personalizada para utilizadores com perturbações da fala.

O projeto emanou do Xiaomi AI Lab

A espinha dorsal deste projeto é um grupo de especialistas em tecnologia da fala do Xiaomi AI Lab. Este organismo, desde 2017, publicou 37 comunicações sobre a fala nas atas de conferências internacionais de topo.

Entre estas, destacamos a Conferência Internacional sobre Acústica, Discurso e Processamento de Sinal (ICASSP). Aliás, o sucesso de "Own My Voice" depende principalmente da tecnologia Text-To-Speech de estilo espontâneo desenvolvida por eles.

A tecnologia Text-To-Speech de estilo espontâneo torna a voz sintetizada como a de um verdadeiro ser humano na sua entoação, pausa, velocidade e outras características. Isto substitui a sensação monótona e antinatural da voz eletrónica por uma voz mais natural.

Assim, atualmente, esta tecnologia aplica-se a muitos dispositivos inteligentes equipados com Xiaoai, o assistente de voz AI da Xiaomi.

O projeto "Own My Voice" mostra que a tecnologia Text-To-Speech de estilo espontâneo também pode ser amplamente adotada em áreas de acessibilidade e melhorar a experiência do utilizador.

Zhu Xi acrescentou: "Se notarmos e abordarmos as necessidades dos grupos minoritários numa fase inicial, o processo de difusão da tecnologia poderá ser grandemente encurtado. Isto permite que os benefícios das novas tecnologias se tornem acessíveis aos utilizadores com necessidades especiais sem demora".

Seguindo em frente, a Xiaomi continuará a receber feedback do destinatário da voz e continuará a estudar a viabilidade deste projeto numa gama mais alargada.

Por fim, a Xiaomi continuará a capacitar a acessibilidade através de tecnologia de ponta, esforçando-se por satisfazer as diversas necessidades das pessoas através da inovação tecnológica.

Editores 4gnews recomendam:

MediaTek Dimensity 1050 é o novo chipset rival do Snapdragon 7 Gen 1 da Qualcomm
Xiaomi POCO C40 é o próximo smartphone barato e bom para 2022
Xiaomi une-se à Leica e define data para o novo flagship de 2022