OpenAI: vídeos "hiperrealistas" a partir de texto chegam em 2024

14 março 2024

Numa entrevista dada ao The Wall Street Journal, a CTO da OpenAI, Mira Murati, referiu que o Sora, plataforma de Inteligência Artificial (IA) capaz de transformar texto em vídeo, estará disponível até ao final do ano de 2024, sendo que ainda “pode levar alguns meses”, tal como cita o The Verge.

Murati referiu, ainda, que deverá estar para breve o acrescento de som à plataforma Sora, da OpenAI. Recorde-se que a empresa mostrou o Sora, pela primeira vez, no mês de fevereiro. Ainda que este tenha sido inicialmente disponibilizado a artistas visuais e designers, as suas capacidades acabaram por circular, por exemplo, no X.

De acordo com o The Verge, as transformações são “hiperrealistas”, sendo que, como referido anteriormente, se pretende acrescentar o som em breve, para que o produto final seja ainda mais real.

Os utilizadores vão poder editar o conteúdo dos vídeos do Sora

Sora Copilot — Imagem Ilustrativa (via Copilot IA)

Para além disso, a OpenAI deseja que os utilizadores tenham a possibilidade de editar o conteúdo dos vídeos criados pelo Sora. Isto porque nem sempre as ferramentas de Inteligência Artificial criam representações fidedignas, face àquilo que é desejado.

Uma das perguntas que o The Wall Street Journal colocou e que acabou por não ser respondida foi: que dados foram utilizados para treinar o Sora? Sobre o assunto, Murati não deu grandes detalhes. Apenas referiu que todos os dados estavam disponíveis publicamente e eram devidamente licenciados.

Ainda sobre a plataforma, a CTO da OpenAI assegura que o Sora é “muito mais caro” para alimentar. De qualquer forma, tal como refere o The Verge, o objetivo é tentar que os custos sejam “semelhantes” ao DALL-E, plataforma de IA de texto para imagem da marca.

Em baixo, podes ter alguns vislumbres do potencial que o Sora irá ter, em breve. É esperado que a ferramenta de conversão de texto para vídeo seja disponibilizada ao público até ao fim do ano de 2024.

Watch on YouTube

De forma a diferenciar de vídeos reais, o Sora terá marcas d’água

Na entrevista ao The Wall Street Journal, Murati deixou a indicação de que “provavelmente” o Sora não vai ser capaz de reproduzir a imagem de figuras públicas.

Tal como refere o The Verge, outra característica desta plataforma que converte texto para vídeo será a existência de marcas d’água, com o intuito de diferenciar os vídeos que são reais e os que são feitos através de IA.