ElevenLabs lança ferramenta de inteligência artificial que pode clonar a sua voz em até 30 idiomas

ElevenLabs lança ferramenta de inteligência artificial que pode clonar a sua voz em até 30 idiomas

A ElevenLabs, empresa especializada em tecnologia de inteligência artificial, lançou uma nova plataforma de IA que pode trabalhar de maneiras impressionantes com áudio, mais especificamente com a voz do usuário.

A plataforma, que saiu recentemente da fase beta, é capaz de clonar a voz humana em até 30 idiomas diferentes. Isso é possível graças ao modelo de IA Multilingual v2, que não apenas detecta automaticamente o idioma do texto, mas também gera uma voz com nuances emocionais específicas de cada língua.

Leia também
O que é deepfake e por que é tão perigoso?
Voicebox é a nova ferramenta IA da Meta que recria a voz do usuário rapidamente

Como funciona o serviço?

Multilingual V2

O processo para clonar a voz é surpreendentemente simples e acessível. Os usuários precisam apenas enviar algumas amostras de fala para a plataforma. A partir daí, a ElevenLabs oferece dois tipos de serviços de clonagem de voz: um voltado para a conversão de texto em fala e outro, denominado “VoiceLab”, projetado para simular vozes específicas.

Com essas duas opções, o usuário pode, por exemplo, escrever um texto e fazer com que ele seja lido com a sua própria voz. Já a função “VoiceLab” permitirá usar vozes famosas, como de atores ou políticos.

Mati Staniszewski, CEO e cofundador da ElevenLabs, expressou otimismo sobre o potencial da nova ferramenta. Segundo ele, a tecnologia tem o poder de colocar criadores de conteúdo em pé de igualdade com grandes estúdios. Através do Multilingual v2, eles podem produzir áudio de alta qualidade em múltiplos idiomas sem a necessidade de estúdios de gravação ou dubladores profissionais.

Com este lançamento, estamos um passo mais perto de tornar esse sonho uma realidade e tornar as vozes de IA de qualidade humana disponíveis em todos os dialetos. Nossas ferramentas de geração de texto para fala ajudam a nivelar o campo de jogo e trazem recursos de áudio falado de alta qualidade para todos os criadores lá fora“, disse o CEO da empresa.

Preocupações com deepfakes e desinformação

No entanto, a novidade não está isenta de controvérsias. Há preocupações éticas e morais significativas relacionadas ao potencial uso indevido da clonagem de voz. A empresa já tomou medidas preventivas, como limitar o acesso à clonagem de voz a contas pagas e implementar ferramentas de detecção baseadas em IA para mitigar riscos.

Em teoria, isso deve ser o suficiente para evitar casos de deepfakes envolvendo discursos de ódio ou desinformação.

A ElevenLabs também tem planos ambiciosos para o futuro. A empresa pretende introduzir um mecanismo que permita aos usuários compartilhar vozes na plataforma, abrindo novas oportunidades para colaborações entre humanos e IA.

Além disso, a empresa já está trabalhando em parcerias com diversos criadores de conteúdo e estúdios, incluindo desenvolvedores de jogos e plataformas de vídeo. Curiosamente, o inglês ainda não é um dos idiomas suportados. A empresa disse que vai incluir o inglês em breve, junto com outras línguas, como português, alemão, espanhol e francês.

Fontes: ElevenLabs via Android Headlines

Sobre o Autor

Cearense. 34 anos. Apaixonado por tecnologia e cultura. Trabalho como redator tech desde 2011. Já passei pelos maiores sites do país, como TechTudo e TudoCelular. E hoje cubro este fantástico mundo da tecnologia aqui para o HARDWARE.
Leia mais
Redes Sociais:

Deixe seu comentário

X