OpenAI revela avances en tecnología que imita la voz humana de forma convincente

Foto referencial: PickPik.

OpenAI ha generado revuelo en el ámbito de la inteligencia artificial al presentar las primeras pruebas de una función capaz de leer palabras en voz alta con un tono humano convincente. Esta nueva frontera tecnológica abre posibilidades emocionantes, pero también despierta el fantasma de las falsificaciones profundas.

La compañía ha compartido demostraciones y casos de uso de una versión preliminar a pequeña escala de su modelo de texto a voz, denominado Voice Engine, con un grupo limitado de 10 desarrolladores hasta la fecha, según un portavoz. OpenAI optó por no realizar un lanzamiento más amplio de la función, sobre la que se informó a la prensa a principios de este mes.

Preocupaciones éticas y riesgos políticos

Un portavoz de OpenAI explicó que la decisión de limitar el acceso a la tecnología se tomó tras recibir comentarios de diversos actores sociales, incluyendo políticos, expertos de la industria, educadores y artistas. En un principio, la empresa había planeado ofrecer la herramienta a 100 desarrolladores mediante un proceso de solicitud.

“Reconocemos que generar un discurso que se asemeje a las voces de las personas tiene serios riesgos, especialmente relevantes en un año electoral“, escribió la compañía en una publicación de blog publicada el viernes. “Estamos colaborando con socios estadounidenses e internacionales de diversos sectores como gobierno, medios de comunicación, entretenimiento, educación y sociedad civil para asegurarnos de que sus opiniones sean tomadas en cuenta durante el desarrollo de esta tecnología”.

Ejemplos previos de falsificaciones de voz

El uso de la inteligencia artificial para falsificar voces ya ha tenido precedentes. En enero, una llamada telefónica falsa con la voz, aparentemente real, del presidente Joe Biden instaba a los ciudadanos de New Hampshire a no votar en las primarias, un incidente que avivó los temores sobre el uso de la IA en el contexto de elecciones cruciales.

Tecnología innovadora con aplicaciones diversas

A diferencia de los modelos previos de OpenAI para generar contenido de audio, Voice Engine destaca por su capacidad de crear discursos que imitan a la perfección la voz de personas específicas, incluyendo su cadencia y entonación particulares. El software solo necesita 15 segundos de audio grabado de la persona para recrear su voz con precisión.

En una demostración de la herramienta, Bloomberg pudo escuchar un clip del director ejecutivo de OpenAI, Sam Altman, explicando la tecnología con una voz indistinguible de su discurso real, pero completamente generada por IA.

“Con la configuración de audio adecuada, el resultado es una voz de calidad humana“, comentó Jeff Harris, líder de producto de OpenAI. “Es un logro técnico realmente impresionante”. Sin embargo, Harris reconoció que “existe una gran sensibilidad en torno a la capacidad de imitar con tanta precisión el habla humana”.

Aplicaciones positivas y beneficios sociales

Entre los socios de OpenAI que ya están utilizando la herramienta se encuentra el Instituto de Neurociencias Norman Prince del sistema de salud sin fines de lucro Lifespan. Este instituto está empleando la tecnología para ayudar a pacientes a recuperar la voz. Un ejemplo de ello es el caso de una joven que perdió la capacidad de hablar con claridad debido a un tumor cerebral. La herramienta se utilizó para restaurar su voz a partir de una grabación anterior de un proyecto escolar, según la publicación del blog de la compañía.

El modelo de voz personalizado de OpenAI también tiene la capacidad de traducir el audio generado a diferentes idiomas, lo que lo convierte en una herramienta útil para empresas del sector del audio como Spotify Technology SA. De hecho, Spotify ya ha utilizado la tecnología en un programa piloto para traducir podcasts de presentadores populares como Lex Fridman. OpenAI también ha destacado otras aplicaciones beneficiosas de la tecnología, como la creación de una mayor variedad de voces para contenido educativo infantil.

Con información de Bloomberg Línea.

Previous Article
Exxon Chevron

Exxon y Cnooc se unen contra Chevron por la adquisición de Hess

Next Article
Coca-Cola lata

Por qué estos tres países son los únicos del mundo donde no se vende Coca-Cola

Related Posts