domingo. 21.04.2024
HERRAMIENTAS TECNOLÓGICAS

Voice Engine, la nueva inteligencia artificial de OpenAI que puede clonar la voz

Voice Engine, la nueva inteligencia artificial de Sam Altman, puede generar un habla con sonido natural para proporcionar asistencia de lectura, traducir contenido o mejorar la prestación de servicios en entornos remotos.

OPENAI-VOICE-01
Voice Engine es una inteligencia artificial que, con tan solo escuchar una voz durante 15 segundos, es capaz de crear una copia sintética.

OpenAI, la empresa de Sam Altman, se hizo popular en España con la llegada de ChatGPT en noviembre de 2022. Pero más allá de este chatbot con inteligencia artificial (IA), dicha entidad decidió ampliar su abanico de tecnologías y, en febrero de este año, lanzó Sora, una IA capaz de crear vídeos de hasta 60 segundos a partir de texto.

No obstante, para seguir creciendo a nivel empresarial y destacar en el ámbito de la inteligencia artificial, OpenAI presenta su nuevo proyecto llamado Voice Engine, un modelo que utiliza entrada de texto y una única muestra de audio de 15 segundos para generar un habla con sonido natural que se parece bastante al hablante original.

¿Qué es Voice Engine?

Voice Engine es una inteligencia artificial que, con tan solo escuchar una voz durante 15 segundos, es capaz de crear una copia sintética de dicha voz, imitando su tono.

OpenAI desarrolló por primera vez Voice Engine a finales de 2022 y lo utilizó para potenciar voces preestablecidas disponibles en la API de conversión de texto a voz, así como ChatGPT Voice y Read Aloud. Desde entonces, la empresa de Sam Altman está adoptando un enfoque cauteloso e informando para una "publicación más amplia debido al potencial de uso indebido de la voz sintética".

De acuerdo con el portal web 20 Bits, OpenAI espera "iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades", así pues, con base en estas conversaciones, tomará una "decisión más informada sobre si implementar esta tecnología a escala y cómo hacerlo".

¿Cómo se usa Voice Engine?

Para usar esta inteligencia artificial basta con una entrada de texto con la descripción de lo que deseamos y una muestra de audio de 15 segundos para crear un clip. Y, una vez hechos todos estos pasos, Voice Engine creará una voz similar a la humana.

Por otro lado, respecto a sus usos, OpenAI explica en su blog oficial que Voice Engine puede proporcionar asistencia de lectura, traducir contenido, mejorar la prestación de servicios en entornos remotos, ayudar a pacientes a recuperar su voz o apoyar a personas que no usen la comunicación verbal, entre otros.

¿Cuándo estará disponible Voice Engine?

Voice Engine todavía no está disponible para los usuarios, sin embargo, OpenAI ha decidido hacer una vista previa de esta tecnología en su blog oficial para destacar su potencial.

OPENAI-VOICE-02

Las medidas de seguridad de OpenAI

En el comunicado del blog oficial, OpenAI afirma que "los socios que prueban Voice Engine aceptan nuestras políticas de uso, que prohíben la suplantación de otra persona u organización sin consentimiento o derecho legal. Además, nuestros términos con estos socios requieren el consentimiento explícito e informado del hablante original y no permitimos que los desarrolladores creen formas para que los usuarios individuales creen sus propias voces.

Los socios también deben revelar claramente a su audiencia que las voces que escuchan están generadas por IA. Finalmente, hemos implementado un conjunto de medidas de seguridad, que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como un monitoreo proactivo de cómo se utiliza".

Voice Engine, la nueva inteligencia artificial de OpenAI que puede clonar la voz