NoticiasSoftware

NVIDIA crea un algoritmo IA para humanizar la entonación de la voz

Black Mirror no iba desencaminada cuando aseguraba un futuro robotizado, y es que NVIDIA ha presentado su algoritmo de IA cuyo fin es humanizar el habla de los bots. Lo ha hecho en la conferencia InterSpeech y os contamos los detalles de este avance.

No es la primera vez que NVIDIA muestra atención por la voz, y así lo hizo en el GTC de 2017 donde dio a conoce una voz IA que contaba historias. Es cierto que era algo muy mejorable porque hay que prestar atención a las pausas, las entonaciones y todo lo que hacemos mientras leemos. Con Flowtron buscaba mejorarlo, pero seguía sin estar cerca de dar el resultado.

Voces de bots más humanas, gracias al algoritmo IA de NVIDIA

En la conferencia de InterSpeech, NVIDIA ha querido asombrar con un algoritmo de inteligencia artificial cuyo fin es mejorar la entonación de la voz del bot. Este algoritmo mejora a los actuales y lo que se quiere hacer es «humanizar» la voz para que parezca más realista.

Hemos visto cómo la IA hace milagros con las imágenes y vídeos, y es que NVIDIA ya trabajó en un proyecto con otro algoritmo sobre generar rostros humanos mediante rostros existentes, algo que recuerda a Blade Runner y los replicantes. De hecho, ya trabajó anteriormente en Flowtron, pero fracasó dicho proyecto.

Ahora nos presentan un nuevo modelo, cuyos investigadores aseguran que la voz se puede «dirigir» para replicar la voz de un actor humano. Primero, se carga la información en el modelo de IA, el cual es moldeado según las variables que queramos.

Luego, la voz IA de NVIDIA imita a la de la fuente (actor), tal y como aprendemos nosotros a hablar desde que somos pequeños. Esto otorga la posibilidad al algoritmo para enfatizar sobre ciertas palabras con el fin de que le dé más énfasis o menos a la pronunciación: voz más alta o más suave.

Este algoritmo trae la novedad de que no solo puede imitar letras, sino que puede cantar, comunicarse con personas con discapacidades de habla, pronunciar texto naturalmente en videojuegos o desarrollar aplicaciones que nos permitan a nosotros (jugadores) hablar con otros personajes IA.

¿Los dobladores y actores van a tener menos trabajo? Parece ser que sí, siempre y cuando este proyecto prospere.

Te recomendamos los mejores micrófonos del mercado

¿Qué os parece esta novedad?

Ángel Aller

Graduado en Derecho y exabogado con Máster de Comercio internacional. Amante de la tecnología y geek inconformista. Leal a Alt+F4 como estilo de vida.
Los datos de carácter personal que nos facilite mediante este formulario quedarán registrados en un fichero de Miguel Ángel Navas Carrera, con la finalidad de gestionar los comentarios que realizas en este blog. La legitimación se realiza a través del consentimiento del interesado. Si no se acepta no podrás comentar en este blog. Puedes consultar Política de privacidad. Puede ejercitar los derechos de acceso, rectificación, cancelación y oposición en [email protected]
Botón volver arriba