Al momento, las voces utilizadas por los asistentes virtuales disponibles en el mercado aún pueden sonar artificiales. Sin embargo, Google acaba de presentar una investigación donde asegura que pudo crear un sistema de lectura de texto a voz que tiene la virtud de imitar la entonación humana.
Denominado Tacotron 2, es la segunda generación de una tecnología desarrollada por Google, cuyo funcionamiento está basado en dos redes neuronales que interpretan el texto y aplican los efectos, pausas y entonaciones presentes en el documento junto a WaveNet, el software responsable de generar las voces de Google Assistant.
Entre las características más destacadas de Tacotron 2 está la capacidad de pronunciar nombres y palabras, distinguir signos de puntuación o si una parte del texto requiere ser remarcada con una entonación más destacada.
De hecho, Google puso a disposición las pistas de audio generadas de forma sintéticacon sus redes de inteligencia artificial junto a otras pistas relatadas por humanos, con un desempeño perfecto con palabras y frases complejas.
Por el momento Tacotron 2 se encuentra en una etapa de evaluación, disponible sólo en inglés y con una voz femenina, aunque se espera que Google entrenar en otros formatos, con una versión masculina y en otros idiomas. De esta forma, la compañía de Internet planea en el corto plazo perfeccionar aún más los sistemas guiados por voz como Assistant.