Microsoft anunció que la tasa de error de su tecnología de reconocimiento de vozdisminuyó, logrando igualar a la humana.
El objetivo de la compañía es que mediante dicha tecnología se pueda crear una inteligencia artificial más robusta.
El año pasado la empresa anunció la creación de un programa que permite transcribir el contenido de una llamada o incluso mejorar el trabajo de un equipo humano.
Para ese entonces, la firma registró una tasa de error de 5,9 por ciento en las palabras empleadas en su sistema de reconocimiento de voz. Ahora, según informó Xuedong Huang, investigador de Microsoft, la empresa logró reducir el error al 5,1 por ciento.
Alcanzar este porcentaje permitirá a los usuarios hablarle a su computador y/o a su teléfono inteligente con mayor facilidad.
“Investigaciones que hemos realizado han demostró que los seres humanos alcanzan niveles de error más altos en las palabras que pronuncian con más cuidado y esfuerzo”, añadió Huang.
El porcentaje de error ha disminuido un 12 por ciento, en comparación con el de 2016, debido a que la compañía implementó varias mejoras en las redes neuronales de los modelos acústicos y de lenguaje.
Además, incrementaron el enfoque para combinar las predicciones de los modelos de palabras y a su vez de texto, permitiendo que el modelo se adapte a los temas y contextos de cada diálogo.
Microsoft calificó este avance como un hito en la historia de esta tecnología y así poder mejorar servicios como Cortana, Presentation Translator y Microsoft Cognitive Services.
“Alcanzar la paridad humana con una exactitud ha sido un objetivo de investigación durante los últimos 25 años. La disposición de Microsoft en invertir en investigación a largo plazo ahora está pagando dividendos a nuestros clientes en productos y servicios”, agregó Xuedong Huang.