Microsoft crea robot con capacidad de reconocimiento de voz similar al humano

Microsoft parece estar bien enfocado en su objetivo de crear robots con funciones similares a las humanas, es por ello que no es de extrañar escuchar que muchos de sus esfuerzos están centrados en esa área.

Recientemente, el equipo de la división de Inteligencia Artificial e Investigación de Microsoft acaba de publicar un documento en el que asegura “haber alcanzado un gran hito en el reconocimiento del habla conversacional”.

Esto se traduce a que, según los investigadores, su sistema de reconocimiento de voz alcanzó una tasa de error del 5,9%, cifra que está a la par de las capacidades humanas. O, dicho de otro modo, actualmente existen máquinas que transcriben como nosotros.

Para que tengamos una idea de los significativo que es esto, te explicamos que la tasa de error reportada por los investigadores de Microsoft, es equivalente a la de una persona capaz de transcribir la misma conversación.  Por si fuera poco, es la más baja registrada en los proyectos de reconocimiento de voz de toda industria.

Aplicaciones útiles en muestras vida

Quizás te estés preguntando ¡Ajá! ¿Y eso en qué nos afecta o nos ayuda? La respuesta es sencilla, más allá del logro en sí, que supone este gran avance; este paso facilita enormemente que el ser humano pueda comunicarse y hasta conversar con los ordenadores, ofreciendo no solo nuevos niveles de interacción sino también posibilidades tanto para uso diario como para las personas con dificultades localizadas.

Por otro lado, este es un paso importante para Microsoft, pues ya estaría en la capacidad de desarrollar robustos asistentes personales para competir con Google Home o Alexa de Amazon, quienes le están haciendo bastante competencia a la empresa del Bill Gate

Este nuevo logro llega apenas un mes después de que la compañía de Redmond reportara un récord mundial en este tipo de tareas, alcanzando una tasa de error del 6,3%.

Rozando la meta

El equipo de Inteligencia Artificial de Microsoft está trabajando para obtener un funcionamiento óptimo de su sistema de transcripción en situaciones de la vida cotidiana, como cuando hay mucho ruido en el ambiente y el reconocimiento de voz se puede complicar.

De igual manera, la compañía estaría contemplando la posibilidad de transcribir discursos producidos por varias personas a la vez, lo que sería muy interesante, pues el ordenador podría reconocer lo que dicen grandes grupos de usuarios por separado.

Con información de Agencias