Microsoft lleva a Word una de las funciones que más esperabas y deseabas
Los asistentes de voz son la mejor prueba de que la tecnología de reconocimiento oral ha avanzado mucho. También hay software capaz de transcribir con eficacia. Como la herramienta de grabadora presente en los Google Pixel, que hace este trabajo muy bien. Aunque solo permite transcribir en inglés.
Pero una de las herramientas dónde tiene más sentido un transcriptor es un procesador de textos. Microsoft ha anunciado la incorporación a Word de un sistema de transcripción de audio. Este viene acompañado de un herramienta de dictado que permite no solo escribir. También logra que podamos activar las opciones de Word con comandos de voz.
La herramienta de transcripción ya está disponible para los usuarios de las versiones pagas de Office. Desde Microsoft indican en una conferencia de prensa en la que participó iProfesional que solo está disponible para transcribir inglés estadounidense. Aunque la empresa asegura que trabaja en otros idiomas.
Otra limitación más: sólo es posible transcribir cinco horas de audio mensuales. Además los archivos de audio que se suban cada vez deben tener un peso máximo de 200 MB. Para usar la función de transcripción debemos cargar la versión online de Word, no es posible hacerlo con la de escritorio por el momento.
Eso sí, la empresa asegura que la transcripción llegará a la versión para teléfonos móviles antes de finales de año. Aunque no ha establecido una fecha para su llegada a la versión para ordenador mediante una actualización.
Como puede verse en el video, una de las cosas interesantes que ofrece esta nueva función es editar las transcripciones de audio en las que hablan varias personas.
Habrá que ver el grado de precisión que logra alcanzar esta herramienta, sobre todo en idiomas que no sean el inglés, para ver su utilidad. Aunque seguramente sea necesario repasar el texto para evitar fallos. También habrá que comprobar hasta que punto es capaz de detectar pausas para introducir puntos o comas.
Servicios en la nube informática
Para implantar esta función Microsoft ha usado su servicio de inteligencia artificial en la nube Azure Cognitive Services. Aunque la empresa no ha dado detalles sobre cómo funciona el servicio, la limitación de las actuales tecnologías de transcripción, o de traducción de conversaciones en tiempo real, parece estar relacionado con un problema de procesamiento de datos.
Debido a que la traducción del audio se realiza en computadoras conectadas en remoto, un sistema similar al de la plataforma de videojuegos online Stadia de Google, es probable que Microsoft y Google se enfrenten a un problema serio: mantener una infraestructura costosa.
Si las tecnologías de transcripción de audio y traducción en tiempo real se popularizaran, como seguramente suceda a corto o medio plazo, las empresas que entren en ese terreno deberán hacer inversiones para ampliar sus sistemas de computación en la nube. Y lo más importante: lograr amortizar esa inversión.
Algo que se puede lograr suscribiéndose a un software, como en el caso de Microsoft Office con el modo transcripción, o bien ofreciendo este servicio como un complemento a un producto. Como es el caso de los auriculares Pixel Buds de Google, que ofrecen un modo intérprete para traducir conversaciones.