Asistentes de voz: ¿qué pasa con la privacidad de nuestros datos?
El uso de asistentes de voz aumenta constantemente. Sin embargo, los beneficios y la conveniencia indiscutibles que la solución ha traído a nuestras vidas se han visto eclipsados por la creciente preocupación acerca de la privacidad y seguridad de los datos de los usuarios capturados, y de los riesgos del almacenamiento en la nube.
Todo el mundo está familiarizado con los asistentes de voz. En muchos hogares de todo el mundo, Alexa es prácticamente un miembro de la familia, y cada vez que los chicos quieren escuchar sus canciones favoritas, todo lo que tienen que hacer es preguntar a Alexa.
Los usuarios de iPhone conocen a Siri, los usuarios de teléfonos Android conocen el Asistente de Google. Y la lista continúa: está Bixby de Samsung, Cortana de Microsoft, HiVoice de Huawei, etc.
Sin embargo, el 97% de todos los usuarios de asistentes de voz eligen uno de los tres grandes: Alexa, Siri o Google Assistant. Los asistentes de voz están integrados en dispositivos inteligentes o suelen ser compatibles con otros equipos digitales, como televisores inteligentes, teléfonos móviles, etc.
Un ejemplo es la industria automotriz, donde casi todas las empresas de automóviles proporcionan su propio asistente de voz, una interfaz para Google Assistant y / o Siri, o integran Alexa directamente.
Actualmente, se utilizan 4.200 millones de asistentes digitales en el mundo, y se prevé que este número se duplique para 2024. Esto lo ha hecho posible la inteligencia artificial. El auge del asistente de voz coincidió con el auge de la inteligencia artificial en la década de 2010, y recibió un gran impulso en 2011, con un gran éxito comercial y de marketing tras el lanzamiento de Siri de Apple.
El aprendizaje automático (Machine Learning) no solo ha mejorado significativamente el reconocimiento de palabras individuales también ha mejorado en el campo del procesamiento del lenguaje natural (PNL), lo que significa que ya no se necesita usar palabras específicas y construir oraciones de una manera específica, sino que se puede interactuar con el sistema de forma natural.
Preocupaciones sobre la privacidad y la protección de datos
A pesar de su gran éxito, los asistentes de voz más importantes del mundo se enfrentan hoy un enorme desafío: todos se ejecutan en los entornos cloud de sus proveedores, lo que significa que todos los datos se envían a esas respectivas nubes.
Esta situación genera gran preocupación en los usuarios, alegando que los proveedores pueden analizar y utilizar sus datos, de gran valor para los gigantes tecnológicos, para sus propios fines.
Los asistentes de voz utilizan varios componentes. Por lo general, la interacción comienza con una palabra de activación. El asistente de voz no intenta comprender lo que dice el usuario hasta que se reconoce la palabra de activación: "Alexa", "Hey Audi", etc.
El siguiente paso es el reconocimiento de voz, donde el sistema, en pocas palabras, convierte un flujo de audio entrante en texto escrito. Finalmente, el sistema intenta comprender su oración con Procesamiento del Lenguaje Natural (NLP). Todos estos pasos se basan en técnicas de Machine Learning / Deep Learning.
Las aplicaciones de aprendizaje automático tienen la gran ventaja sobre otras en que pueden generalizar aprendiendo de los datos de entrada. Su reconocimiento de voz es de una calidad excepcional porque aprende el significado de los comandos, en lugar de solo un conjunto fijo de expresiones. Está capacitado para comprender el idioma en sí y luego aprende más específicamente a partir de datos relevantes para casos de uso.
Incluso podemos incluir ruidos de fondo típicos en el proceso de aprendizaje, lo que permite que el sistema también los tenga en cuenta y, al hacerlo, mejore aún más la calidad general de nuestro sistema. ¡Imaginá un asistente de voz que puede identificar e ignorar los ruidos de los vehículos que interfieren y reducir enormemente los errores de reconocimiento!
Cualidades necesarias
Ahora bien, ¿qué cualidades debe tener un asistente de voz para ser seguro, eficiente y bien aceptado por los usuarios? Debe ser una solución independiente, que se ejecute en forma local y sin conexión en un dispositivo, sin necesidad de conexión a Internet ni a la nube.
- Que esté construido como un marco fácil y altamente adaptable; que no sea un enfoque "único para todos", sino una combinación de módulos reutilizables que se puedan ajustar a las necesidades de los clientes; por ejemplo, admitir diferentes idiomas, una palabra de activación personalizada, robustez a los ruidos de fondo dependientes del uso, y entrenado en datos típicos para los casos de uso necesarios.
- Que la interacción se sienta natural; que comprenda diversas frases y expresiones
- Respetar la privacidad de los datos; integrarse fácilmente en los servicios, adaptándose perfectamente al caso de uso para garantizar un rendimiento de alta calidad.
(*) Jefe global de inteligencia artificial en intive automotive