• 15/11/2024

Google crea un sistema que convierte el contenido de una fotografí­a a texto

La tecnología busca traducir imágenes complejas a un lenguaje natural con la ayuda de técnicas de reconocimiento visual artificial
19/11/2014 - 17:00hs
Google crea un sistema que convierte el contenido de una fotografí­a a texto

Google desarrolló un sistema capaz de describir el contenido de una fotografía en formato de texto y de manera automática, como parte de sus investigaciones en el campo de la inteligencia artificial.

La tecnología, que se encuentra en una fase inicial, busca traducir imágenes complejas a un lenguaje natural con la ayuda de técnicas de reconocimiento visual artificial y procesos de traducción.

"Hemos desarrollado un sistema de aprendizaje automático que puede producir subtítulos para describir con precisión imágenes en un primer vistazo", informaron los investigadores de Google a cargo del desarrollo.

Entre los beneficios de este software sus creadores destacaron la ayuda que podría representar a personas con discapacidad visual al ofrecer un texto descriptivo en las imágenes.

Además, podría facilitar las búsquedas en "Google Imágenes" al brindar mayor precisión en las descripciones de las escenas, según se explicó en el comunicado oficial, citado por la agencia Télam.

"Describir con precisión una escena compleja requiere una representación profunda de lo que está pasando en la escena, intenta capturar cómo los diversos objetos se relacionan entre sí y lo traduce todo al lenguaje de sonido natural", aseguraron.

Un ejemplo presentado en el estudio muestra una típica fotografía de un piloto de motocross en plena competencia, ante la cual el sistema generó el siguiente texto: "una persona corriendo en motocicleta en un camino de tierra".

Otro ejemplo es de dos pizzas, y el texto publicado fue "Dos pizzas encima de una tapa de la estufa del horno".

Los resultados no fueron todos correctos, según la selección que publicaron sus creadores, debido a que el sistema en ocasiones realiza interpretaciones inexactas de las escenas presentadas.

El generador de textos a partir de imágenes no tiene aun fecha de lanzamiento para uso público ni de una posible incorporación a Google Imágenes.

Temas relacionados