• 23/12/2024

Microsoft usa ChatGPT para investigar la interacción entre humanos y robots

El objetivo de la investigación es ver si ChatGPT puede pensar más allá del texto y razonar sobre el mundo físico para ayudar con las tareas de robótica
27/02/2023 - 08:14hs
Microsoft usa ChatGPT para investigar la interacción entre humanos y robots

Microsoft anunció que está investigando el modo en que se producen las interacciones entre humanos y robots, utilizando para ello la tecnología de inteligencia artificial ChatGPT en estas máquinas.

Desarrollado por OpenAI, ChatGPT tiene capacidad para generar y enlazar ideas, así como para recordar conversaciones.

En el último mes, la compañía fue integrando esta tecnología en sus diferentes servicios, comenzando con Azure OpenAI Service a mediados de enero, para llevarla después a su motor de búsqueda Bing y su navegador Edge.

Su última iteración se ha materializado en la vista previa del nuevo Bing basado en inteligencia artificial en las aplicaciones para móviles y en su navegador Edge, así como la versión del motor de búsqueda para Skype.

Ahora, el fabricante tecnológico adelantó que está probando esta tecnología en robots, para "hacer posibles las interacciones naturales" con humanos y ha explicado qué es lo que espera de esta integración.

"Nuestro objetivo con esta investigación es ver si ChatGPT puede pensar más allá del texto y razonar sobre el mundo físico para ayudar con las tareas de robótica", ha comentado Microsoft en un comunicado, donde ha matizado que busca "ayudar a las personas a interactuar con los robots más fácilmente, sin necesidad de aprender lenguajes de programación complejos ni detalles sobre sistemas robóticos".

Microsoft señaló que el objetivo de la investigación es ver si ChatGPT puede pensar más allá del texto

En este sentido, ha establecido como desafío enseñar a este chatbot a resolver problemas teniendo en cuenta factores como el contexto del entorno operativo y el modo en que "las acciones físicas pueden cambiar el estado del mundo".

La empresa señala que este producto de OpenAI tiene capacidades para llevar a cabo tareas por sí mimo, pero que ha desarrollado una serie de principios de diseño que se pueden utilizar para guiar los modelos de lenguaje hacia la resolución de tareas de robótica.

Por otra parte, ha indicado que ChatGPT puede "desbloquear un nuevo paradigma de la robótica", en la que habitualmente se suceden procesos lentos, costosos e ineficientes de reescritura del código del comportamiento del robot.

De esa forma, este chatbot tiene la capacidad de brindar comentarios de alto nivel al denominado modelo de lenguaje extenso o de gran tamaño (LLM, por sus siglas en inglés), a la vez que monitoriza el rendimiento del robot y generar código para diferentes escenarios de robótica.

"Lo que está pasando a nuestro alrededor es real e irreal a la vez": cosas del día a día que nos costará distinguir si tienen detrás a una IA

Cómo funciona el modelo de Microsoft que incluye ChatGPT

Para impulsar el LLM, Microsoft construyó una serie de principios de diseño destinados a escribir indicaciones para tareas de robótica. Para ello definió un conjunto de interfaces de programación de aplicaciones (API) robóticas.

Una vez escrito el mensaje de texto para que ChatGPT lo interprete, en el que se describe el objetivo de la tarea que debe realizar la máquina, se indica explícitamente lo que debe hacer, lo que no debe hacer o cómo el chatbot debe formular sus respuestas.

El desarrollador o ingeniero aguarda la respuesta o salida del código de ChatGPT utilizando un simulador y, si es necesario, utiliza lenguaje natural para evaluar a la IA sobre la calidad y la seguridad de sus contestaciones.

Una vez el modelo haya respondido del modo deseado y la solución es viable, se implementa en el robot el código final del chat de inteligencia artificial.

Los desarrolladores también optaron por atribuir a estos robots objetivos como encontrar objetos

La compañía tecnológica compartió una serie de experimentos para mostrar cuáles son las acciones a las que pueden responder los robots utilizando el modelo desarrollado por OpenAI.

En primer lugar, le hizo saber los pasos que han de segurise para controlar un dron real y este supo escribir estructuras de código complejas, como un patrón en zigzag para visualizar las baldas de una estantería.

ChatGPT también se utilizó con el simulador Microsoft AirSim, un escenario en el que el modelo "pudo analizar la intención del usuario" y las señales detalladas para controlar un dron con precisión.

Bing ha llegado a tener hasta una crisis existencial en una conversación con un usuario.

Este lenguaje se probó, incluso, en un escenario de manipulación con un brazo robótico. Tras analizar las directrices, ChatGPT supo encadenar una serie de habilidades aprendidas para, entre otras actividades, apilar bloques de madera.

Los desarrolladores también optaron por atribuir a estos robots objetivos como encontrar objetos, mediante funciones de detección. Asimismo, realizó experimentos adicionales para evaluar si el chatbot puede decidir dónde dirigir a la máquina en función de lo que debía buscar.