• 21/11/2024

OpenAI sorprende con o1, su primera inteligencia artificial capaz de razonar

La nueva inteligencia artificial de OpenAI resuelve problemas complejos, y responde a preguntas simples con las que otros modelos de lenguaje fallaban.
13/09/2024 - 09:01hs
OpenAI lanza o1, su primera inteligencia artificial capaz de razonar

OpenAI anunció o1 y o1-mini, sus primeros modelos de inteligencia artificial (IA) con capacidad de razonamiento, que aprovechan la tecnología conocida internamente como Strawberry para resolver tareas complejas vinculadas con la ciencia, las matemáticas y la programación. Desde el viernes se encuentran disponibles en las versiones pagas de ChatGPT, y próximamente se incorporará la variante mini a la gratuita.

"En nuestras pruebas, la próxima actualización del modelo se desempeña de manera similar a la de los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología. También descubrimos que se destaca en matemáticas y programación. En un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que el modelo de razonamiento obtuvo una puntuación del 83 %", informó OpenAI sobre o1.

OpenAI lanzó o1 a modo de prueba, de modo que aún no integra el 100% de sus características a ChatGPT. Esto significa que todavía no puede ni lidiar con imágenes ni tampoco buscar información en la web. De todos modos, la empresa considera que esta nueva inteligencia artificial representa un gran salto en cuando a capacidades, y por eso decidieron darle el nombre o1.

La empresa publicó algunos vídeos con ejemplos que muestran a la nueva IA resolviendo problemas o instrucciones complejas, o incluso respondiendo a preguntas simples con las que otros modelos de lenguaje fallaban.

Por ejemplo, se puede ver a OpenAI o1 crear un videojuego desde cero a partir de una orden de texto, y también acertar cuando se le pregunta cuántas R tiene la palabra Strawberry, que GPT-4o no podía contestar de forma acertada.

Al usar o1 en ChatGPT, se aprecia una demora en el tiempo de respuesta en comparación con GPT-4o y otros modelos de OpenAI. Esto se debe a que la inteligencia artificial usa sus capacidades de razonamiento para resolver lo que se pide o consulta, en lugar de disparar una contestación rápida.

¿Qué capacidades tiene la nueva inteligencia artificial de OpenAI? 

El objetivo de la nueva tecnología es brindar respuestas más certeras, y acabar con las alucinaciones. Esto no quiere decir que la IA no vaya a equivocarse o a inventarse a una respuesta. Pero sus desarrolladores dicen que es menos frecuente que en versiones anteriores de GPT.

"Los investigadores del ámbito de la sanidad pueden utilizar o1 para anotar datos de secuenciación celular, los físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y los desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos", informó la empresa.

Desde OpenAI comentaron que el entrenamiento de o1 se realizó con un set de datos hecho a medida y un nuevo algoritmo de optimización. A diferencia de GPT-4o y modelos previos, esta IA no imita sus patrones de adiestramiento, sino que usa aprendizaje por refuerzo para resolver por su cuenta los problemas que se le presentan.

El uso de Strawberry, conocida previamente como Q* o Q-Star, generó cortocircuitos internos en la firma del empresario Sam Altman. Por ello la empresa hizo hincapié en su seguridad. OpenAI indica que el desarrollo de o1 fue acompañado por la implementación de medidas de seguridad más robustas, pruebas rigurosas y la colaboración con autoridades y entes reguladores de diferentes países.

OpenAI argumentó que o1 es mucho menos susceptible al jailbreak, palabra en inglés por los intentos de los usuarios de evadir sus salvaguardias. "En una de nuestras pruebas de jailbreak más difíciles, GPT-4o obtuvo una puntuación de 22 (en una escala de 0 a 100), mientras que nuestro modelo o1-preview obtuvo una puntuación de 84", indicaron los responsables de la IA.

En cuanto a o1-mini, es una versión más pequeña y hasta un 80% más económica que o1, que también destaca por su rapidez. De acuerdo con OpenAI, o1-mini es relevante en labores de programación.

¿Cuánto tiempo demora en responder la nueva inteligencia artificial de OpenAI?

Un dato interesante que se compartió es cuánto tiempo demoran sus nuevos modelos en brindar una simple respuesta de texto a través de ChatGPT. Así como GPT-4o contestó en solo 3 segundos, o1-mini lo hizo en 9 segundos y o1 en 32 segundos. Ese tiempo extra es el que la nueva IA dedica a pensar y razonar sus respuestas.

Desde el viernes, los suscriptores de ChatGPT Plus y Team pueden acceder a OpenAI o1 y o1-mini desde el menú de selección de modelos del chatbot. La próxima semana se ofrecerá esta posibilidad a los usuarios de los planes Enterprise y Edu. La versión gratis de ChatGPT recibirá o1-mini, aunque todavía no se sabe cuándo.

La empresa limitará la cantidad de consultas a los modelos o1 a través de ChatGPT, al menos en un principio. Para los usuarios de Plus y Team habrá un tope semanal de 30 mensajes para OpenAI o1-preview y de 50 mensajes para o1-mini.

Para los desarrolladores, OpenAI habilitará el uso de los modelos o1 a través del nivel 5 de su API. El acceso a la nueva IA es más caro que el de otros modelos de la compañía. o1-preview cuesta 15 dólares por cada un millón de tokens de entrada y 60 dólares por cada un millón de tokens de salida. Esto es el triple y el cuádruple de los costos de GPT-4o por idénticas cantidades de tokens, respectivamente.

Desde OpenAI planean lanzar modelos de la serie o1 y de GPT, así que la nueva tecnología no reemplazará a la anterior. Además, la empresa prometió actualizar la IA para añadir el soporte al procesamiento de documentos e imágenes y a la navegación web en el futuro.

Temas relacionados