• 23/12/2024

El creador de ChatGPT sorprende con esta inteligencia artificial para crear videos de alta calidad

La herramienta de inteligencia artificial aún no está a disposición del público, y OpenAI reveló poca información sobre cómo se creó y cómo se utilizará
16/02/2024 - 08:52hs
El creador de ChatGPT sorprende con esta inteligencia artificial para crear videos de alta calidad

La empresa OpenAI presentó una nueva herramienta que amenaza con revolucionar el mercado audiovisual. La empresa creadora de ChatGPT presentó el jueves su próximo salto a la inteligencia artificial generativa: una herramienta que crea al instante videos cortos en respuesta a órdenes escritas.

Se trata de Sora, un nuevo generador de videos a partir de textos. Google, Meta y Runway ML son otras de las empresas que presentaron tecnologías similares y esta nueva herramienta apunta a competir con ellas.

Algunos de los videos mostrados por OpenAI fueron creados después de que su director general, Sam Altman, pidiera a los usuarios de las redes sociales que enviaran ideas para guiones escritos.

La alta calidad de los videos despertó temores sobre sus implicaciones éticas y sociales. La herramienta aún no está a disposición del público, y OpenAI reveló poca información sobre cómo se creó y cómo se utilizará.

La empresa fue demandada por escritores y por el diario estadounidense The New York Times por utilizar obras protegidas por derechos de autor para entrenar a ChatGPT. Pese a ese antecedente, no reveló las imágenes y fuentes de video que se utilizaron para entrenar a Sora.

OpenAI, con sede en la ciudad californiana de San Francisco, afirmó en su blog que colabora con artistas, legisladores y otros profesionales antes de hacer pública la nueva herramienta.

¿Qué se puede hacer con la nueva inteligencia artificial de OpenAI?

"Estamos trabajando con 'equipos rojos' —expertos en ámbitos como la desinformación, los contenidos que incitan al odio y los prejuicios— que pondrán a prueba el modelo", explicó la empresa.

"También estamos construyendo herramientas para ayudar a detectar contenido engañoso, como un clasificador que pueda indicar cuando un video ha sido generado por Sora", agregó.

No es un producto terminado, y por ahora tiene algunas lagunas. A veces se pierde simulando las físicas en las escenas más complejas, pudiendo además confundirse con las causas y efectos de ciertos movimientos o acciones.

Algunos ejemplos en los videos son movimientos físicamente imposibles, duplicación o desaparición de sujetos e incluso velas que no se apagan al soplar.

Esta inteligencia artificial es muy similar a los modelos que crean imágenes a partir de texto, y que a la vez se basa en parte de la tecnología de modelos de lenguaje como GPT.

Este sistema es capaz de entender lo que le pedís con un lenguaje natural, porque fue entrenada para entender la manera en las que solemos hablar y cómo nos expresamos para pedir o preguntar algo.

Después de entender lo que le has pedido en un prompt, Sora podrá generar videos en los que se vea en movimiento lo que le has pedido, lo que supone un enorme paso más con respecto a simplemente crear imágenes.

Esto lo ha conseguido porque es un modelo entrenado con una enorme biblioteca de videos, de forma que sabe reconocer movimientos, descripciones y cualquier cosa que le pidas, y será capaz de recrearlos en vídeo. Sabrá a lo que te refieres cuando le hables de tipos de personas, de vestimenta, de accesorios o de efectos visuales.