Sociedad Tendencias
INTELIGENCIA ARTIFICIAL VIDEO

Sora, la nueva herramienta de IA que convierte el texto en video

Open AI, la empresa de inteligencia artificial desarrolló un modelo generativo que puede crear escenas de video realistas a partir de instrucciones escritas

Bienvenidos al nuevo mundo. Bienvenidos a Sora, la nueva IA que es capaz de generar un video de hasta un minuto de duración, manteniendo la calidad visual y la coherencia con el texto de entrada. Lo presentó Open AI, la empresa de investigación en inteligencia artificial que el año pasado sorprendió al mundo con ChatGPT.

Aquel modelo ya era capaz de generar textos coherentes y creativos a partir de una frase inicial. Ahora anunció su nuevo proyecto: Sora, una herramienta que convierte el texto en video.

TE PUEDE INTERESAR

Se trata de un modelo generativo que puede crear escenas realistas e imaginativas a partir de instrucciones escritas. Según Open AI, Sora puede generar un video de hasta un minuto de duración, manteniendo la calidad visual y la coherencia con el texto de entrada.

El objetivo de Open AI es enseñar a la inteligencia artificial a entender y simular el mundo físico en movimiento, con el fin de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real.

ESPECTACULAR VIDEO DE MUESTRA

Para demostrar las capacidades de Sora, Open AI compartió algunos ejemplos de video generado a partir de textos breves o detallados, o incluso de imágenes fijas.

ssstwitter.com_1708020998285.mp4

Sora es la nueva herramienta de creación de video por Inteligencia Artificial a partir de un texto en el que se le da las indicaciones del contenido deseado

En uno de ellos, se puede ver una escena de una calle de Tokio nevada y llena de gente, con pétalos de sakura volando por el viento junto con los copos de nieve. El texto que sirvió de base para crear el video es el siguiente:

La hermosa y nevada ciudad de Tokio está llena de vida. La cámara se mueve por las bulliciosas calles de la ciudad, siguiendo a varias personas disfrutando del hermoso clima nevado y comprando en los puestos cercanos. Preciosos pétalos de sakura vuelan con el viento junto con copos de nieve”.

Embed - https://publish.twitter.com/oembed?url=https://twitter.com/OpenAI/status/1758192960116785459?t=hR40rJclSrp35nf3EYRNEg&s=19&partner=&hide_thread=false

El video muestra que Sora aprendió cómo se ajustan los objetos en 3D: la cámara se mueve por la escena siguiendo a una pareja que camina por una fila de los comercios. También esta Inteligencia Artificial maneja bien la oclusión, es decir, el efecto de que los objetos se ocultan parcial o totalmente cuando salen del campo de visión.

Otros ejemplos de videos generados incluyen una mujer con estilo caminando por una calle iluminada por neones; varios mamuts lanudos atravesando un prado nevado; un tráiler de una película de aventuras protagonizada por un hombre espacial con un casco de moto de lana roja; una vista de dron de las olas rompiendo contra los acantilados de Big Sur, en el estado norteamericano de California; una escena animada de un monstruo peludo arrodillado junto a una vela roja derretida; y un mundo de papel con un arrecife de coral lleno de peces y criaturas marinas.

Embed - https://publish.twitter.com/oembed?url=https://twitter.com/OpenAI/status/1758192962755051792?t=K_x9IIzVzgThnPwaHF5Vkg&s=19&partner=&hide_thread=false

Sora es el resultado de varios años de investigación en el campo de la generación de video a partir de texto, una dirección emergente que señalada como tendencia a seguir en este 2024.

Los primeros modelos generativos que podían producir video a partir de fragmentos de texto aparecieron a finales de 2022. Pero los primeros ejemplos de Meta, Google y una startup llamada Runway eran defectuosos y granulosos.

Desde entonces, la tecnología mejoró rápidamente. El modelo Gen-2 de Runway, lanzado el año pasado, puede producir clips cortos que se acercan a la calidad de la animación de los grandes estudios. Pero la mayoría de estos ejemplos son todavía de unos pocos segundos de duración. Los videos de muestra de Sora de Open AI son de alta definición y llenos de detalles. Open AI también dice que puede generar videos de hasta un minuto de duración.

Sora es una muestra más del impresionante avance de la inteligencia artificial en el campo de la generación de contenido. Sin embargo, también plantea cuestiones éticas y sociales sobre el uso de esta tecnología, especialmente en lo que respecta a la veracidad, la autoría y la responsabilidad de los videos generados por máquinas.

TE PUEDE INTERESAR