• Sam Altman ha dejado asombrada a la industria de la IA una vez más.
  • El jueves, OpenAI presentó su nuevo modelo de texto a video Sora.
  • La capacidad de Sora para producir videos de alta fidelidad sorprendió a internet.
  • ¡Nos vemos en TikTok!

Sam Altman acaba de sorprender a la industria de la IA. Otra vez.

Esta vez, no es por un despido sorpresivo de OpenAI, ni tiene que ver con ChatGPT. En cambio, es por un modelo de IA completamente nuevo llamado Sora.

El jueves, presentó al mundo Sora, que toma su nombre de la palabra japonesa para «cielo», y puede crear videos de hasta un minuto de duración a partir de texto.

OpenAI dice que su objetivo con Sora es enseñar a la IA a «entender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real».

Esa es una forma un tanto aburrida de describir lo que el modelo es realmente capaz de hacer. Puede crear videos de alta fidelidad de todo, desde California durante la fiebre del oro del siglo XIX hasta animaciones 3D similares a una producción de Dreamworks. Todo lo que te pide es un simple texto de indicación.

Hay que decir que esta no es la primera instancia de este tipo de tecnología.

La startup con sede en Nueva York, Runway, respaldada por Google y Nvidia, tiene una herramienta basada en IA que hace videos a partir de texto. Meta tiene algo similar llamado Emu Video. El mes pasado, Google presentó su versión de texto a video llamada Lumiere.

¿Es comparable el revuelo alrededor de ellas con Sora? No del todo.

En parte, es porque el liderazgo de Altman en OpenAI, de propiedad privada, le otorga la libertad de promocionar la tecnología, a pesar de que todavía se esté probando en busca de fallas. (Nota: el lanzamiento de Sora está limitado a «red teamers» que lo probarán en busca de riesgos, así como a artistas visuales y cineastas seleccionados).

Por eso su anuncio de Sora en las redes sociales no solo involucró un hipervínculo a un blog explicando el nuevo modelo de IA; implicó un compromiso directo con las personas que lo siguen.

Demostración de su poder con solicitudes en la red

En X, tomó solicitudes de los usuarios sobre videos que les gustaría ver creados por Sora.

«Nos gustaría mostrarles lo que Sora puede hacer, por favor respondan con subtítulos para videos que les gustaría ver y comenzaremos a hacer algunos», escribió. Las solicitudes llegaron en masa.

El popular youtuber MrBeast le pidió un video de un mono jugando ajedrez en un parque. Otro pidió ver golden retrievers haciendo un podcast en una montaña. El CEO de Nothing, Carl Pei, pidió un video de Will Smith comiendo espagueti. Muchas otras personas también hicieron peticiones.

Nikunj Kothari, socio de capital riesgo en Khosla Ventures, destacó el impacto de la estrategia de Altman contrastándola con la forma en que Google compartió una actualización masiva de su modelo de IA, Gemini, a través de un blog el mismo día que se lanzó Sora.

Google anunció «algo impresionante», dijo en X, al expandir la «ventana de contexto» de Gemini, el número de palabras que un modelo de IA puede procesar alrededor de un token objetivo, hasta 1 millón. Es un avance enorme, pero uno que Google no muestra como Altman.

«No hay un patio de juegos, no puedo probarlo yo mismo. Hay algunos videos muy impresionantes en la publicación del blog, pero no está personalizado para mí en absoluto», escribió Kothari en X, mientras destacaba que Altman estaba «mostrando» las capacidades de Sora tomando solicitudes de otros.

«Esto va a eclipsar enormemente los logros muy, muy impresionantes de Google. Google está en desventaja y necesita ‘compartir’ para capturar nuevamente la atención del público», dijo Kothari.

Tecnologías como la de Sora también tienen riesgos

Sin embargo, la euforia podría durar poco.

El lanzamiento de un modelo de IA capaz de generar videos visualmente impresionantes podría plantear nuevas amenazas para la industria creativa, que ya ha expresado su preocupación sobre el potencial de la IA generativa para quitarles sus trabajos tras las huelgas en Hollywood el año pasado.

La adopción generalizada de la tecnología también podría causar estragos en las elecciones de este año si es utilizada por actores malintencionados que buscan crear videos falsos de personas como Donald Trump o Joe Biden.

Es probable que también lleve a demandas renovadas para que OpenAI sea transparente sobre los datos que está utilizando para entrenar sus modelos de la misma manera que lo son los modelos de código abierto.
Por ahora, sin embargo, la gente está comprando el bombo de Altman.


AHORA LEE: Sam Altman quiere el respaldo de Washington para su empresa de chips de IA de 7 billones de dólares

TAMBIÉN LEE: 5 tendencias tecnológicas que darán de qué hablar en 2024, según Belkin

Descubre más historias en Business Insider México

Síguenos en Facebook, Instagram, LinkedIn, TikTok, Threads, Twitter y YouTube

AHORA ESCUCHA:

AHORA VE: