La pasada semana se cerraba con uno de los anuncios del año en lo que a inteligencia artificial se refiere. OpenAI, los creadores de ChatGPT, presentaron Sora. Se trata de un nuevo modelo capaz enfocado a vídeo y que va desde la creación completa de un vídeo con IA hasta la edición y modificación de vídeos ya existentes. Y todo mediante un prompt de texto.
Es algo similar a las IA que ya tenemos para imágenes, pero mucho más completo. El realismo que se ha mostrado en los ejemplos es impresionante, por lo que se están generando muchas dudas al respecto de esta nueva IA. Muchas de ellas no tienen respuesta, pero hay muchas otras que sí.
Todo lo que sabemos (y lo que no) acerca de Sora y su llegada a Mac, iPhone y iPad
Cabe empezar diciendo que Sora será un modelo multiplataforma como ya sucede con ChatGPT y otros muchos modelos de inteligencia artificial generativa, por lo que su llegada al ecosistema Apple está asegurada. Sin embargo, tanto a efectos de funcionamiento en ellos como en otros quedan aún algunas dudas.
¿Cuándo llegará Sora?
Es la pregunta del millón y que, por mucho que nos encantaría resolver, no tiene respuesta oficial. Lo mostrado ya por OpenAI demuestra que es un sistema ya avanzado, aunque no haber anunciado ya una fecha hace prever que aún queden puntos por resolver.
De hecho, la propia OpenAI asegura que quiere que sea un sistema seguro para el usuario y que en ello están trabajando ahora. Tan pronto como esté lista saldrá, pero insistimos en que no hay fechas. La hipótesis que se maneja es que se lance antes de acabar el año, pero bien podría ser el mismísimo 31 de diciembre o mañana mismo (spoiler: no será mañana).
¿Qué es capaz de hacer Sora?
Definir Sora como una IA capaz de generar vídeos es decir la verdad, pero no toda la verdad. Las capacidades que tiene son variopintas y muy potentes:
- Vídeos completamente realizados con IA mediante la introducción de un prompt en el que se podrá tanto dar una instrucción sencilla y que Sora la complete a su libre elección o solicitar la creación de una o varias escenas concretas con todo lujo de detalles.
- Modificación de un vídeo ya existente haciendo que, por ejemplo, si es un coche que va por una carretera normal, Sora sea capaz de hacer que el coche se vea circulando en mitad de la selva.
- Diferentes formatos de vídeo tanto para la modificación de los ya existentes como para la creación completa de los mismos. Admitirá tanto el formato vertical como horizontal y cuadrado en 1:1.
- Inventarse el entorno de un vídeo de forma similar a lo que hacen ya algunas aplicaciones como Photoshop con las imágenes. Por ejemplo, imaginemos un vídeo en horizontal de un bosque, pues con Sora podremos cambiarlo a un formato horizontal en el que se cubrirían esos laterales con elementos generados con IA y acordes a lo que se muestra en la parte original.
- Fusión de dos vídeos, algo que se entiende mejor con el ejemplo que proporcionó OpenAI: se ve un vídeo de una mariposa volando y otro vídeo de un dron sobrevolando una ciudad. Pues bien, ambos vídeos mezclados resultan en esa mariposa sobrevolando la ciudad.
- Dar vida a fotografías estáticas subiéndolas al sistema y pidiendo a Sora que las convierta en un vídeo. Por ejemplo, una foto simple y normal de nuestro perro puede convertirse en nuestro perro saliendo de ese plano y caminando por una playa.
- Compresión del entorno y no simples generaciones de vídeo sin más. Es decir, que si pedimos un vídeo en el que salga una persona caminando por una ciudad, Sora sabrá interpretar el espacio y añadir más personas caminando de fondo, vehículos por la carretera, edificios, etc.
¿Puede alguien ya usar Sora?
Sí y no. Más allá de los propios trabajadores de OpenAI (y no todos), la compañía ha abierto unas pruebas limitadas a ciertos usuarios. Como imaginarás, no son usuarios aleatorios, sino que son diseñadores profesionales e incluso cineastas, de los cuales OpenAI espera recibir feedback para seguir mejorando el modelo antes de su lanzamiento global.
¿Cómo se ejecutará Sora?
Hay hasta tres formas de ejecutar una IA como Sora. En local, lo cual implica que se limite a tener un cierto y potente hardware en el dispositivo; en servidores externos, que depende puramente de la compañía que lo ofrece y por tanto está habilitado para muchísimos dispositivos y por último en un modelo mixto que requiera de cierta ejecución en local con parte del proceso en servidores externos.
Pues bien, Sora se ejecutará en servidores propios de OpenAI, lo que garantiza que se pueda ejecutar en un amplísimo parque de dispositivos. Y sí, como decíamos anteriormente, también en los iPhone, iPad y Mac. De hecho, no será necesario siquiera que sean modelos recientes. Es lo mismo que sucede ya con ChatGPT.
¿Dónde se podrá descargar Sora?
Esta es otra de las dudas que no tiene respuesta. O no al menos de forma completa. En OpenAI confirmaron que se añadirá al catálogo como el resto de modelos disponibles por la compañía, pero no si tendrá app independiente y en qué sistemas.
Es de esperar que esté disponible online a través de un navegador web. Sin embargo, no se sabe si acabará teniendo o no una aplicación para iOS, Android, macOS y Windows como sucede con otros modelos.
¿Qué limitaciones tiene Sora?
Sin haber podido probar a fondo esta IA, resulta cuando menos arriesgado plantear una lista de fallos. Lo que sí ha hecho público OpenAI es que serán vídeos de hasta 60 segundos de duración. Al menos eso es lo que tienen ahora y quién sabe si en el futuro se ampliará. Por lo pronto, ese minuto es el límite.
Aparte, también comentan que puede experimentar ciertos problemas de precisión ante escenas complejas, en las cuales Sora podría no ser capaz de comprender la relación causa-efecto.
¿Habrá que pagar por usar Sora?
Si la pregunta sobre la fecha es la pregunta del millón, esta es la de los novecientos mil (o tal vez también el millón). No hay respuesta, aunque ChatGPT podría ser la pista definitiva. OpenAI ofrece su chatbot de forma gratuita con GPT-3.5, mientras que la versión más avanzada se llama ChatGPT Plus, se basa en GPT-4 y es de pago.
Por tanto, hay varias posibilidades con Sora. Por un lado, que sea completamente gratuita para todos y sin limitaciones, algo que pese a no confirmarse suena cuando menos poco probable. Otra opción es que sea completamente de pago, algo más probable que lo anterior, aunque tampoco parece que vaya a ser lo escogido. La opción que coge más enteros a falta de confirmación es el modelo mixto con una opción gratuita y accesible para todos y con un modelo mucho más ambicioso (¿Sora Plus?) que sí requiera de un pago recurrente.
¿Qué impacto tendrá Sora en la industria audiovisual?
Pues es pronto para saberlo. Si ya hemos visto que ChatGPT puede transformar nuestras rutinas para mejor, es de esperar que Sora también. Sin embargo, se prevén consecuencias tanto positivas como negativas. En la parte buena nos encontramos con que será una herramienta sumamente útil para creadores de contenido en vídeo y, con una buena evolución, incluso para grandes productores audiovisuales.
Sin embargo, está también por ver si el famoso miedo a perder el trabajo acaba haciéndose realidad para editores profesionales. También existe un cierto riesgo a que emerjan los vídeos manipulados y cuelen como fake news, algo que ya ha ocurrido con imágenes estáticas generadas con IA.
Sea como fuere, no parece que quede mucho para responder con certezas a todas las dudas. Por lo pronto Sora se planta con una importante expectativa de revolución del área audiovisual. Su devenir es un misterio y quién sabe también que preparará la competencia. Sin ir más lejos, el mismísimo Tim Cook confirmó que Apple presentará algo pronto en relación a la inteligencia artificial de Apple.
En Applesfera | Un Copilot de Apple: Gurman lleva la IA de iOS 18 hacia las herramientas de desarrollo
En Applesfera | Vision Pro: precio, características, fecha de lanzamiento, aplicaciones compatibles y todo sobre las gafas de Apple
Ver 2 comentarios