Apple lanza por sorpresa una IA para editar imágenes mediante texto: se llama MGIE y así puedes probarla

Apple y la Universidad de California han lanzado una IA de código abierto que se parece mucho al modelo integrado en Photoshop

Apple Ia
1 comentario Facebook Twitter Flipboard E-mail

No estamos aún en el punto de que la inteligencia artificial inunde nuestros iPhone, algo que ya quedó confirmado para más adelante y que será de la mano de iOS 18. Sin embargo, podemos considerar un pequeño adelanto lo que ahora presenta Apple con 'MGIE', un nuevo modelo de IA capaz de editar imágenes ya existentes mediante prompts al estilo de Photoshop (diferente a la creación desde cero de herramientas como Midjourney o DALL-E 3).

Se trata de un proyecto de código abierto que ha sido desarrollado tanto por la propia Apple como por la Universidad de California en Santa Bárbara. Si bien estamos ante una primera fase, lo cierto es que ya ofrece buenos resultados y está abierta a que cualquiera pueda probarla.

Qué es MGIE y qué permite hacer esta inteligencia artificial

MGIE es un MLLM, que si no conoces su significado, vienen a ser las siglas en inglés de los modelos de lenguaje multimodal a gran escala. Se conjunta con lo que se conoce como modelo de difusión y permite transformar instrucciones simples enviadas por texto en instrucciones concisas que tengan su resultado en una transformación de la imagen.

¿Y en qué se traduce todo esto? Pues en obtener funciones similares a las que integra la IA generativa de Photoshop, aunque de una forma aún más sencilla. Esto lo podemos ver con los sencillos ejemplos que la propia Universidad y Apple ponen, en los cuales se muestra una instrucción sencilla por parte del usuario y la transformación de esa a un texto mucho más preciso y, tras ello, modificar la imagen.

Ejemplos Ejemplos de las capacidades de MGIE

Ejemplo: el usuario está frente a la imagen de una pizza de salami picante y dice "hazla más saludable" y la IA interpreta el texto y la imagen para obtener automáticamente una instrucción más clara en referencia a cómo hacer más saludable esa pizza. Para ello obtiene algo como "la pizza incluye toppings vegetales como tomates y hierbas". Y voalá, tras ello la imagen de la pizza muestra ahora, aparte del salami, toppings mucho más saludables.

También se muestran ejemplos en los que esta IA es capaz de editar sólo una parte de la imagen. Véase la posibilidad de pedirle que el cielo de una fotografía sea más azul y que en la edición se aumente la saturación en un 20%. O que en la pantalla de un ordenador desaparezca el contenido y pase a estar completamente verde.

Porque sí, entre todas las capacidades que se suman a MGIE está la posibilidad de modificar ajustes de color, contraste, manipular objetos, eliminarlos, etc. De forma general, puede servir también para mejorar la calidad de una imagen cuando esta se encuentre muy saturada o borrosa.

Ya se puede acceder a la versión de prueba de MGIE

Todo el repositorio con el código abierto de MGIE se encuentra en GitHub, aunque si lo que quieres es acceder ya a una prueba de este modelo, existe la posibilidad de hacerlo a través de esta página. Sobra decir que la puedes probar tanto desde un Mac, iPhone o iPad como desde cualquier otro dispositivo, ya que es a través del navegador.

Interfaz Interfaz de MGIE

En ella encontrarás una interfaz muy simple en la que únicamente debes fijarte de inicio en la parte izquierda, en la cual deberás subir la imagen desde tu ordenador o móvil, añadir la instrucción sencilla de texto desde 'Instruction' y finalmente pulsar en 'Enviar'.

Tras esto se empezará a generar el resultado que podrás ver qué instrucción se le ha dado de forma automática a la imagen y el ejemplo final. Eso sí, debemos advertir también que podría demorarse el proceso, ya que el servidor está limitado y cuando hay muchas solicitudes pendientes, la nuestra queda en la cola.

¿Veremos algo así de forma nativa en iOS y macOS?

Ya era significativo ver los rumores sobre Apple y la IA para 2024 y que el propio Tim Cook dejase caer que preparaban algo importante para este año. Y aunque esto responde a un proyecto local universitario, lo cierto es que sirve cuando menos para saber que Apple ya explora el terreno de la IA generativa de imágenes, aparte del texto.

Es evidente que esto no sirve para confirmar absolutamente nada, pero al menos nos hace soñar. Si en código abierto Apple es capaz de elaborar un proyecto como este, quien sabe si a nivel interno manejan ya alguna herramienta con la que potenciar la edición de imágenes en los iPhone, iPad y Mac. En junio saldremos de dudas.

Vía | Xataka México

Más información | Universidad de California y Apple

Imagen de portada | Álvaro García M. con DALL-E 3

En Applesfera | Toda la IA del Samsung Galaxy S24 Ultra que quiero en mi iPhone y en qué punto se encuentra Apple

En Applesfera | Conoce a Pi, la nueva inteligencia artificial que está triunfando en WhatsApp iOS

Comentarios cerrados
Inicio