He puesto a prueba cinco generadores de imágenes de IA con el mismo mensaje: aquí está el ganador, es gratis y va genial en Safari

Cinco generadores de imágenes con IA disponibles en iPhone y con resultados dispares en cuanto a precisión y realismo

Ia
3 comentarios Facebook Twitter Flipboard E-mail

¿Cuál es la IA gratuita más realista para generar imágenes? Conocemos muchos generadores y seguramente Midjourney se lleve la palma, pero al ser de pago no entra dentro de las posibilidades de alguien que quiera hacer un uso puntual o sencillamente no quiera gastar un euro.

Por eso hemos accedido a cinco generadores de imágenes gratuitos para iPhone y a los que podemos acceder, ya sea vía web o a través de una app. Para ello hemos pedido dos imágenes diferentes (con idénticos prompts en todos). Ya te adelantamos que no hay una diferencia abismal entre ellas, aunque hay una que, a nuestro juicio, destaca por encima de todas.

Qué prompts hemos utilizado

Para que no haya trampa ni cartón, he optado por usar idéntico prompt en todas las IAs. De hecho, lo he probado tanto en español como en inglés. La mayoría entrega resultados similares en ambos casos, pero en algunos concretos suele entender mejor el inglés y por eso lo tenía también en la lengua de Shakespeare a modo de comodín.

Mi idea era analizar un poco elementos naturales y también personas, dado que son estas últimas lo que quizás más se le sigue resistiendo a la IA generativa. Para el primero elegí un paisaje y utilicé este prompt:

"Un paisaje montañoso al atardecer, con cielo anaranjado y rosado. En el centro de la imagen hay una cascada de un río que va serpenteando y tiene reflejos dorados. En los laterales hay rocas con musgo y muchos árboles frondosos. El ambiente debe transmitir tranquilidad y majestuosidad".

Para el ambiente con personas opté por pedir un mercadillo en el que figurasen varios personajes:

"Un mercado al aire libre durante una mañana soleada y varias personas interactuando entre sí. Hay una mujer con un vestido de flores negociando con un vendedor de frutas. Un niño pequeño con sombrero de paja tiene un globo rojo en las manos mientras mira con curiosidad a un músico callejero que toca la guitarra. Las demás personas caminan alrededor de los puestos. El ambiente es animado y muy colorido".

DALL-E 3 con ChatGPT y con Bing

DALL-E 3 es la tecnología de generación de imágenes de OpenAI y que no sólo está presente en el propio ChatGPT, sino también con Bing. En ambos casos se puede usar tanto desde el navegador como en la app de iPhone (o Android). Los resultados son similares.

Chatgpt

En la imagen de ChatGPT nos encontramos con un paisaje bastante fiel a lo que pedimos y que podría pasar por real. Ahora bien, en la imagen del mercado vemos como falla en algunos elementos como que no entiende que es el niño el que sostiene el globo y, de paso, dibuja muy mal los rostros, sobre todo en los personajes de fondo.

Acceder a ChatGPT vía web | Acceder a ChatGPT vía app de iOS

Bing

Cero pegas también en la imagen del paisaje generada por DALL-E 3 en Bing, aunque sí en la del mercadillo. Omite elementos como el del globo y no termina por generar un ambiente demasiado colorido. En cambio, sí debemos decir que en general parece una imagen muy realística. Quitando el rostro de la señora que pasea por el fondo, de primeras podríamos pensar que es una foto real. Con algún filtro de edición, pero real al fin y al cabo.

Acceder a Bing Image Creator vía web

Grok

La IA de X, llamada Grok y disponible gratis, tiene lo que Elon Musk quiso: ningún límite. Muchos hemos visto ya creaciones de personajes populares en situaciones anormales que nos parecen divertidas y que dan el pego. Sin embargo, dado que en otros modelos sí disponen de censura por derechos de autor e imagen, no hemos querido hacer distinción y pedirle idénticos prompts.

Grok

Con Grok nos encontramos en una tesitura extraña: son seguramente las imágenes más realistas, pero menos precisas. Si bien en el paisaje ha cumplido con lo solicitado, en el mercado ha obviado muchos elementos. Por ejemplo, genera el globo por ahí de fondo sin que lo lleve el niño y no hay rastro de ningún músico tocando la guitarra. Además, dibuja unas manos extrañas como si esas personas tuviesen algún tipo de malformación en ellas. Y en todas las imágenes generadas ha sucedido lo mismo, siendo esta al final la más precisa.

Acceder a Grok vía web | Acceder a Grok vía app de iOS

Ideogram

Ideogram es accesible de forma gratuita vía web y, como Grok, también ofrece la posibilidad de generar imágenes realísticas incluso de personajes célebres. Aunque siguiendo esa regla autoimpuesta, también hemos optado por usar idénticos prompts a los anteriores.

Ideogram

El paisaje, nuevamente, observamos que está bastante logrado. Quizás algo irreal en la parte de la cascada, ya que esta parte de una ladera de una forma un tanto extraña. En lo que al mercado se refiere, ha generado hasta dos músicos, algo que tampoco está mal, pero no es lo que pedimos. De igual modo, el globo lo pone en la mano de una chica y no del niño, además de omitir por completo al vendedor de fruta con el que negocia la mujer con vestido floral. No obstante, y pese a algunas imperfecciones, parece también muy real.

Acceder a Ideogram vía web

Artguru

No es la más conocida, pero la IA de Artguru es una de las más interesantes por ser gratuita, aunque al igual que Grok, añade su propia marca de agua. Es accesible vía web y estos son los resultados.

Artguru

Ambas imágenes son bonitas, pero quizás demasiado para parecer reales. El paisaje parece más bien un cuadro muy bien dibujado y con un efecto en el agua que, insistimos en qué es bonito, aunque un tanto irreal combinado con un musgo demasiado bien texturizado. La imagen del mercado pierde casi todos los elementos solicitados en el prompt y deja algunos rostros imprecisos en el fondo, pero lo cierto es que tampoco es una mala ejecución del todo.

Acceder a Artguru vía web

Y el ganador es…

Como diría Mercedes Milá en un 'Gran Hermano' de los años 2000, la audiencia es soberana y quien decide al ganador. De ahí que hayamos mostrado los resultados para que cada uno juzgue. Ahora bien, si te sirve de algo nuestra opinión, creemos que la IA de Grok está por encima del resto de las gratuitas. Al menos a nivel general teniendo en cuenta que durante meses hemos utilizado todas.

No es que haya una diferencia gigantesca entre Grok y las demás, pero el hecho de que no tenga prácticamente censura, hace que sea muy conveniente para generar todo tipo de imágenes, aunque esto también tenga una lectura negativa. Eso sí, está por ver cuánto tiempo más permite Elon Musk que la podamos usar sin tener una suscripción en X.

Como segunda opción, lo cierto es que DALL-E 3 en ChatGPT resulta bastante atractiva también y sobre todo por entender mejor la petición que realizamos, por compleja que sea. Cierto es que solamente está disponible con GPT-4o y tenemos un límite de uso gratuito, pero para generar unas pocas imágenes al día es más que suficiente.

En Applesfera | Image Playground: qué es y para qué sirve la nueva app de Apple con la que puedes crear todo tipo de imágenes

En Applesfera | Apple Intelligence: qué es, lo que puedes hacer, dispositivos compatibles y cuándo llegará en español

Inicio