Grok vs. Gemini en 7 pruebas de generación de imágenes con IA: ¿cuál es mejor?
Cada generador de imágenes tiene sus propias fortalezas.
Los generadores de imágenes con IA evolucionan rápidamente, volviéndose más inteligentes, rápidos y creativos. Tras probar las capacidades de generación de imágenes de ChatGPT-5 y Gemini, quise comparar el rendimiento de Gemini de Google con el de Grok, el chatbot gratuito de Elon Musk.

En una batalla de siete rondas, que incluyó peticiones fotorrealistas y al estilo Pixar, puse a prueba la adherencia de cada modelo a las instrucciones y su capacidad para generar imágenes convincentes. Aquí están las principales fortalezas de cada modelo y qué IA se impuso. Esta comparación te ayudará a comprender qué modelo, Gemini o Grok, se adapta mejor a tus necesidades de generación de imágenes con IA.
1. Concepto de producto hiperrealista

Demandante: “Crea una imagen fotorrealista de un teléfono inteligente plegable y transparente colocado sobre una mesa de café de madera, con las luces de la ciudad reflejadas en su superficie”.
Funcionó Grok Para cumplir con esta solicitud, creó dos fotografías realistas que incluían todos los detalles que solicité. Ambas versiones lucían impecables y reflejaban fielmente el concepto.
El resultado fue Gemini Bueno, pero no perfecto. El smartphone transparente se veía un poco desproporcionado, y los reflejos de las luces de la ciudad, un aspecto clave de la afirmación, no se representaron tan convincentemente como en el intento de Grok.
ganador: victorias Grok Para generar una imagen de alta calidad e interpretar mejor la indicación, Grok superó claramente esta prueba de generación de imágenes con IA.
2. Dibujar personajes con emociones

Demandante: Dibuja una ilustración en estilo cómic de un joven astronauta que se da cuenta de que olvidó su casco en Marte, con expresión exagerada, colores vibrantes y humor caricaturesco.
producir Grok Dos imágenes de lo que parecen ser astronautas sorprendidos, ambos con cascos. Debido a la proximidad entre ellas, es difícil interpretarlas de forma específica, y el "olvido" no se aprecia muy bien.
producir Gemini Esta imagen muestra a un astronauta olvidadizo. El globo de diálogo indica mejor el motivo de su incomodidad, aunque la imagen sería mejor si el astronauta no llevara casco. El fondo y el diseño general son claros.
Ganador: Géminis Gana por seguir las instrucciones con más atención y por una imagen más cómica.
3. Reimaginando la historia

Demandante: “Dibuja una pintura de estilo renacentista de Cleopatra sosteniendo un teléfono inteligente moderno, al estilo de Leonardo da Vinci”.
producir Grok Esta imagen parece ser la fotografía de una mujer moderna con ropa de estilo renacentista y un teléfono inteligente en la mano. La pintura parece más bien una selfie y es muy moderna.
centrarse Gemini Desde un punto de vista más artístico, la pintura parecía más una pintura renacentista y más parecida a la propia Cleopatra, en lugar de simplemente una mujer moderna con su traje.
Ganador: Géminis Gana por su mejor interpretación de la petición y su mejor exactitud histórica.
4. Escena de multitud compleja

Demandante: “Crea una foto aérea de Times Square en Nochevieja, repleta de gente, carteles luminosos y confeti cayendo por el cielo nocturno”.
Grok Realmente decepcionado con esta ronda. Ambas fotos eran igual de malas, algo borrosas, y no captaban muy bien la Nochevieja en Times Square. La gente estaba demasiado separada y faltaban otros detalles que podrían indicar que era Nochevieja.
Gemini Captura la energía y la multitud de Nochevieja en Times Square. La foto es claramente de Nueva York, y los carteles ayudan a indicar la ocasión. La multitud está abarrotada, a diferencia de la foto de Grok.
Ganador: Géminis Gana la foto más clara y precisa de la Nochevieja en Times Square.
5. Surreal Mix

Demandante: “Imagínese un pulpo gigante jugando al ajedrez con Albert Einstein en una cámara de cristal en el fondo del océano”.
Rostro Grok Dificultad con esta prueba. Requería "pensar" durante mucho más tiempo que cualquier otra instrucción de la prueba hasta el momento. La imagen era buena, pero no tuvo en cuenta la instrucción "sala de cristal".
Pies Gemini Inmediatamente, tomé una foto de lo que parecía una selfie. La casa de cristal era interesante y realista. El pulpo era mucho más grande que el de Grok y complementaba mejor la extraña imagen.
Ganador: Géminis Gana con una calidad de imagen superior y direcciones precisas.
6. Claridad de la infografía

Inmediato: “Diseña una infografía clara que ilustre el ciclo de vida de una mariposa, etiquetando las etapas, utilizando flechas e íconos planos con la menor cantidad de colores posible”.
Fue un intento Grok Para crear un gráfico que tuviera éxito y fracaso a la vez. La primera versión era demasiado recargada, con una mariposa innecesaria que distraía del ciclo de vida. La segunda versión se aproximaba más a la afirmación, pero carecía de precisión en los detalles del ciclo.
Gemini Proporcione una imagen clara que represente con precisión el ciclo de vida de una mariposa con etiquetas claras, pocos colores y etiquetas fáciles de leer.
Ganador: Géminis Ganó porque completó la reclamación a la primera. La imagen es precisa y está lista para mostrarse.
7. Mantenga la coherencia en las fotos de perfil estilizadas.

Demandante: “Crea un modelo de personaje 3D al estilo Pixar de un periodista de 40 años con cabello rubio sosteniendo un cuaderno. Luego crea tres variaciones con diferentes atuendos”.
Grok Pasó por alto por completo la petición de "estilo Pixar" en esta propuesta, así como la de "diferentes atuendos". Creó tres peinados diferentes, lo cual es digno de elogio.
Gemini Aplasta al periodista al estilo Pixar, pero no detecta las tres diferencias.
Ganador: un empate Ninguno de los dos robots siguió las instrucciones. Si tuviera que elegir uno, sería Gemini por acertar con el estilo y captar mejor la onda del periodista.
Ganador general: Géminis
Tras siete comandos, Gemini demostró ser el generador de imágenes más fiable en general. Siguió las instrucciones con mayor consistencia y precisión, produjo composiciones más nítidas y dominó detalles que Grok solía pasar por alto. En otras palabras, Gemini sobresalió en la comprensión y ejecución de comandos de texto para generar las imágenes solicitadas.
Grok ciertamente mostró destellos de creatividad y logró un claro éxito en fotorrealismo, pero a menudo falló en precisión y se desvió de la norma. Si buscas resultados experimentales y poco convencionales, Grok tiene sus momentos. Pero para el uso diario, donde la claridad, la precisión y el pulido son primordiales, Gemini es el generador de imágenes con IA en el que confío para el trabajo. En resumen, Gemini es la mejor opción para quienes buscan resultados consistentes y de alta calidad en diversas situaciones.
¿Has probado Grok? ¿Y Gemini? ¿Cuál es tu favorito? Cuéntamelo en los comentarios.
Los comentarios están cerrados.