Imágenes realistas y texto legible con los últimos modelos de IA de OpenAI. Pruébelo gratis.

OpenAI ha incorporado su modelo 4o en ChatGPT para permitir la generación de imágenes de forma nativa dentro del entorno del chatbot. Esta actualización elimina la necesidad de utilizar el modelo de generación de imágenes Dall-E de OpenAI como una entidad separada, aunque Dall-E todavía está disponible para quienes lo prefieran. La compañía de IA también ha habilitado su generador de vídeo Sora AI dentro de ChatGPT.

Las nuevas funciones están actualmente disponibles para los usuarios gratuitos de ChatGPT, así como para los usuarios de ChatGPT Plus, Team y Pro. Estas funciones estarán disponibles para los usuarios comerciales y educativos la próxima semana.

Dall-E 3 era anteriormente el complemento de generación de imágenes para suscriptores pagos de ChatGPT. Mientras tanto, quienes quieran probar el generador de forma gratuita pueden hacerlo a través de la versión básica de Microsoft Copilot.

La plantilla ha sido elogiada como uno de los mejores generadores de imágenes disponibles, especialmente en su versión paga. Si bien es beneficioso para todos los usuarios de ChatGPT poder utilizar la generación de imágenes integrada con el modelo 4o, aquellos que usan la versión gratuita de ChatGPT deben estar preparados para enfrentar algunas limitaciones, como límites de carga de archivos y análisis de datos, como se señaló. CNET.

Sin embargo, ChatGPT se beneficiará de tener imágenes más realistas con texto más claro después de que OpenAI pasara un año entrenando a GPT-4o después del lanzamiento a través de un esfuerzo de capacitación llamado "Aprendizaje de refuerzo a partir de la retroalimentación humana" (RLHF), según Wall Street Journal.

Después de anunciar GPT-4o en mayo de 2024, OpenAI contó con un equipo de más de 100 "entrenadores humanos" que escanearon el modelo en busca de errores tipográficos, así como errores comunes en manos y caras, dijo al periódico el investigador principal del proyecto, Gabriel Goh.

El modelo GPT-4o también agregará la capacidad de crear fondos transparentes a ChatGPT. Se espera que esto sea muy útil para usuarios comerciales y creativos, ya que les permitirá crear logotipos u otros íconos, como señaló Jackie Shannon, directora de productos multimedia de ChatGPT, al WSJ.

A pesar de las mejoras realizadas por OpenAI, el modelo GPT-4o actualizado en su conjunto todavía presenta algunas deficiencias. Todavía tiene una tendencia a las alucinaciones, un rasgo común en la IA que aún no se ha resuelto. Mantener la coherencia editorial sigue siendo un desafío dentro del entorno de ChatGPT; Sin embargo, Lo prometí OpenAI con actualizaciones rápidas, a partir de la próxima semana.

Otro problema actual que enfrenta OpenAI es la cuestión de la ética y la legitimidad. La empresa insiste en que su modelo fue entrenado con “datos disponibles públicamente”, así como con datos exclusivos que posee a través de asociaciones con marcas como Shutterstock, señaló el WSJ.

Las imágenes generadas por ChatGPT basadas en el modelo 4o no contendrán marcas de agua de IA. Sin embargo, la compañía señaló que las imágenes incluirán metadatos C2PA que indican que fueron generadas por IA. Este sigue siendo el estándar de la industria.

ChatGPT