OpenAI ha presentado ChatGPT Images 2.0, una nueva versión de su modelo de generación de imágenes con la que quiere llevar esta tecnología más allá de la ilustración llamativa y acercarla a usos prácticos como interfaces, infografías, material educativo, diseño comercial o contenido multilingüe. La compañía sostiene que el nuevo sistema mejora de forma notable el seguimiento de instrucciones, composición, colocación de objetos y renderizado de texto dentro de la propia imagen.
Uno de los cambios más destacados está en la integración con los modelos con capacidad de razonamiento dentro de ChatGPT. Cuando el usuario elige uno de esos modos, Images 2.0 puede apoyarse en procesos adicionales para estructurar mejor el resultado, generar varias imágenes coherentes en una sola petición e incluso consultar información reciente en línea para tareas donde el contexto actualizado sea importante.
Por ejemplo, nosotros le pedimos que generara varias imágenes de una sola tirada usando nuestro logo y solicitando que introdujera textos en catalán en distintos escenarios de la ciudad de Barcelona. El resultado fue el siguiente:
La compañía asegura que el modelo rinde mejor con texto denso, iconografía, composiciones complejas y varios idiomas, con mejoras específicas en japonés, coreano, chino, hindi y bengalí. También amplía los formatos de salida con relaciones de aspecto que van desde 3:1 hasta 1:3, lo que facilita generar piezas pensadas para banners, redes sociales, carteles, pantallas móviles o diapositivas. En la API, además, podrá producir imágenes de hasta 2K de resolución, aunque esa opción sigue en beta.
OpenAI sitúa el nuevo modelo como una herramienta para diseño, marketing, prototipado, educación y creación de producto, y subraya que ya está disponible para usuarios de ChatGPT, Codex y la API. Las funciones avanzadas ligadas al modo “thinking” quedarán reservadas a planes Plus, Pro y Business. La empresa también reconoce límites importantes: sigue habiendo problemas con diagramas muy precisos, detalles repetitivos, superficies ocultas o tareas que exigen una representación física totalmente consistente.
Con este lanzamiento, OpenAI intenta diferenciar su propuesta no tanto por el estilo visual puro como por el grado de control y utilidad. La apuesta es que generar imágenes con IA deje de ser solo una herramienta creativa experimental y pase a encajar mejor en procesos de trabajo donde importan la precisión y la reutilización.
Te interesa 👉 Los mejores portátiles para inteligencia artificial
La clave ahora será comprobar si esa promesa se cumple fuera de la demo. Porque en un mercado lleno de modelos que ya generan imágenes vistosas, el salto realmente importante no está en hacer algo bonito, sino en entregar algo que sirva de verdad a la primera.
Nvidia ha actualizado el precio de su tarjeta gráfica para estaciones de trabajo más potente…
Tras casi un año desde el lanzamiento de la arquitectura RDNA 4, las tarjetas gráficas…
Llega el verano y con él pasar más tiempo fuera, y eso también nos referimos…