Inteligencia artificial

OpenAI lanza ChatGPT Images 2.0 con mejor control, texto más preciso y soporte para varios formatos de imagen

Ya se puede probar el nuevo generador de imágenes de OpenAI, ChatGPT Images 2.0, con mejor texto, soporte multilingüe y funciones avanzadas con razonamiento

OpenAI ha presentado ChatGPT Images 2.0, una nueva versión de su modelo de generación de imágenes con la que quiere llevar esta tecnología más allá de la ilustración llamativa y acercarla a usos prácticos como interfaces, infografías, material educativo, diseño comercial o contenido multilingüe. La compañía sostiene que el nuevo sistema mejora de forma notable el seguimiento de instrucciones, composición, colocación de objetos y renderizado de texto dentro de la propia imagen.

Uno de los cambios más destacados está en la integración con los modelos con capacidad de razonamiento dentro de ChatGPT. Cuando el usuario elige uno de esos modos, Images 2.0 puede apoyarse en procesos adicionales para estructurar mejor el resultado, generar varias imágenes coherentes en una sola petición e incluso consultar información reciente en línea para tareas donde el contexto actualizado sea importante.

Por ejemplo, nosotros le pedimos que generara varias imágenes de una sola tirada usando nuestro logo y solicitando que introdujera textos en catalán en distintos escenarios de la ciudad de Barcelona. El resultado fue el siguiente:

ChatGPT Images 2.0 es más útil para trabajo real y con mejor soporte multilingüe

La compañía asegura que el modelo rinde mejor con texto denso, iconografía, composiciones complejas y varios idiomas, con mejoras específicas en japonés, coreano, chino, hindi y bengalí. También amplía los formatos de salida con relaciones de aspecto que van desde 3:1 hasta 1:3, lo que facilita generar piezas pensadas para banners, redes sociales, carteles, pantallas móviles o diapositivas. En la API, además, podrá producir imágenes de hasta 2K de resolución, aunque esa opción sigue en beta.

Esta captura de pantalla está generada por el nuevo modelo de OpenAI

OpenAI sitúa el nuevo modelo como una herramienta para diseño, marketing, prototipado, educación y creación de producto, y subraya que ya está disponible para usuarios de ChatGPT, Codex y la API. Las funciones avanzadas ligadas al modo “thinking” quedarán reservadas a planes Plus, Pro y Business. La empresa también reconoce límites importantes: sigue habiendo problemas con diagramas muy precisos, detalles repetitivos, superficies ocultas o tareas que exigen una representación física totalmente consistente.

Con este lanzamiento, OpenAI intenta diferenciar su propuesta no tanto por el estilo visual puro como por el grado de control y utilidad. La apuesta es que generar imágenes con IA deje de ser solo una herramienta creativa experimental y pase a encajar mejor en procesos de trabajo donde importan la precisión y la reutilización.

Te interesa 👉 Los mejores portátiles para inteligencia artificial

La clave ahora será comprobar si esa promesa se cumple fuera de la demo. Porque en un mercado lleno de modelos que ya generan imágenes vistosas, el salto realmente importante no está en hacer algo bonito, sino en entregar algo que sirva de verdad a la primera.

Siguiente Elgato Wave XLR MK.2 Review en Español (Análisis completo) »

Anterior « Nunca imaginé que querría una alfombrilla gaming de cristal: la Razer Atlas Pro me ha hecho cambiar de idea

Microsoft prepara una superapp para unir Copilot, GitHub Copilot y su nueva IA agéntica en un solo lugar

Menos del 4,5 % de los 450 millones de clientes de Microsoft 365 pagan actualmente…

2 horas atrás

Procesadores

Qualcomm subirá el precio de todos sus chips para móviles a partir del 1 de septiembre

Los móviles con procesador Qualcomm costarán más a partir de septiembre. El consejero delegado de…

3 horas atrás

Videoconsolas

Satya Nadella quiere que Xbox crezca en 2027. La realidad es que la compañía cada vez ingresa menos y pierde dinero

Los ingresos de Xbox llevan tiempo que no son los que Microsoft podía esperar de…

4 horas atrás