NoticiasTarjetas gráficas

NVIDIA GauGAN2, genera imágenes precisas a partir de texto

Nvidia ha anunciado la última versión de GauGAN2, la demo de pintura con tecnología de IA que puede convertir textos en imágenes precisas.

NVIDIA GauGAN2, genera imágenes precisas a partir de texto

GauGAN2 se basa en el aprendizaje profundo para realizar esta acción, con imágenes super-nitidez.

Mientras que la versión original sólo podía convertir un boceto en una imagen detallada, GauGAN2 puede generar imágenes a partir de frases como «puesta de sol en una playa». La función de poder crear imágenes de alta calidad mediante un dibujo o boceto sigue estando allí, incluso mejorado, pero la gran novedad es la de poder crear estas imágenes con textos.

GauGAN pueden funcionar de esta manera gracias a las redes generativas adversariales (GAN), sobre las que puedes obtener más información en este artículo de Nvidia.

Nvidia dice: «Con sólo pulsar un botón, los usuarios pueden generar un mapa de segmentación, un esquema de alto nivel que muestra la ubicación de los objetos en la escena. A partir de ahí, pueden pasar a dibujar, retocando la escena con bocetos utilizando etiquetas como cielo, árbol, roca y río, permitiendo que el pincel inteligente incorpore estos garabatos en imágenes impresionantes».

Te recomendamos nuestra guía sobre las mejores tarjetas gráficas del mercado

Al añadir funciones de conversión de texto a imagen, la nueva versión de GauGAN es más personalizable. La última versión es también uno de los primeros modelos de IA que incorpora múltiples modalidades, texto, segmentación semántica, boceto y estilo, dentro de una única red GAN.

Nvidia añade: «Es un proceso iterativo, en el que cada palabra que el usuario escribe en el cuadro de texto añade más a la imagen creada por la IA».

Naturalmente, no es tan precisa como crear una imagen mediante bocetos, pero sirve para generar una imagen ‘random’ con una descripción de lo que realmente queremos ver.

Pueden descargarla desde el siguiente enlace.

Fuente
dpreview

Gustavo Gamarra

Soy operador de PC e instalador de redes informáticas , redactor y escritor en mis ratos libres. Amante de la tecnología, el cine, el fútbol y los videojuegos.
Los datos de carácter personal que nos facilite mediante este formulario quedarán registrados en un fichero de Miguel Ángel Navas Carrera, con la finalidad de gestionar los comentarios que realizas en este blog. La legitimación se realiza a través del consentimiento del interesado. Si no se acepta no podrás comentar en este blog. Puedes consultar Política de privacidad. Puede ejercitar los derechos de acceso, rectificación, cancelación y oposición en [email protected]
Botón volver arriba