Inteligencia Artificial de Google crea imágenes superrealistas con solo una descripción texto

 Inteligencia Artificial de Google crea imágenes superrealistas con solo una descripción texto
Inteligencia Artificial de Google crea imágenes superrealistas con solo una descripción texto

Google ha demostrado repetidamente de lo que son capaces sus diversos algoritmos de aprendizaje automático, como MUM o LaMDA, y continúa reflejandolos con un nuevo modelo de inteligencia artificial llamado ‘Imagen’.

Según Jeff Dean, jefe de IA de la compañía, esto promete “liberar la creatividad conjunta entre humanos y computadoras” y poder generar imágenes a partir de una sola descripción de texto, breve y simple.

‘Imagen’ es muy similar a DALL-E-2, la inteligencia artificial desarrollada por Open AI (empresa fundada por Elon Musk) que también permite crear una imagen a partir de una descripción escrita. Sin embargo, existen algunas diferencias entre los dos modelos, como el nivel de detalle y la eficiencia a la hora de crear esta imagen.

Inteligencia Artificial de Google crea imágenes superrealistas con solo una descripción texto

En concreto, Google asegura que su IA proporciona resultados con un nivel de detalle mucho más preciso que otros sistemas. Para verificar esto, la compañía ha creado un benchmark llamado DrawBench, que compara su modelo de IA con modelos similares, y presenta los resultados uno al lado del otro para que puedan ser vistos por el usuario. El “evaluador humano” puede distinguir entre ellos y elegir el más realista.

Estas personas, según la empresa, concluyeron que las fotografías producidas por ‘Imagen’ eran de mayor calidad y “imágenes alineadas al texto descrito”, siendo mejor que el resto de los modelos.

Inteligencia Artificial de Google crea imágenes superrealistas con solo una descripción texto

Una inteligencia artificial más eficiente que otras

‘Imagen’, la IA de Google que genera una imagen a partir de una breve descripción de texto, también es “más eficiente computacionalmente, más eficiente en memoria y converge más rápido” gracias a su arquitectura patentada llamada AT. Como resultado, las imágenes surrealistas se producen con mayor precisión que cualquier otro modelo y de cualquier tipo de descripción de texto.

“Una escultura transparente de un pato hecha de vidrio. La escultura está frente a una pintura de un paisaje”, “una pareja de robots para cenar con la Torre Eiffel de fondo”, o “un perro mirándose curiosamente en el espejo, viendo a un gato”, son frases que Google usa como ejemplo para demostrar de lo que es capaz su modelo de IA.

Google, por otro lado, afirma que “Imagen” también puede generar imágenes con descripciones basadas en ubicaciones específicas o incluso texto complejo. Por ejemplo, si un usuario ingresa “Una jirafa corriendo con un conejo en el estadio La Bombonera de Buenos Aires”, la IA de la empresa generará una imagen basada en esta descripción y comprenderá el nombre científico de ambos animales, así como los lugares.

Inteligencia Artificial de Google crea imágenes superrealistas con solo una descripción texto

‘Imagen’ es, en este momento, un proyecto interno y no accesible al público, ya que puede dar lugar a la creación de imágenes que contengan “estereotipos y representaciones perjudiciales”, tal y como explica la compañía.

“Imagen se basa en codificadores de texto entrenados en datos a escala web no curados y, por lo tanto, hereda los sesgos sociales y las limitaciones de los grandes modelos lingüísticos. Como tal, existe el riesgo de que Imagen haya codificado estereotipos y representaciones perjudiciales, lo que guía nuestra decisión de no liberar Imagen para uso público sin más salvaguardias”, menciona Google.

Fuente: Infobae

Comentar

PAT Digital

Related post