Imagen 4: el nuevo modelo de IA de Google que genera imágenes con texto perfectamente integrado
La herramienta promete revolucionar el diseño visual con su capacidad de renderizar mensajes escritos de forma precisa y estética dentro de imágenes generadas por inteligencia artificial
Google ha presentado oficialmente Imagen 4, su modelo más avanzado de inteligencia artificial para la generación de imágenes a partir de texto, disponible desde hoy en versión preliminar para desarrolladores a través de la API de Gemini y la plataforma Google AI Studio. Este lanzamiento marca un hito en la evolución de los modelos de “texto a imagen”, al resolver una de las limitaciones más persistentes del sector: la incorporación coherente y legible de texto dentro de las imágenes.
La innovación fue anunciada en el blog oficial para desarrolladores de la compañía, donde los responsables del proyecto —Alisa Fortin, Seth Odoom y Guillaume Vernade— destacaron que Imagen 4 introduce mejoras “significativas” en la renderización de texto, un avance clave para aplicaciones publicitarias, prototipos de productos, medios editoriales y diseño visual en general.
Hasta ahora, la mayoría de modelos generativos tenían dificultades al integrar mensajes escritos en carteles, logotipos o etiquetas, lo que derivaba en errores ortográficos, frases distorsionadas o texto ilegible. Con esta nueva versión, los usuarios pueden describir escenas que incluyan nombres, frases o mensajes concretos y recibir una imagen con el texto correctamente escrito y visualmente bien posicionado.
Esta capacidad amplía enormemente las aplicaciones prácticas del modelo, permitiendo desde la creación de anuncios personalizados hasta ilustraciones editoriales con mensajes claros. Imagen 4 también representa un movimiento estratégico de Google para competir con plataformas como Midjourney o DALL·E 3 de OpenAI, que lideran el mercado pero aún enfrentan desafíos al generar texto dentro de imágenes.
Creación original de Google Imagen 4
Acceso y precios
Por el momento, Imagen 4 está disponible en formato de vista previa de pago para desarrolladores mediante la API de Gemini. Cada imagen generada tiene un costo de 0,04 dólares en la versión estándar, mientras que la versión Ultra se ofrece por 0,06 dólares por imagen.
Google también habilitó acceso limitado gratuito a través de Google AI Studio, donde los usuarios pueden probar la herramienta desde un entorno web sin necesidad de integración técnica. Se espera que en las próximas semanas se habiliten nuevos niveles de facturación y se amplíen los límites de uso para quienes requieran mayor capacidad.
Este avance no solo mejora la experiencia de generación visual, sino que también fortalece la competencia en un sector en constante expansión. Imagen 4 apunta a convertirse en una herramienta clave para diseñadores, desarrolladores y creadores de contenido que buscan precisión y estética en imágenes generadas por IA.
Noticias relacionadas
- Imagen 4: el nuevo modelo de IA de Google que genera imágenes con texto perfectamente integrado
- ¿Afecta la IA al pensamiento crítico de los estudiantes?
- Gobierno plantea ley para sancionar hasta con 18 años de cárcel a adolescentes por homicidio y violación
- Facebook reemplaza contraseñas con un nuevo sistema de inicio de sesión más seguro
- Bruno Mars será la estrella del Fortnite Festival en la Temporada 9