La generación de imágenes con herramientas de inteligencia artificial se ha convertido en uno de los usos fundamentales de las mismas, ya sea con motivos profesionales o por entretenimiento. En esa tarea, Google ha captado la atención del público tras el lanzamiento de su IA Nano Banana. Veamos de qué se trata.
Según el blog oficial de Google, la actualización permite combinar múltiples imágenes en una sola, mantener la coherencia de los personajes, realizar transformaciones específicas utilizando lenguaje natural y utilizar el conocimiento de Gemini para generar y editar imágenes.

Aunque genera imágenes con bastante precisión y realismo, donde la IA Nano Banana destaca especialmente es en la combinación de imágenes. Subiendo más de una imagen al chat, la herramienta puede crear una a partir de ambas.

La nueva herramienta para crear imágenes de Google también respeta bastante el contexto de la imagen inicial, en caso de que se intente seguir una secuencia de generación.
Además, en comparación con el generador de imágenes de ChatGPT, la novedad de Google tiene un tiempo de generación mucho menor que el chatbot de OpenAI. Además, las fotos creadas con esta última tienen menos realismo que las de Nano Banana.

El acceso a Nano Banana se puede realizar a partir de la página web de Gemini, o su aplicación móvil. La función se puede emplear de forma gratuita. La herramienta es líder en generación de imágenes en la LMArena, una plataforma web pública que evalúa modelos de IA.
Parece que cada vez quedan más lejos aquellos tiempos iniciales donde las imágenes generadas con inteligencia artificial nos devolvían personas con más dedos de la cuenta. Y el proceso se ha simplificado, tras lo complicado que era el servidor de Discord de Midjourney. Si ya llegamos a este nivel, ¿qué vendrá para el futuro?
Flash del día

Microsoft ha lanzado MAI-Voice-1, un modelo de generación de voz al cual se puede acceder a través de Copilot Labs. Puede generar un minuto de audio rápidamente, y permite personalizar la voz y el estilo de habla.
El otro proyecto de la compañía, MAI-1-preview, actualmente funciona con tecnología OpenAI y proporciona “respuestas [de texto] útiles a consultas [de texto] cotidianas” y, después de las pruebas de usuario, se integrará en Copilot.
Prompt de la semana

Practica un idioma extranjero con ayuda de inteligencia artificial.
Recomiéndame tres podcasts/videos gratuitos de [idioma] de mi nivel. Después de escucharlos, hazme cinco preguntas de comprensión para cada uno.