Google ha lanzado una nueva herramienta de IA llamada Whisk, desarrollada por Google Labs. Permite crear imágenes introduciendo imágenes en lugar de texto. Puedes arrastrar fotos para el tema, la escena y el estilo, y luego remezclarlas para crear algo único.
Un experimento creativo
Whisk utiliza el modelo Gemini para escribir automáticamente un pie de foto detallado de tus imágenes y luego introduce esas descripciones para generar la imagen final.
La herramienta está disponible en la web en labs.google/whisk, aunque para que llegue a España todavía tenemos que esperar. Google afirma que, aunque Whisk no siempre crea imágenes fieles a los datos introducidos, pretende ser un «nuevo tipo de herramienta creativa» para la exploración visual rápida.
La polémica está servida
Las herramientas de inteligencia artificial de Google han generado polémica últimamente. A principios de este año, Google presentó Gemini, su modelo de imagen «de última generación», e Imagen 3, que produce imágenes a partir de descripciones textuales. Sin embargo, Gemini e Imagen 3 han sido objeto de críticas por generar imágenes que refuerzan estereotipos nocivos.
En respuesta, Google modificó Gemini e Imagen 3 para reducir la probabilidad de que los modelos generaran imágenes de, por ejemplo, personas delante de camiones de bomberos o médicos con batas de laboratorio. Sin embargo, como Google ha reconocido, es difícil eliminar en última instancia el riesgo de que los modelos generen imágenes problemáticas.
Otros modelos similares
La empresa también lanzó recientemente Veo, un modelo de generación de vídeo, que también ha sido criticado por generar contenidos que podrían utilizarse de forma perjudicial.
En una entrada de blog sobre Whisk, Google dice que entiende que «estas características pueden ser cruciales para su proyecto y Whisk puede no dar en el clavo», pero que Whisk se trata de «permitirle trabajar a través de docenas de opciones y descargar las que más le gusten.»
«Whisk es un nuevo tipo de herramienta de exploración visual», afirma en un comunicado Thomas Iljic, director de gestión de productos de Google Labs. «En nuestras primeras pruebas con artistas y creativos, la gente ha descrito Whisk como una nueva herramienta creativa, no como un editor de imágenes tradicional. Lo hemos creado para la exploración visual rápida, no para ediciones perfectas».
Iljic añadió que, aunque Whisk se lance en EE.UU., forma parte de un esfuerzo más importante de Google por cocinar experimentos con modelos generativos de IA.