De acuerdo con la compañía tecnológica, esta herramienta combina el último modelo Imagen 3 con las avanzadas capacidades de comprensión visual y descripción de Gemini.
El gigante tecnológico, Google, acaba de lanzar Whisk, su nueva inteligencia artificial capaz de transformar tus imágenes en animaciones, desde un peluche digital hasta un pin esmaltado o una calcomanía.
De acuerdo con Google, Whisk combina su último modelo Imagen 3 con las capacidades de comprensión visual y descripción de Gemini. El modelo Gemini escribe automáticamente un título detallado de sus imágenes y luego introduce esas descripciones en Imagen 3. Este proceso le permite remezclar fácilmente sus sujetos, escenas y estilos de formas nuevas y divertidas.
«En lugar de generar imágenes con indicaciones de texto largas y detalladas, Whisk te permite indicarlas con imágenes. Simplemente arrastra las imágenes y comienza a crear», escribió Google en un comunicado.
La compañía indica que, dado que Whisk extrae solo algunas características clave de tu imagen, es posible que genere contenido que difieran de tus expectativas. Por ejemplo, el sujeto generado puede tener una altura, un peso, un peinado o un tono de piel diferentes.
«Entendemos que estas características pueden ser cruciales para tu proyecto y que Whisk puede no estar a la altura, por lo que te permitimos ver y editar las indicaciones subyacentes en cualquier momento», comentó Google.
La plataforma destaca que en sus primeras pruebas con artistas y creativos, los usuarios han descrito Whisk como un nuevo tipo de herramienta creativa, mas no como un editor de imágenes tradicional.
«Lo creamos para una exploración visual rápida, no para ediciones perfectas. Se trata de explorar ideas de formas nuevas y creativas, lo que te permite trabajar con docenas de opciones y descargar las que más te gustan», concluyó Google.
Cabe agregar que esta herramienta de inteligencia artificial se encuentra disponible actualmente solo en Estados Unidos.