A diferencia de otros generadores que requieren de largas descripciones textuales, la nueva herramienta experimental de Google Labs permite utilizar imágenes como punto de partida.
Google Labs ha presentado en Estados Unidos su más reciente experimento en inteligencia artificial generativa: Whisk. A diferencia de las plataformas tradicionales donde las imágenes se generan mediante largas descripciones textuales, Whisk permite utilizar imágenes como punto de partida. Con un simple arrastre, los usuarios pueden comenzar a crear y transformar ideas visuales de forma intuitiva.
La herramienta funciona a través de la combinación de tres elementos clave: una imagen para el sujeto, otra para el escenario y una tercera que define el estilo. A partir de estas bases, Whisk genera resultados únicos que van desde un peluche digital hasta un pin esmaltado o una pegatina. Esta innovación está impulsada por el modelo de lenguaje Gemini, que redacta automáticamente una descripción detallada de las imágenes ingresadas. Dichas descripciones son luego procesadas por el modelo de generación de imágenes más avanzado de Google: Imagen 3.
La plataforma está diseñada para la exploración visual rápida y la experimentación creativa, permitiendo probar decenas de variaciones hasta encontrar el resultado deseado. Esta herramienta resulta especialmente útil para artistas, diseñadores y creadores que buscan desbloquear nuevas ideas y perspectivas visuales.
Uno de los aspectos más interesantes de Whisk es su capacidad para capturar la esencia de las imágenes originales sin replicarlas de manera exacta. Sin embargo, este enfoque también puede generar resultados inesperados: por ejemplo, los sujetos pueden aparecer con diferentes peinados, tonos de piel o proporciones. Para solucionar esto, Whisk ofrece la posibilidad de visualizar y editar las descripciones generadas por la IA, otorgando a los usuarios un mayor control sobre el producto final.
Las pruebas iniciales con artistas y profesionales creativos han destacado el potencial de Whisk como una nueva categoría de herramienta visual, alejada de las plataformas de edición tradicionales. Al centrarse en la exploración de ideas, Google apunta a democratizar el proceso creativo, permitiendo a cualquier usuario experimentar con estilos, escenarios y sujetos de manera rápida y sencilla.
Por ahora, Whisk está disponible exclusivamente en Estados Unidos a través de labs.google/whisk. No obstante, su llegada marca un precedente en el uso de inteligencia artificial para la creación visual, y puede transformar la manera en que imaginamos y construimos imágenes en el mundo digital.
Comments