Google Labs начала тестировать Whisk — экспериментальный сервис для генерации изображений без текстовых подсказок пользователей.
Он позволяет отправлять картинки в качестве входных данных и получать их переработанные варианты.Whisk позволяет отправить отдельные изображения для объекта, сцены и стиля.
Затем сервис ремикширует их. Под капотом сервиса работает модель Gemini, которая в момент загрузки исходных картинок автоматически создаёт их подробное описание.
Читать на habr.com