На портале arXive команда исследователей Google анонсировала модель машинного обучения Imagen 3, предназначенную для генерации изображений по текстовому описанию.
Она заменит собой прошлую версию и будет доступна в сервисе ImageFX.Нейросеть Imagen 3 по умолчанию создаёт изображения с разрешением 1024×1024 пикселей.
При этом есть возможность увеличить разрешение в 2, 4 и 8 раз. В компании считают, что Imagen 3 лучше других моделей на рынке справляется с созданием фотореалистичных картинок и может обрабатывать длинные запросы с обилием деталей.Для датасета использовали уникальные изображения, которые прошли через несколько фильтров.
Читать на habr.com