Исследователи Google разработали новую систему искусственного интеллекта VLOGGER, способную генерировать реалистичные видеоролики с движущимися и говорящими людьми всего лишь по одной фотографии.
VLOGGER может взять на вход фотографию человека и аудиодорожку, а затем синтезировать видео, в котором этот человек произносит слова, делает соответствующие мимику, жесты и движения головой.
Хотя генерируемые ролики неидеальны, они демонстрируют значительный прогресс в оживлении статичных изображений.Для создания модели разработчики собрали огромній набор данных MENTOR с более чем 800 000 людей и 2200 часами видео.
Читать на gagadget.com