NVIDIA представила технологию VideoLDM — нейросеть, которая умеет создавать небольшие ролики на основе текста. Сейчас ИИ способен генерировать видео длительностью до пяти секунд в разрешении 2048х1280 пикселей и с частотой 24 кадра в секунду.
Нейросеть способна создавать ролики как из простых описаний («Кот спит»), так и из сложных («Астронавт стоит в озере, полным уток, и наблюдает за ними»).
Как заявляют в NVIDIA, алгоритм учитывает около 4,1 млрд различных параметров, больше половины которых он «извлёк» из других видео.
Читать на championat.com