Исследовательская группа компании Meta* выпустила нейросеть VFusion3D, предназначенную для генерации трёхмерных моделей. Разработчики заявляют, что нейросеть показывает лучшие результаты по максимальному разрешению моделей и создаёт минимум артефактов.Команда проекта отметила, что в мире пока нет нейросетей для генерации качественных трёхмерных моделей из-за того, что сложно получить данные для обучения.
Ситуация проще обстоит с текстами, музыкой и видео — этих данных много в свободном доступе. Исследователи Meta* решили эту проблему, собрав собственный датасет синтетических данных, созданный с помощью видеодиффузии.
На этом наборе и обучали VFusion3D.Итоговая нейросеть генерирует 3D-объекты в высоком разрешении и с меньшим количеством ошибок, если сравнивать результат с другими открытыми решениями.
Читать на habr.com