Нейросеть, созданная американскими специалистами, научилась «рисовать» лицо человека по спектрограмме его речи. Программа способна определять по голосу три основных параметра: пол, возраст и расу, сообщает arXiv.org.
Ученые из Массачусетского технологического университета использовали для обучения алгоритма базу из миллиона видеоотрывков, на которых были запечатлены около ста тысяч людей.
Каждую запись разделили на видео- и аудиоматериалы. Одна часть программы на основании видеокадров воссоздавала лицо человека в анфас, другая анализировала спектрограмму речи и создавала примерное изобра...
Читать на mir24.tv