Компания Meta разработала систему искусственного интеллекта для перевода бесписьменного хоккиенского языка на английский. Хоккиен распространен в странах Юго-Восточной Азии и насчитывает около 49 млн носителей.
Его особенность — отсутствие единой системы письма. Всего таких языков в мире насчитывается около 3500. Чтобы обучить искусственный интеллект понимать человеческую речь, исследователи обычно передают компьютеру большой набор письменных расшифровок.
Однако для хоккиена собрать датасет проблематично. Исследователи Meta сосредоточились на разработке системы speech-to-speech.
Читать на forklog.com