04.04.2024 - 10:34 / habr.com

Модели Voice Engine от OpenAI требуется всего лишь 15-секундный образец для клонирования голоса

OpenAI предложила ограниченный доступ к платформе преобразования текста в голос Voice Engine, которой достаточно 15-секундного образца для клонирования голоса.

Сгенерированный искусственным интеллектом голос способен по команде зачитывать текстовые подсказки на языке исходника или других языках.Одними из первых доступ к Voice Engine получили компания в сфере образовательных технологий Age of Learning, платформа визуального повествования HeyGen, ведущий производитель программного обеспечения для здравоохранения Dimagi, разработчик коммуникационных приложений на базе ИИ Livox и система здравоохранения Lifespan.В OpenAI поделились, что разработка Voice Engine стартовала в конце 2022 года.

Технология уже поддерживает предустановленные голоса для API преобразования текста в речь и функции чтения вслух ChatGPT.Член команды разработчиков Voice Engine Джефф Харрис рассказал, что модель обучили на «сочетании лицензированных и общедоступных данных».

искусственный интеллект нейросети ИИ OpenAI Джо Байден TravisMacrif США Голос

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Samsung расширяет функции Galaxy AI на старые модели смартфонов gagadget.com / 3 месяца назад

НАСА отобрало три компании для разработки лунного ровера, который будут использовать астронавты «Артемиды» habr.com / 3 месяца назад

В Facebook** появится полноценный видеоплеер для всех форматов habr.com / 3 месяца назад

Сайт imag.one - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Сейчас читают