В мае в ходе анонса GPT-4o OpenAI объявила, что голосовой режим ChatGPT будет использовать аудиовозможности модели для обеспечения общения с пользователями практически без задержек.
Теперь эту опцию открывают для подписчиков ChatGPT Plus.Команда OpenAI описала голосовые возможности GPT-4o следующим образом: «С помощью GPT-4o мы обучили одну новую модель сквозному распознаванию текста, изображений и звука, а это означает, что все входы и выходы обрабатываются одной и той же нейронной сетью».В июне OpenAI объявила, что отложит внедрение расширенного голосового режима на месяц.
Компания отметила, что ей требуется больше времени для улучшения способности модели обнаруживать и отклонять определённый контент.
Читать на habr.com