Улучшенная версия нейросети GPT-4 Omni, или просто GPT-4o, теперь может одновременно работать и с текстом, и с картинками, и даже с видео или аудио.
По словам представителей OpenAI, нейросеть теперь может выполнять функции голосового помощника. Она наделена способностью эмоционально передавать информацию, интонировать, заигрывать и даже петь.
Скорость отклика на голосовой запрос составляет всего 0,3 секунды, а значит, диалог с «машиной» станет более «живым». Среди нововведений также и улучшения в части анализа и интерпретации динамичных визуальных данных – различных действий из видеосцен.
Читать на chudo.tech