Mozilla объявила о том, что Firefox будет использовать искусственный интеллект для улучшения доступности браузера. В грядущей версии Firefox 130, которая уже доступна в бета-версии Nightly, появится новая функция: автоматическая генерация текстовых описаний для изображений с помощью ИИ.Текстовые описания изображений (или "альтернативный текст") помогают пользователям скринридеров понимать контекст изображений.
Однако многие веб-сайты не предоставляют такие описания, делая контент недоступным для значительной части пользователей. Согласно Web Almanac 2022, почти половина изображений в интернете не имеет альтернативного текста. Как работает? Mozilla интегрировала в Firefox локальную модель машинного обучения, которая генерирует описания изображений, не отправляя данные на внешние серверы.
Модель основана на архитектуре трансформеров, которая демонстрирует высокую точность в обработке изображений и доступна для различных типов устройств.Модель, генерирующая текстовые описания, занимает около 200 МБ дискового пространства.
Читать на habr.com