28.07.2024 - 11:27 / habr.com

Специалисты «Яндекса» разработали решение, позволяющее бизнесу сократить расходы на внедрение нейросетей до восьми раз

Команда Yandex Research совместно с исследователями IST Austria и Kaust разработала и опубликовала в свободном доступе новые методы сжатия больших языковых моделей.

По словам разработчиков, эти методы позволяют сократить бизнесу расходы на вычислительные ресурсы до восьми раз. Чтобы большая языковая модель отвечала качественно и быстро, требуется множество дорогостоящих мощных графических процессоров.

Решение «Яндекса» позволяет уменьшить модель в несколько раз. Это сокращает количество необходимых для работы процессоров и позволяет запустить её на устройствах с меньшей вычислительной мощностью.

бизнес технологии Яндекс IgnatChuker Австрия

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Регулятор Японии заявил об осторожности в решении по одобрению криптовалютных ETF incrypted.com / 1 месяц назад

Разработчик показал способ подключения электронной книги Kindle в качестве внешнего e-ink-монитора habr.com / 1 месяц назад

Регулятор Бразилии одобрил запуск Solana-ETF incrypted.com / 1 месяц назад

Сайт imag.one - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Сейчас читают