Mistral представила модели машинного обучения MathΣtral и Codestral, предназначенные для решения математических задач и генерации кода соответственно.
Обе нейросети опубликованы под лицензией Apache 2.0.MathΣtral представляет собой базовую языковую модель Mistral 7B, дополнительно обученную на математических данных и полном курсе STEM (Science, Technology, Engineering, Mathematics).
Нейросеть создавали вместе с исследователями из Project Numina, которые специализируются на разработке математических моделей.Нейросеть Codestral предназначена для генерации кода и построена на архитектуре Mamba V2.
Читать на habr.com