Эта модель – на самом деле та самая Strawberry, о которой ходило так много слухов. В олимпиадном программировании o1 выбивает метрики в 8 раз выше своего предшественника GPT-4o, а по олимпиадной математике входит в число 500 лучших студентов США.
А еще модель превосходит уровень PhD по точности ответов на вопросы по физике, биологии и химии.Основная соль модели в ее умении "думать" подобно тому, как человек раздумывает перед тем, как ответить на сложный вопрос.
Эта модель, в отличие от предшественников, перед ответом дольше рассуждает и использует технику chain of thought, то есть цепочку мыслей.
Читать на habr.com