Исследование, проведенное учеными из Apple, ставит под сомнение интеллектуальные способности крупных языковых моделей (LLM) от OpenAI, Google и Meta*, которые ранее получили признание за свои впечатляющие навыки рассуждения.
Исследователи утверждают, что эти модели скорее демонстрируют «сложное сопоставление шаблонов», чем «истинное логическое мышление».
Даже продвинутые модели, такие как OpenAI o1, не исключение.Одним из основных тестов для проверки навыков рассуждения языковых моделей является GSM8K.
Читать на habr.com