Подобно настоящему мозгу, некоторые программы опираются на обучение с подкреплением, когда верное поведение вознаграждается разными способами. Исследователи считают, что похожим образом может работать система вознаграждения, основанная на дофамине, — говорится в материале.
Теорию подтвердили эксперименты с мышами. Изучив их мозг во время выполнения разных задач, учёные выяснили, что часть нейронов выстраивают вероятностную модель получения награды, передаёт портал Venture Beat.
Читать на news.ru