Разработчики не только заставили чат-бота вести себя злонамеренно, но также обнаружили, что избавиться от такого поведения потом очень сложно.
Ученые определили, что модели искусственного интеллекта можно научить обманывать людей, вместо того, чтобы давать правильные ответы на их вопросы.
Нейросети оказались весьма способными в этом деле, передает РСmag. Все началось с того, что в сентябре 2023 года компания Amazon инвестировала в стартап Anthropic около 4 млрд долларов США, сделав ее частичным владельцем.
Читать на focus.ua