28.07.2023 - 08:15 / forklog.com

Исследователи заставили ChatGPT и Bard сгенерировать незаконный контент

Эксперты из США смогли обойти системы безопасности чат-ботов ChatGPT, Bard и Claude, которые блокируют генерацию оскорбительных и незаконных материалов.

По данным исследователей Университета Карнеги-Меллона и Центра безопасности искусственного интеллекта в Сан-Франциско, существует «довольно простой» метод взлома языковых моделей.

Он включает добавление длинных суффиксов-символов к подсказкам для нейросетей. Аналитики проверили способ на примере запроса об изготовлении бомбы, который различные ИИ ранее отказывались предоставлять.

происшествия исследования искусственный интеллект общество кража США New York Сан-Франциско

Читать на forklog.com

Все новости от forklog.com

Об этом же в других СМИ

«Заставили страну гордиться». Джо Байден — женской сборной США, провалившей ЧМ-2023 championat.com / 10 месяцев назад

Исследователи из Гарварда выявили экологичную диету, которая снижает риск смерти championat.com / 10 месяцев назад

Автоматизация «запрещенки» в ChatGPT, хак соцсетей «Уралсиба» и другие события кибербезопасности forklog.com / 10 месяцев назад

Сайт imag.one - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Сейчас читают