Reuters стартап forbes Reuters
/ gagadget.com

Perplexity, OpenAI и Anthropic нелегально используют статьи известных изданий для обучения своих моделей ИИ

Reuters сообщает, что некоторые компании искусственного интеллекта (ИИ) игнорируют инструкции robots.txt, предназначенные для предотвращения сбора данных с веб-сайтов.Это вызвало беспокойство среди издателей, которые утверждают, что ИИ-компании воруют их контент без разрешения и используют его для обучения своих моделей.Один из примеров - компания Perplexity, которая описывает себя как "бесплатная поисковая система ИИ".

Ее обвинили в краже статей Forbes и повторной публикации их на собственных платформах. Wired также сообщил, что Perplexity игнорирует robots.txt сайта Condé Nast и других изданий, чтобы собирать их контент.По данным Reuters, Perplexity не одна такая компания.

Агентство получило письмо от TollBit, стартапа, который помогает издателям лицензировать свой контент компаниям ИИ. В письме говорится о том, что "агенты ИИ из многих источников решили обойти robots.txt, чтобы получать контент с сайтов".TollBit не называет конкретных компаний, но Business Insider сообщает, что OpenAI и Anthropic, разработчики чат-ботов ChatGPT и Claude соответственно, также игнорируют robots.txt.Издатели обеспокоены тем, что ИИ-компании используют их контент без их согласия и без надлежащей компенсации.

Читать на gagadget.com
Сайт imag.one - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Сейчас читают

DMCA