Чат-боты с искусственным интеллектом незаконно копируют новости, защищенные авторским правом, утверждает медиа-группа

Разработчики искусственного интеллекта в значительной степени полагаются на незаконное получение материалов, защищенных авторским правом, из новостных изданий и журналистов для обучения своих моделей, утверждает группа новостной индустрии.

30 октября News Media Alliance (NMA) опубликовал 77-страничный технический документ и сопровождающее его заявление в Бюро регистрации авторских прав США, в котором утверждается, что наборы данных, которые обучают модели ИИ, используют значительно больше контента издателей новостей по сравнению с другими источниками.

В результате поколения ИИ «копируют и используют контент издателей в своих продуктах», что нарушает их авторские права и ставит новостные агентства в конкуренцию моделям ИИ.

«Многие разработчики генеративного искусственного интеллекта решили без разрешения собирать контент издателей и использовать его для обучения моделей, а также в режиме реального времени для создания конкурирующих продуктов», — подчеркнула NMA в заявлении от 31 октября.

В понедельник News/Media Alliance опубликовал Белую книгу и технический анализ, а также представил в @CopyrightOffice комментарии по поводу использования контента издателей для поддержки генеративных технологий искусственного интеллекта (#GAI). https://t.co/Zr05e7nZTS
– Новости/Медиа Альянс (@newsalliance) 31 октября 2023 г.

Группа утверждает, что в то время как издатели новостей инвестируют и берут на себя риски, разработчики ИИ получают вознаграждение «в виде пользователей, данных, создания бренда и долларов на рекламу».

Сокращение доходов, возможности трудоустройства и испорченные отношения со зрителями — это еще одни неудачи, с которыми сталкиваются издатели, говорится в сообщении NMA, поданном в Бюро регистрации авторских прав.

Чтобы бороться с этими проблемами, NMA рекомендовало Бюро авторских прав объявить, что использование контента публикации для монетизации систем искусственного интеллекта наносит вред издателям. Группа также призвала к использованию различных моделей лицензирования и мер прозрачности для ограничения использования материалов, защищенных авторским правом.

NMA также рекомендует Ведомству авторских прав принять меры по удалению защищенного контента со сторонних веб-сайтов.

The Guardian обвинила Microsoft в нанесении ущерба своей журналистской репутации, опубликовав опрос, созданный искусственным интеллектом, в котором обсуждались причины смерти женщины, рядом со статьей новостного издателя. https://t.co/tOie87HSyA
– Новости/Медиа Альянс (@newsalliance) 1 ноября 2023 г.

NMA признала преимущества генеративного ИИ и отметила, что публикации и журналисты могут использовать ИИ для корректуры, генерации идей и поисковой оптимизации.

ChatGPT от OpenAI, Bard от Google и Claude от Anthropic — это три чат-бота с искусственным интеллектом, которые за последние 12 месяцев стали чаще использоваться. Однако методы обучения этих моделей ИИ подверглись критике, и все они столкнулись с исками о нарушении авторских прав в суде.

В июле комик Сара Сильверман подала в суд на OpenAI и Meta, утверждая, что эти две фирмы без разрешения использовали ее работу, защищенную авторским правом, для обучения своих систем искусственного интеллекта.

На OpenAI и Google были поданы отдельные коллективные иски по поводу утверждений, что они извлекли личную информацию пользователей из Интернета.

Google заявила, что возьмет на себя юридическую ответственность, если ее клиенты будут обвинены в нарушении авторских прав при использовании ее продуктов генеративного искусственного интеллекта в Google Cloud и Workspace.