9 апреля 09:08
Новое исследование утверждает, что OpenAI могла использовать защищенный авторским правом контент для обучения своих моделей искусственного интеллекта
Adrian Rusu
.webp)
Наука IT&C
Foto: pixabay.com/ro
Исследование, проведенное группами специалистов из Университета Вашингтона, Стэнфорда и Копенгагенского университета, позволяет выявить, не "запомнили" ли модели искусственного интеллекта часть обучающих данных, что является возможным нарушением авторских прав. Исследование посвящено выявлению уникальных и необычных слов в литературных текстах, известных как "слова с большим сюрпризом". Результаты показали, что GPT-4, одна из моделей OpenAI, похоже, запомнила части художественных книг, защищенных авторским правом, в частности из набора данных под названием BookMIA.