9 április 08:08
Egy új tanulmány szerint az OpenAI szerzői jogvédett tartalmakat használhatott fel mesterséges intelligencia modelljeinek kiképzéséhez
Adrian Rusu
.webp)
Tudomány IT&C
Foto: pixabay.com/ro
A Washingtoni Egyetem, a Stanford Egyetem és a Koppenhágai Egyetem kutatócsoportjai által végzett kutatás egy olyan módszert hozott nyilvánosságra, amellyel kimutatható, hogy a mesterséges intelligenciamodellek "megjegyezték-e" a képzési adatok egy részét - ami a szerzői jogok lehetséges megsértése. A tanulmány az irodalmi szövegekben található egyedi és szokatlan szavak, az úgynevezett "nagy meglepetésszavak" azonosítására összpontosít. Az eredmények azt mutatták, hogy a GPT-4, az OpenAI egyik modellje, úgy tűnt, hogy memorizálta a szerzői joggal védett szépirodalmi könyvek egyes részeit, különösen a BookMIA nevű adathalmazból.