miercuri 09:08
Un nou studiu susține că OpenAI ar fi utilizat conținut protejat de drepturile de autor în antrenarea modelelor sale de inteligență artificială
Adrian Rusu
.webp)
Știință IT&C
Foto: pixabay.com/ro
Cercetarea, realizată de echipe de la University of Washington, Stanford și University of Copenhagen, aduce în atenție o metodă de detectare a faptului dacă modelele de AI și-au 'memorat' anumite părți ale datelor de antrenament - o posibilă încălcare a drepturilor de autor. Studiul se concentrează pe identificarea cuvintelor unice și neobișnuite din texte literare, cunoscute sub numele de cuvinte 'de mare surpriză'. Rezultatele au arătat că GPT-4, unul dintre modelele OpenAI, părea să-și fi memorat părți din cărți de ficțiune protejate de drepturile de autor, în special dintr-un set de date numit BookMIA.