9 四月 14:08
新研究称 OpenAI 在训练人工智能模型时可能使用了受版权保护的内容
Adrian Rusu
.webp)
科学 IT&C
Foto: pixabay.com/ro
这项研究由华盛顿大学、斯坦福大学和哥本哈根大学的团队共同完成,它揭示了一种检测人工智能模型是否 "记忆 "了部分训练数据的方法--这可能侵犯了版权。这项研究的重点是识别文学文本中独特和不寻常的词语,即所谓的 "大惊喜 "词语。结果显示,OpenAI 的一个模型 GPT-4 似乎记住了受版权保护的小说书籍的部分内容,尤其是来自一个名为 BookMIA 的数据集的内容。