9 四月 14:08

新研究称 OpenAI 在训练人工智能模型时可能使用了受版权保护的内容

Adrian Rusu

科学 IT&C

Foto: pixabay.com/ro

这项研究由华盛顿大学、斯坦福大学和哥本哈根大学的团队共同完成，它揭示了一种检测人工智能模型是否 "记忆 "了部分训练数据的方法--这可能侵犯了版权。这项研究的重点是识别文学文本中独特和不寻常的词语，即所谓的 "大惊喜 "词语。结果显示，OpenAI 的一个模型 GPT-4 似乎记住了受版权保护的小说书籍的部分内容，尤其是来自一个名为 BookMIA 的数据集的内容。