Adobe 被诉用盗版书籍训练 AI 模型,SlimLM 陷版权风波

admin 百科 18

俄勒冈州作家伊丽莎白·莱昂(elizabeth lyon)已对adobe公司发起集体诉讼,指控其在训练名为 slimlm 的轻量级语言模型过程中,非法使用了含有其受版权保护作品的盗版数据集。

Adobe 被诉用盗版书籍训练 AI 模型,SlimLM 陷版权风波-第1张图片-佛山资讯网

SlimLM 是 Adobe 推出的一套面向移动端文档处理场景(包括文本摘要、内容重写与智能问答等)优化的小型语言模型。据 Adobe 官方披露,该模型基于 SlimPajama-627B 数据集完成预训练——该语料库由AI芯片企业Cerebras于2023年6月开源发布,标榜为“去重、多源整合、公开可用”的训练资源。

但莱昂在起诉书中指出,SlimPajama 实质上是 RedPajama 数据集的直接复刻版本,而后者又源于广受争议的 Books3 数据集。Books3 汇集约19.1万册享有版权的图书,长期被质疑大量源自非法盗版平台(例如The Bibliotik)。

诉状明确指出:“由于 SlimPajama 系 RedPajama 的衍生复制品,其不可避免地承袭了 Books3 中的内容,其中即包含原告及本案集体成员依法享有著作权的文字作品。”

标签: adobe app ai apple ai芯片 red

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~