Adobe 被诉用盗版书籍训练 AI 模型，SlimLM 陷版权风波

admin 百科 2025-12-18 26

俄勒冈州作家伊丽莎白·莱昂（elizabeth lyon）已对adobe公司发起集体诉讼，指控其在训练名为 slimlm 的轻量级语言模型过程中，非法使用了含有其受版权保护作品的盗版数据集。

Adobe 被诉用盗版书籍训练 AI 模型，SlimLM 陷版权风波-第1张图片-佛山资讯网

SlimLM 是 Adobe 推出的一套面向移动端文档处理场景（包括文本摘要、内容重写与智能问答等）优化的小型语言模型。据 Adobe 官方披露，该模型基于 SlimPajama-627B 数据集完成预训练——该语料库由AI芯片企业Cerebras于2023年6月开源发布，标榜为“去重、多源整合、公开可用”的训练资源。

但莱昂在起诉书中指出，SlimPajama 实质上是 RedPajama 数据集的直接复刻版本，而后者又源于广受争议的 Books3 数据集。Books3 汇集约19.1万册享有版权的图书，长期被质疑大量源自非法盗版平台（例如The Bibliotik）。

诉状明确指出：“由于 SlimPajama 系 RedPajama 的衍生复制品，其不可避免地承袭了 Books3 中的内容，其中即包含原告及本案集体成员依法享有著作权的文字作品。”

标签： adobe app ai apple ai芯片 red