爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型西风 2026-05-13 11:10:53 来源：量子位多方原告组团上阵西风发自凹非寺量子位 | 公众号 QbitAI AI版权大战，再度升级了。手握《柳叶刀》《细胞》等顶刊，掌控全球海量核心科研成果的学术出版巨头爱思唯尔（Elsevier）正式入局，加入集体诉讼团硬刚Meta—— 控诉Meta非法爬取、复制受版权保护的科研论文，用于训练自家大模型Llama。在此之前，站出来起诉AI侵权的多是作家、媒体机构。此番是头一回，顶级学术出版商下场打响版权维权之战。美国出版商协会也在声明中给定调：这是主流出版集团首次发起针对AI企业的诉讼，Meta明目张胆侵犯版权，出版商们将还原全部事实。有意思的是，这场官司明面上矛头对准Meta，可证据一摊开，与爱思唯尔纠缠十多年的两大盗版学术库——LibGen、Sci-Hub，再度被摆上台面。只能说Meta树大钱多，比追责盗版平台靠谱多了（手动狗头）。多方原告组团上阵，指控Meta侵权这场诉讼于5月5日在纽约南区法院正式提交，被告直指Meta及其CEO扎克伯格。而原告，不止爱思唯尔一家，还包括法国第一大出版集团阿歇特、源自英国的百年全球综合性出版集团麦克米伦，以及美国小说家、执业律师Scott Turow 等。出版商方核心指控非常明确：Meta为训练Llama大语言模型，未经任何授权，大量获取、复制、盗用受版权保护的学术论文与出版物内容。具体来看，诉状里指出Meta训练Llama主要靠两大“不清白”的数据来源：第一， Common Crawl通用爬虫数据集。这份数据集通过全网抓取生成，囊括数十亿网页内容。原告方称，里面大概率混进了未经授权的版权内容，比如付费期刊的摘要和全文。第二，两大知名盗版学术平台LibGen、Sci-Hub 。这两个网站常年免费传播海量付费论文、教材与学术著作，长期深陷全球版权诉讼。出版商指控，Meta通过磁力下载、文件共享等方式，从这些网站盗用学术资源。值得一提的是，本案很多证据，还是从去年那桩“作家告Meta”（Kadrey v. Meta）案里流出来的内部员工邮件。面对诉讼，Meta发言人表示：将全力积极应诉。 Meta这边抗辩逻辑也十分清晰，打出了一张王牌：合理使用（Fair Use）。据了解，根据美国版权法，“合理使用”属于版权豁免情形，允许在特定条件下无需授权使用版权内容。 Meta发言人称：“AI正为个人与企业带来颠覆性创新、提升生产效率与创作活力，已有法院判例认定，使用版权内容训练AI可构成合理使用。” 不得不说，这几年AI圈的版权官司确实不少。像《纽约时报》、一堆知名作家都起诉过AI公司，有些案子已经和解了。但整体而言，利用版权作品训练大语言模型是否合法，目前仍未形成明确司法判例。至于这次后续怎么发展……咱们先搬好小板凳，再蹲一波。 One More Thing “合理使用”这张牌之前确实被成功使用过。去年，美国法院裁决：允许Claude背后公司Anthropic在未经作者许可的情况下，使用合法购买的已出版书籍训练AI 。法院参考了美国版权法中的“合理使用”（Fair Use）原则，认为AI训练属于“转化性使用”（Transformative Use），即对原作品的新用途未取代原作市场，且有利于技术创新和公共利益。这也是美国法院首次认可AI公司对书籍的使用权。就在最近，有网友称Anthropic正在大批量购入古籍，扫描收录内容后就直接销毁原书。这一说法也引发了不少网友关注。参考链接： [1]https://www.nature.com/articles/d41586-026-01481-0 [2]https://x.com/sivori/status/2052567312088047754 版权所有，未经授权不得以任何形式转载及使用，违者必究。 AI版权 Meta 西风 AI步入“自我进化”时代，李彦宏首提AI时代度量衡“DAA”｜Create2026百度AI开发者⼤会速览 2026-05-13 浙大校友用AI突破32年拉姆齐数下界 2026-05-10 原生Agent杀入画布！一站式搞定专业创作，全程可控、不抽卡 2026-05-07 Meshy用户破千万后杀向新战场：ARR年翻14倍，头部厂商集体买单 2026-04-27 扫码分享至朋友圈相关阅读 Meta「分割一切」进化2.0！跟踪运动物体，代码权重数据集全开源网友：真正的OpenAI 明敏 2024-07-30 Meta SAM2 图像分割开源视频分割谁是余家辉？“年薪1亿美元”AI研究员，吴永辉的嫡系弟子师承黄煦涛，“地球上最懂多模态的人” 鹭羽 2025-07-06 Meta OpenAI Meta亿元天团首个大模型交卷！余家辉宋飏Jason Wei耗时九个月，一雪Llama前耻主打原生多模态一水 2026-04-09 Meta 忍无可忍，LeCun离职！Meta市值应声蒸发1400亿对Meta的不满积蓄已久克雷西 2025-11-12 LeCun Meta 田渊栋被裁后新offer排到法国！原来Llama 4.5训完后被卸磨杀驴了硅谷真是干啥都生猛！衡宇 2025-10-24 LLaMA Meta 亚历山大王田渊栋小扎再出奇招：Meta员工绩效，AI来评判还将推出内部的AI绩效工具鹭羽 2025-11-17 Meta 扎克伯格绩效热门文章刚刚，ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁 2026-05-06 香蕉和GPT Image之外的第3条路：华人15人团队造出AI生图黑马 2026-05-06 AI“翻译”养殖经验智慧养猪提质增效 ——讯飞和光科技用大模型为传统产业升级注入新动能 2026-05-06 首日10w+！跨维智能赋能合作伙伴，商业服务小站“五一”多城齐开 2026-05-06 00后下场整顿Agent：啥都不学就能用好AI，这才是正确打开方式 2026-05-07