AI水论文封一年，署名连坐！arXiv最严新规来了，陶哲轩附议

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> AI水论文封一年，署名连坐！arXiv最严新规来了，陶哲轩附议听雨 2026-05-18 20:18:30 来源：量子位生成论文远比消化容易听雨发自凹非寺量子位 | 公众号 QbitAI 上传AI水论文，被查实者封禁一年。后续投稿须先通过同行评审，才有资格重新踏入arXiv。这是arXiv计算机科学版块主席 Thomas Dietterich 在X上刚刚公开的新规，语气干脆，不带商量。若论文中存在作者未核查LLM生成内容的确凿证据，所有署名作者一并受罚，没有例外。消息一出，陶哲轩也亲自下场评论。这位数学界最活跃的AI拥抱者，专门在Mathstodon发文，用自己此前提出的四条建议框架逐一对照新政，总结为一句话：在生成论文比消化论文容易得多的时代，这个方向是对的。网友则炸开了锅，有人鼓掌，说早就该这么干。也有人反问：你会在2005年禁止用互联网进行研究的文章吗？还有人提出质疑：这样的连坐制度，是要求论文的每一位合著者都必须检查每一条引用吗？ arXiv最严新规：签名即担责物理、数学、计算机科学领域，绝大多数论文在进入同行评审之前，都要先在arXiv挂出预印本。它是全球学术流通最核心的基础设施之一，正在推进从康奈尔大学剥离、转型独立非营利机构，有望获得更多资源和动力主动出手治理。 arXiv这次出手，核心逻辑只有一句话：签名即担责，无论内容如何生成。 Thomas Dietterich的原话是这样的：如果生成式AI工具产生了不当语言、抄袭内容、偏见内容、错误、错误引用或误导性内容，且这些内容被纳入科学著作，责任由全体作者承担。我们最近对此类行为的惩罚标准进行了明确。注意，新政不是禁止用AI。用AI润色、用AI辅助查文献，都没有问题。但arXiv卡的是另一条线：你有没有认真读过自己署名的论文。什么算「确凿证据」？Dietterich列了几种典型情形。幻觉引用，也就是引用了根本不存在的论文。 LLM元评论残留，比如稿件里留着「这是一段200字摘要，是否需要修改？」之类的字样。占位符未填，比如表格里还写着「请用实验真实数据填入此处」。如果正式提交的论文里还存在这些低级错误，只能说明作者十分粗心，根本没有认真检查自己的论文。这样的证据被抓到，也意味着论文中的其他内容并不值得信任。一旦被查实，后果是被arXiv封禁一年，解封后的所有新投稿须先通过正规期刊同行评审才可上传。而且封号连坐，所有署名作者一起受罚。 Dietterich表示，这是个「一击即止」的规定，但作者可以提出申诉。内部流程上也会先由版主记录问题，然后由分区主席确认后才能实施处罚。不得不说，arXiv这次虽然惩罚的都是低级错误，但出手确实挺狠的。陶哲轩附议：论文生成远比消化容易新政太火，陶哲轩也闻讯赶来建言献策。他在Mastodon上发了一组帖子回应此事，用自己在一次演讲中提出的四条建议作为框架，逐一对照arXiv新政。这四条建议分别是： 1、在传统工作流中明确并严格执行AI辅助的许可边界； 2、降低对「抢先发表」和「仅仅解决问题」的强调，转而重视「消化成果」； 3、为重度使用AI的贡献者设计新的挑战，使其仍然能产生真实学术价值； 4、无论传统还是非传统工作流，都要明确说清项目目标（包括显性和隐性目标）及其背后的原因。他的总体判断是：新政与前两条建议高度契合。 arXiv这次划定的责任边界，正是建议一的落地，明确了什么叫「许可范围内的AI辅助」。而整个新政背后的逻辑，对应的正是建议二的核心主张。他抛出了一个关键判断：在这个时代，生成一篇论文远比消化一篇论文容易。任何将传统科学机构的平衡重新倾向于消化的努力，都是值得欢迎的。至于建议三，陶哲轩认为已经有了自然出口。 viXra等平台对AI辅助投稿几乎不设限，可以作为未经消化内容的独立存档地。但他的定性也很清楚：这类平台专注于「生产」而非「消化」，不应被纳入正统学术引用链，不应出现在arXiv或期刊的参考文献里。换句话说，想靠AI批量产出论文的人，有地方去，但别想进正统学术体系。不过，有网友在帖子下留言指出，这个「出口」已经堵死了。 viXra自己也禁止了AI生成论文，并另建了ai.viXra.org专门接收此类内容。建议四则指向了一个更根本的问题：预印本平台究竟为谁服务？陶哲轩的判断是，作者和读者的需求是共生的，必须同时照顾到。他的原话是这样的：一个只服务于作者的平台会被大量低质量投稿填满，而读者并不愿意阅读；一个只服务于读者的平台会劝退作者进行繁琐的投稿过程。鉴于论文生成和理解之间出现了新的阻抗失配，质量门槛现在必然要提高，但这最终对双方都是有益的变化。啥意思呢？意思就是说，生成一篇论文的成本在急速下降，但消化一篇论文的成本并没有改变。两端的落差越来越大，如果平台不提高门槛，就只能眼睁睁看着读者被淹没在垃圾里。但同时，陶哲轩也点出了新政管不住的问题。「争先为首」的文化是系统性病根，是整个学术评价体系造成的， arXiv单方面出手治不了根。从各方反馈来看，物理学界的问题可能比数学界更严重。 AI论文泛滥有多严重 arXiv此次出手，是因为用AI写论文已经成为了普遍现象。 2025年发表于Nature Human Behaviour的一项研究示，计算机科学领域约五分之一的论文含有LLM修改的明显痕迹，且ChatGPT发布后数月内出现急剧攀升。这还只是摘要，正文里的比例只会更高。 arXiv每个月收到的AI生成综述论文，已达数百篇量级。历史上，综述论文本是由领域内资深学者撰写的稀缺内容。现在，任何人用AI短时间内就能生成一篇，批量投稿，让志愿审稿人疲于奔命。 arXiv早在2025年10月就出过一记重拳，禁止计算机科学类未经同行评审的综述和立场论文直接上传，要求先过期刊关。此次封号政策，又是进一步升级。学术会议也没能幸免。 2026年1月，AI检测机构GPTZero分析了NeurIPS 2025超过4000篇录用论文，在至少53篇中发现了数百条AI幻觉引用，且这些论文全部通过了三位以上审稿人的评审。此外，问题也从论文蔓延到了考场。普林斯顿大学最新宣布，废除延续133年、允许学生无监考参加考试的荣誉制度，从今年夏季起恢复现场监考。直接原因是，教务长Michael Gordin来信，大量教授和学生反映「考试作弊已经普遍化」。如今，教授们将不得不监考学生的考试，并报告任何违反学校学术诚信政策的行为。去年一项针对约500名普林斯顿高年级学生的调查数据，触目惊心：超过27%的人承认曾借助ChatGPT等AI模型作弊，约半数知悉有同学违反了荣誉准则。学生自己描述的作弊现场是：「如果考试在笔记本上，随时可以切到另一个窗口；如果是纸质蓝皮书，就躲在桌下用手机。」 133年的荣誉制度，信任学生，不设监考。结果AI