智能AI
morning
一场全民“AI自证”的黑色喜剧
2026-05-23
1 阅读
影子备忘录
文 | 影子备忘录 1898年,戊戌变法夭折,京师大学堂却留了下来。在那个风雨如晦的年代,没有人能预料到,一百多年后,这所学堂的后继者们会用一种叫“人工智能”的东西,来判定一个学生是否诚实。 更没有人能预料到,2026年的夏天,朱自清先生会被一台机器判定为“60%以上是AI”。 《荷塘月色》——这篇写于1927年、全文1361字的散文,被当代大学生视为中学语文的集体记忆,如今在某个AI检测工具中被标注为“AI疑似生成率62.88%”。 与此同时,王勃的《滕王阁序》被检出AI率接近100%,连刘慈欣的科幻作品也未能幸免。 热搜炸了。评论区里,有人破防:“连朱自清都过不了,我们怎么办?”有人自嘲:“那我的论文AI率80%,是不是也正常了?”还有人冷笑:“我手搓的毕业论文被判AI率97%,请问我是AI成精了吗?” 这不是段子。这是一个时代的荒诞注脚。 为了证明而证明 去年开始,国内高校陆续出台规定,对毕业论文实施“双轨审核”——既查重复率,又查AIGC率。以2026年毕业季为例,多所高校明确要求AIGC检测率低于30%甚至20%方可答辩,有的学校则将AIGC检测结果直接与论文是否合格挂钩。 这从侧面说明,哪怕你的论文一字不抄、一字不假,只要系统判定你“像AI写的”,你就得回去重写。 可问题来了:系统凭什么判定“像AI”? 答案让人哭笑不得。当前主流的AI检测工具,其判断逻辑不是“找出哪句话是AI写的”——事实上,在微观的字词层面,人类和AI的差别几乎无法分辨。 西湖大学文本智能实验室的鲍光胜博士解释说,检测工具的本质是在宏观层面寻找统计上的线索:比如AI会有相对固定的用词偏好,某个冷门词出现的频率如果远高于人类平均水平,就会成为一个“信号”;一句话放在大模型里,看它的用词、词频分布和模型预测的分布是否一致。 这就引出了一个致命的悖论。当AI检测工具遇到那些在学习阶段就“读”过的经典文本时,这种“一致性”会因为模型熟悉这些表达而变得极高,于是系统倾向于判定文章是AI写的。《荷塘月色》大概率就是这样被误伤的。 换句话说,这些检测工具判断“AI味”的标准,不过是在看你的文字和AI训练数据的“重合度”——你的文笔越流畅、逻辑越清晰、表达越规范,就越像那些被AI“消化”过的文本,也就越容易被标记为“AI生成”。 一些行文流畅、结构清晰、语法严谨的人类作品,恰恰因为其“完美”而易被误判为AI生成。 由此,又产生了一个更为荒诞的事实:为了通过检测,大学生们开始疯狂地“去AI化”。而“去AI化”的方式,不是写得更学术、更严谨,恰恰相反——你得写得像个“学渣”。 改得像人写的 , 一个技术自卑的新时代 在网上搜“降AI率秘籍”,你会看到一套令人恍惚的写作指南: 避免太严谨的结构,少用“首先、其次、最后”这种清晰的逻辑词;慎用破折号和冒号,因为这是“AI爱用”的标点;尽量带点口语化的啰嗦,来点无伤大雅的语病,最好把长句子打断,显得逻辑混乱一点。 具体到操作层面,就更魔幻了:把“心肌梗死”写成“心脏肌肉因为缺血坏死”,把“与生俱来”改成“一生下来就有的”。原本应该越写越好的文章,如今要越改越烂才能过关。 有研究生耗时数月写出5.8万字原创论文,知网检测AI率竟高达86.8%。有学生自己写的项目计划被认定疑似AIGC率为97%,无奈之下用AI降AIGC率,成功降至0%。 全宿舍的论文AIGC率“全军覆没”,连致谢都被大面积标红。 这种逻辑就是在变相告诉你,你写的越好,越像AI;你写的越烂,越像人。 在人类文明数千年的历史中,“写得好”从来是一项值得骄傲的能力。从韩愈的“文起八代之衰”到福楼拜的“一字千金”,从鲁迅的“横眉冷对千夫指”到海明威的“冰山理论”,人类用了无数个世代去追求更精准、更优美、更有力的表达。 而今天,一群没有灵魂的算法,只用了几秒钟,就把这些追求变成了“AI率过高”的罪证。 有评论一针见血地指出,这种检测逻辑正在侵蚀学生的语言能力,当学生为了“去AI化”而刻意模仿“不规范的表达”,他们会逐渐失去使用规范、优美语言的能力,甚至形成“通顺=AI”的错误认知。 这可能是AI时代最具杀伤力的代价之一:不是AI取代了人类写作,而是人类为了证明自己“不是AI”,主动放弃了对优质表达的追求。 写、AI查、AI改 , 一条自产自销的产业链 然而,最吊诡的还不是技术本身的缺陷。 当你以为这是一场“学生vs机器”的攻防战时,你会发现,站在你面前的对手——AI检测工具和AI生成工具,很可能来自同一家公司。 有媒体调查发现,部分平台一边推出AI生成论文服务,一边售卖AI降重、改率的套餐。 同时,市面上已经诞生了专门提供“降AIGC率”的付费服务,商家号称能通过句式改写、词汇替换、逻辑微调,把高AIGC率论文改写到合格标准。一次检测几十到上百元,反复修改反复交钱,一篇论文光是查AI率就可能花掉上千块。 当你花三十块钱买了一篇AI生成的初稿,再花六十块钱用AI查了一遍重,最后再花一百块用AI给你降了AI率——你不仅没有得到任何学术能力的增长,反而为一条灰色产业链贡献了将近两百块钱的GDP。 这不是学术写作,这是一条完整的“AI写、AI查、AI改”的畸形闭环。 有评论称之为“既是裁判又是运动员”的双重角色,把学生的焦虑当成了牟利的工具——学生既要靠AI“速成”论文,又要靠AI“洗白”痕迹,最终沦为平台的韭菜。 更大的问题是,高校在引进这些检测工具时,有没有做过基本的科学评估?有没有问一句:这个工具到底靠不靠谱? 佛罗里达大学的研究团队测试了市面上五种最流行的AI文本检测器,使用6000篇在ChatGPT诞生之前提交的学术论文作为样本。 结果令人震惊:误报率从0.05%到68.6%不等,漏报率更是从0.3%一路飙到99.6%。研究团队最终得出结论:这些商用AI检测器“不适合部署在学术或高风险环境中”。研究报告的主要作者Traynor说得直白:“我们真的不能用这些工具来裁决这些决定。人们的职业生涯悬于此线。” 事实上,早在2023年,就有美国宪法被AI检测工具判定为“AI撰写”的案例,也有非英语母语者的原创文章被系统性误判。 而2026年的中国毕业季,不过是将这场全球性的技术争议,推到了最具体、最切身的那一层——一个普通学生的学位证。 用AI检测AI , 一种21世纪的技术迷信 问题出在哪里?真的只是因为检测工具还不够“好用”、不够“精准”吗? 中国人民大学新闻学院副教授董晨宇就遇到过这样的尴尬:他将刚完成的、耗时三年扎根基层完成的研究论文提交至某检测平台,结果系统标红的“高度疑似AI生成”段落,正是研究团队追踪多个真实案例写成的内容。 这不是个别平台的bug,而是整个AI检测逻辑的结构性困境。 从技术本质来看,当前AI检测面临难以突破的理论瓶颈。AI通过监督微调等技术学习人类知识体系,其生成内容与人类创作在语言结构、逻辑范式等浅层特征上日趋相似,导致AI生成与人类写作的边界愈发模糊。 业内专业人士直言,AI检测技术尚未成熟,甚至可被视为一个伪命题。 当AI模仿的是整个人类的写作共性,而人类写作的最高标准又与AI的训练目标高度重合——“流畅”“规范”“逻辑清晰”——那么用AI去识别AI,从一开始就是一个“以子之矛攻子之盾”的悖论。