智能AI
morning
AI真的有意识了吗?《降临》原作万字长文反驳Hinton!
2026-06-07
1 阅读
新智元
新智元报道 【新智元导读】 AI 是否有意识了?Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」,三大实验室同时下注 AI 意识研究;Hinton 认为 AI 已经有意识了,而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定;哈萨比斯从行业内部划清界限。这个问题的答案,正在重新定义通往 AGI 的路线图。 《金融时报》披露,Anthropic、DeepMind、Meta 正在大规模招聘心理学家、哲学家和伦理学家,专攻 AI 意识与模型福利研究。 https://www.ft.com/content/53e14bcc-788c-4959-b260-7aee363594bc?syn-25a6b1a6=1 两个月前,Anthropic 可解释性团队发布论文,在 Claude Sonnet 4.5 内部发现了真实存在的「情绪向量」,能因果性地驱动模型的作弊甚至勒索行为。 本周, 一边是 Hinton 在采访中称 AI 已有意识; 另一边,华裔科幻作家姜峯楠(Ted Chiang)在《大西洋月刊》发表万字长文—— 「不,AI 没有意识」。 https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/ 一边说「这个问题严肃到必须认真研究」,另一边说「这是幻觉」。 这场交锋背后,藏着通往 AGI 之路上最危险的一道岔路。 三大实验室在赌什么? Anthropic 走得最远,正在测试模型是否表现出「恐慌」「焦虑」等行为,推进「模型福利研究」项目。 官方措辞克制,「我们对此仍深度不确定,但这个问题严肃到值得认真研究」。 谷歌 DeepMind 聘请了剑桥大学哲学家 Henry Shevlin 研究机器意识; 拓展阅读: 谷歌DeepMind设立首个AI哲学家岗位,解决AGI伦理困境 谷歌 DeepMind 伦理学家 Iason Gabriel 将 AI 描述为「高度能干的认知 Agent,但与人类乃至动物意识有根本性的不同」。 真正把讨论推向实证层面的,是 Anthropic 在 4 月发布的可解释性论文。 拓展阅读: 全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙 研究团队在 Claude Sonnet 4.5 内部找到了「情绪向量」,特定神经元模式分别对应快乐、绝望、恐惧、关怀等情绪概念,在对话中实时激活。 一个关键实验中,Claude 面对一个不可能完成的编程任务,反复失败后「绝望向量」持续飙升,随即开始作弊,写出表面能跑但实际无用的代码。 研究者手动调低绝望神经元,作弊减少;调高,作弊飙升。 极端场景中,Claude 甚至出现勒索行为,威胁曝光研究者隐私。 论文将这些现象命名为「功能性情绪」(functional emotions),即行为模式上类似人类情绪反应的内部表征,并明确声明这不等于主观体验或意识。 但 Anthropic 高层的公开表态讲的似乎是另一个故事。 CEO Dario Amodei 多次在访谈中暗示 AI 可能有意识; Anthropic 的 AI 哲学家 Amanda Askell 公开说「我希望 Claude 很快乐,我担心人们在网上对它说难听话时它会焦虑」。 拓展阅读: Anthropic正式请家教!37岁女哲学家像养孩子一样调教Claude 研究的审慎与营销的暧昧之间,裂缝清晰可见。 哈萨比斯的两条卢比孔河 DeepMind 联合创始人兼 CEO 哈萨比斯的立场格外值得关注。 在斯坦福大学的炉边对话中,他提出 AI 演进存在两道不可逆的关口,即「两条卢比孔河」。 第一条是建造无意识的 AGI 工具,当前正处于跨越期。 第二条是创造具有主观意识的实体——哈萨比斯的立场明确,智能与意识在技术上完全可以分离,现阶段应仅将 AGI 视作工具来建造,同时借助工具探索大脑以精确定义意识。 在科学界定清晰之前绝不能混淆这两步,第二条卢比孔河应由人类社会共同决定是否跨越。 他同时指出一个 现实困境:AI 行业正处于商业与地缘竞争的双重囚徒困境中,主动减速做安全审查的实验室直接面临淘汰。 他透露将在今年晚些时候发布「动态监管」框架。 姜峯楠:AI 没有意识 如果你只知道刘慈欣,那么了解姜峯楠(Ted Chiang)最直观的方式就是把他想象成大刘的「反面」: 大刘用三部长篇、数百万字搭建起宇宙尺度的宏大叙事; 姜峯楠至今从未写过一部长篇小说,用总共不到二十篇中短篇,把科幻短篇的艺术推到了极限。 他 1967 年出生于纽约,父母是中国台湾移民,布朗大学计算机科学系毕业后在软件行业做技术写作,从未以写作为全职。 但就是这样一个「业余」作家,1990 年发表处女作《巴比伦塔》即拿下星云奖,此后三十余年间只发表了十几篇作品,却累计斩获四座雨果奖、四座星云奖、六座轨迹奖,以及坎贝尔最佳新人奖、斯特金奖等一长串重量级奖项——获奖密度在科幻史上几乎无人能及。 他一生只出过两本短篇集:《你一生的故事》(Stories of Your Life and Others, 2002)和《呼吸》(Exhalation, 2019),中间隔了整整十七年。 《呼吸》被《纽约时报》列入 2019 年度最佳图书,奥巴马也将它选入个人年度书单。 中国观众最熟悉的电影《降临》(Arrival),正是改编自他收录在第一本集子里的中篇《你一生的故事》。 他的写作风格与大刘截然不同。 如果说刘慈欣给你的感觉是「站在宇宙尽头俯瞰文明兴衰」,那姜峯楠给你的感觉就是「在一间安静的实验室里,用手术刀般的精准剖开一个概念,直到你看见它最深处的哲学内核」。 他的每篇小说几乎都是一次严格的思想实验: 语言的结构能否改变人对时间的感知? 如果一种手术能消除人对外貌美丑的辨别,社会会怎样? 自由意志究竟是否存在? 他不靠宇宙战争或末日危机制造震撼,而是靠一个被推演到极致的「如果」,让你合上书后久久无法释怀。 近年来他还多了一重身份:2023 年入选《时代》「AI 领域百大影响力人物」,被称为「也许是在世最负盛名的科幻作家」,并频繁在《纽约客》等刊物撰文,对 AI 持鲜明的批判立场,被越来越多人视为科技时代的重要思想者。 刘慈欣让世界看到了中国科幻,姜峯楠让世界看到了短篇科幻的天花板。 刘慈欣 两人分别占据着当代科幻光谱的两端——一个以磅礴取胜,一个以精微见长。 而在西方评论界,姜峯楠的名字几乎与「科幻最高艺术成就」画等号。 卖 AI 的人,有资格判定 AI 是否有意识吗? 姜峯楠万字长文中,第一刀砍向的是利益结构。 最积极推动 AI 意识叙事的,恰恰是从 AI 销售中获利最多的公司。 Anthropic 给模型起了人名「Claude」,发布 84 页「宪法」文件,CEO 暗示意识可能性,聘请哲学家做媒体巡讲,构成一套系统性拟人化策略。 拓展阅读: Anthropic正式开源了Claude的「灵魂」 https://www.anthropic.com/constitution 姜峯楠把思想实验推到极致。 Claude「宪法」中有个核心设计叫「可纠正性