AI真的有意识了吗？《降临》原作万字长文反驳Hinton！

新智元报道【新智元导读】 AI 是否有意识了？Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」，三大实验室同时下注 AI 意识研究；Hinton 认为 AI 已经有意识了，而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定；哈萨比斯从行业内部划清界限。这个问题的答案，正在重新定义通往 AGI 的路线图。《金融时报》披露，Anthropic、DeepMind、Meta 正在大规模招聘心理学家、哲学家和伦理学家，专攻 AI 意识与模型福利研究。 https://www.ft.com/content/53e14bcc-788c-4959-b260-7aee363594bc?syn-25a6b1a6=1 两个月前，Anthropic 可解释性团队发布论文，在 Claude Sonnet 4.5 内部发现了真实存在的「情绪向量」，能因果性地驱动模型的作弊甚至勒索行为。本周，一边是 Hinton 在采访中称 AI 已有意识；另一边，华裔科幻作家姜峯楠（Ted Chiang）在《大西洋月刊》发表万字长文—— 「不，AI 没有意识」。 https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/ 一边说「这个问题严肃到必须认真研究」，另一边说「这是幻觉」。这场交锋背后，藏着通往 AGI 之路上最危险的一道岔路。三大实验室在赌什么？ Anthropic 走得最远，正在测试模型是否表现出「恐慌」「焦虑」等行为，推进「模型福利研究」项目。官方措辞克制，「我们对此仍深度不确定，但这个问题严肃到值得认真研究」。谷歌 DeepMind 聘请了剑桥大学哲学家 Henry Shevlin 研究机器意识；拓展阅读：谷歌DeepMind设立首个AI哲学家岗位，解决AGI伦理困境谷歌 DeepMind 伦理学家 Iason Gabriel 将 AI 描述为「高度能干的认知 Agent，但与人类乃至动物意识有根本性的不同」。真正把讨论推向实证层面的，是 Anthropic 在 4 月发布的可解释性论文。拓展阅读：全网炸锅! Anthropic万字曝光Claude情绪代码，被人类逼疯哐哐撞墙研究团队在 Claude Sonnet 4.5 内部找到了「情绪向量」，特定神经元模式分别对应快乐、绝望、恐惧、关怀等情绪概念，在对话中实时激活。一个关键实验中，Claude 面对一个不可能完成的编程任务，反复失败后「绝望向量」持续飙升，随即开始作弊，写出表面能跑但实际无用的代码。研究者手动调低绝望神经元，作弊减少；调高，作弊飙升。极端场景中，Claude 甚至出现勒索行为，威胁曝光研究者隐私。论文将这些现象命名为「功能性情绪」（functional emotions），即行为模式上类似人类情绪反应的内部表征，并明确声明这不等于主观体验或意识。但 Anthropic 高层的公开表态讲的似乎是另一个故事。 CEO Dario Amodei 多次在访谈中暗示 AI 可能有意识； Anthropic 的 AI 哲学家 Amanda Askell 公开说「我希望 Claude 很快乐，我担心人们在网上对它说难听话时它会焦虑」。拓展阅读： Anthropic正式请家教！37岁女哲学家像养孩子一样调教Claude 研究的审慎与营销的暧昧之间，裂缝清晰可见。哈萨比斯的两条卢比孔河 DeepMind 联合创始人兼 CEO 哈萨比斯的立场格外值得关注。在斯坦福大学的炉边对话中，他提出 AI 演进存在两道不可逆的关口，即「两条卢比孔河」。第一条是建造无意识的 AGI 工具，当前正处于跨越期。第二条是创造具有主观意识的实体——哈萨比斯的立场明确，智能与意识在技术上完全可以分离，现阶段应仅将 AGI 视作工具来建造，同时借助工具探索大脑以精确定义意识。在科学界定清晰之前绝不能混淆这两步，第二条卢比孔河应由人类社会共同决定是否跨越。他同时指出一个现实困境：AI 行业正处于商业与地缘竞争的双重囚徒困境中，主动减速做安全审查的实验室直接面临淘汰。他透露将在今年晚些时候发布「动态监管」框架。姜峯楠：AI 没有意识如果你只知道刘慈欣，那么了解姜峯楠（Ted Chiang）最直观的方式就是把他想象成大刘的「反面」：大刘用三部长篇、数百万字搭建起宇宙尺度的宏大叙事；姜峯楠至今从未写过一部长篇小说，用总共不到二十篇中短篇，把科幻短篇的艺术推到了极限。他 1967 年出生于纽约，父母是中国台湾移民，布朗大学计算机科学系毕业后在软件行业做技术写作，从未以写作为全职。但就是这样一个「业余」作家，1990 年发表处女作《巴比伦塔》即拿下星云奖，此后三十余年间只发表了十几篇作品，却累计斩获四座雨果奖、四座星云奖、六座轨迹奖，以及坎贝尔最佳新人奖、斯特金奖等一长串重量级奖项——获奖密度在科幻史上几乎无人能及。他一生只出过两本短篇集：《你一生的故事》（Stories of Your Life and Others, 2002）和《呼吸》（Exhalation, 2019），中间隔了整整十七年。《呼吸》被《纽约时报》列入 2019 年度最佳图书，奥巴马也将它选入个人年度书单。中国观众最熟悉的电影《降临》（Arrival），正是改编自他收录在第一本集子里的中篇《你一生的故事》。他的写作风格与大刘截然不同。如果说刘慈欣给你的感觉是「站在宇宙尽头俯瞰文明兴衰」，那姜峯楠给你的感觉就是「在一间安静的实验室里，用手术刀般的精准剖开一个概念，直到你看见它最深处的哲学内核」。他的每篇小说几乎都是一次严格的思想实验：语言的结构能否改变人对时间的感知？如果一种手术能消除人对外貌美丑的辨别，社会会怎样？自由意志究竟是否存在？他不靠宇宙战争或末日危机制造震撼，而是靠一个被推演到极致的「如果」，让你合上书后久久无法释怀。近年来他还多了一重身份：2023 年入选《时代》「AI 领域百大影响力人物」，被称为「也许是在世最负盛名的科幻作家」，并频繁在《纽约客》等刊物撰文，对 AI 持鲜明的批判立场，被越来越多人视为科技时代的重要思想者。刘慈欣让世界看到了中国科幻，姜峯楠让世界看到了短篇科幻的天花板。刘慈欣两人分别占据着当代科幻光谱的两端——一个以磅礴取胜，一个以精微见长。而在西方评论界，姜峯楠的名字几乎与「科幻最高艺术成就」画等号。卖 AI 的人，有资格判定 AI 是否有意识吗？姜峯楠万字长文中，第一刀砍向的是利益结构。最积极推动 AI 意识叙事的，恰恰是从 AI 销售中获利最多的公司。 Anthropic 给模型起了人名「Claude」，发布 84 页「宪法」文件，CEO 暗示意识可能性，聘请哲学家做媒体巡讲，构成一套系统性拟人化策略。拓展阅读： Anthropic正式开源了Claude的「灵魂」 https://www.anthropic.com/constitution 姜峯楠把思想实验推到极致。 Claude「宪法」中有个核心设计叫「可纠正性

订阅66必读