LeCun炮轰Hinton：他认可LLM就是想摆烂退休了！

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> LeCun炮轰Hinton：他认可LLM就是想摆烂退休了！ Jay 2026-05-18 13:59:37 来源：量子位 Lecun这次是真跟Hinton爆了…… Jay 发自凹非寺量子位 | 公众号 QbitAI Lecun这次是真跟Hinton爆了…… Hinton之前从来没特别关注过LLM。结果2023年GPT-4出来，他突然跟顿悟了一样： “天哪，这些模型已经非常接近人类智能了，它们可能有主观体验……” 对于这种转变，Lecun表示—— 完全不认同，难以理解。我感觉他就是想摆烂：“好了，这就是我们需要的，我可以宣布胜利了。” “嗯嗯，我可以退休了。然后到处去做关于AI危险的演讲。” 紧接着，话锋一转，又把矛头指向了另一位图灵奖得主。其实很多事情我早在几年前就说过，Hinton最近才意识到。 Bengio的情况类似。这也是为什么Lecun在被主持人问到为何如此「另类」时，回答：从来没有什么我和Hinton和Bengio分道扬镳，是他们变了。既然要可汗大点兵，当然避免不了聊到老东家。到了2024年初、尤其是2025年，FAIR已经不符合我认为保持创新、研究和突破所需要的条件了。很多优秀的人都走了。至于原因，Lecun说其实扎克伯格很好，领导层也都很支持他。只不过，Meta也卷入LLM竞赛后，实在没办法只顾着埋头做研究了。对此， Lecun表示很遗憾。因为在他看来，要获得突破性研究「其实很简单」。就雇最好的人，这些人有嗅觉，知道该做什么。你给他们成功所需的资源，然后…… 滚开，别挡路。但主持人还是不太满意，一路刨根问底：为什么？为什么？为什么？？重点怀疑对象—— 亚历山大王。主持人： Scale AI的收购是不是这个纯LLM聚焦的催化剂之一？ LeCun的回答也很实在了，真是问啥说啥。肯定是的。但我不确定我是否有足够的内部信息来评论。扎克伯格可能在亚历山大王身上看到了某种接班人的影子，一个更年轻版本的自己。除了这些，当然也保留了经典节目。 Lecun用带着点调侃的语气，再次向LLM阵营发起了挑衅。 JEPA类世界模型，五年内统治AI圈。（笑）这是 Lecun的最新一期播客专访，他跟主持人聊了快一个半小时，关于世界模型、JEPA、为什么离开Meta、为什么LLM走不到AGI…… 好久没有这么逐字逐句地听访谈了，真有点力竭。全程不敢跳过，全程无尿点， Lecun全程都在疯狂输出暴论： Anthropic在试图用恐惧来推动AI监管，我完全不认同这种做法。 LLM永远不可能可靠，不是所有事情都是Coding。模仿学习就是不行，连自动驾驶这一个任务都搞不定。世界模型希望解决的，是zero-shot解决新任务如果你在读PhD，别做LLM。没意义，你做不了贡献。还有少数地方是真的在做研究，比如DeepMind。但整个行业越来越封闭了。以下附上访谈全文。为保证可读性，量子位在不改变原意的基础上，对内容做了部分调整。 Enjoy。为什么LLM不是通往智能的路主持人：你当年押注神经网络，所有人都在质疑你，结果证明你是对的。现在你又在做一个类似的事情，押注against LLM和主流的生成式架构。你最近还围绕这个方向创办了新公司AMI。AMI在做什么？ LeCun：首先我要说清楚， LLM没有什么问题。 LLM是很多非常有用的AI产品的基础，我自己也在用，它们很好，做它们该做的事情。但 LLM不是通往人类水平智能的路径，甚至不是通往动物水平智能的路径。主持人：你自己还帮着做了最早一批主要的开源LLM。 LeCun：没错。所以AMI是什么？AMI代表Advanced Machine Intelligence，我们的定位是AI for the real world。今天大家熟知的AI技术，擅长的是语言操作。语言是很特殊的一种东西，它特别适合目前这些成功的架构。但现实世界呢？是高维的、连续的、有噪声的、混乱的。难度完全不在一个量级。这也是我大半个职业生涯在做的事情，过去五六年加速推进，最近两年取得了实质性进展。到去年年底，很明显Meta已经不是推进这个项目的合适场所了，所以我离开并创办了AMI。主持人：这似乎是一个行业趋势，越来越多的人从大公司或研究实验室出来，带着自己兴奋的研究方向创业。 LeCun：这确实是一个很奇怪的trade off。有两种模式。一种是大量探索性研究，很多方向并行。然后某个东西好像work了，你需要继续推进，但它已经不是研究了。做这些事的人是研究员——至少媒体这么叫他们——但实际上已经变成了工程和产品化。这种事在Meta发生过好几次。 2023年初，FAIR开发的Llama 1非常有前景，Meta专门创建了Gen AI组织来把它变成真正的产品，后来出了Llama 2、Llama 3、Llama 4。 Llama 4有点令人失望，扎克伯格对此不满意，把整个组织重组了，换了新人。但过去一年真正发生的事情是，Meta意识到自己落后了，于是把战略重新聚焦到追赶行业上。副作用就是，大量的探索性研究被降低了优先级。我做的JEPA和世界模型的工作倒没有受影响，但公司其他部分完全聚焦在LLM上了。这让我很清楚， Meta不再是推进这个项目的合适地方。我们有了初步成果，需要从研究转向真正的技术开发、规模化和产品化。同时我们也意识到，大部分应用场景Meta其实不太感兴趣，比如制造业。世界模型主持人：你在追求世界模型这个大方向。但也有其他人从更偏生成式的角度切入世界模型，比如Google的Genie、各种视频模型，VLA，还有李飞飞做的3D空间模型……你怎么看JEPA模型和这些方法的比较？ LeCun：世界模型正在快速变成一个 buzzword ，在研究领域已经是了，在工业界也开始了。 VLA我就不多说了。这条路现在普遍被认为走不通了，不够可靠，需要的训练数据太多。那什么是世界模型？从根本上说，世界模型就是让一个智能体能预测自己行为的后果。我无法想象你怎么能构建一个agent系统，而这个系统没有预测自己行为后果的能力。如果人类不考虑后果就行动，别人会觉得我们是傻子。所以世界模型就是这么回事，能够预测你自己行为的后果，你就可以规划一系列行动来完成一个任务、达成一个目标。通过规划、推理、搜索和优化来做这件事，而不是像LLM那样一个token接一个token地自回归预测。你是在搜索一个能完成任务的最优行动序列。 LLM没有预测自己行为后果的能力，也没有真正的规划能力，因为推理就是预测下一个token，不是搜索。所以，智能行为需要三个特征。第一，预测行为后果的能力。第二，通过优化和搜索来规划的能力，找到能产生正确结果的行动序列。第三，就是你怎么预测行为的后果。比如我面前有一个没有盖的水瓶。如果我推瓶子底部，它会在桌上滑动。如果我