智能AI morning

深度|卡帕蒂为何突然加入人类,只能当达里奥的「-2」?

2026-05-20 1 阅读 新智元
新智元报道 【新智元导读】 5 月 19 日,OpenAI 联合创始人、「Vibe Coding」之父 Andrej Karpathy 宣布加入 Anthropic 预训练团队。他将组建新团队,用 Claude 加速预训练研究。一个做过Hinton和李飞飞学生、奥特曼同事、马斯克直属下属的人,为什么甘愿做 Dario Amodei 的「-2」?Anthropic 又为什么非要招他? 5 月 19 日晚上 11 点, Andrej Karpathy 亲自官宣加入了 Anthropic。 这个名字的分量不需要多解释。 OpenAI 联合创始人,特斯拉前 AI 总监,「Vibe Coding」之父,全球最有影响力的 AI 教育者。 他在 AI 领域的地位,大概相当于篮球界的詹姆斯,到哪支队伍都是头条。 他在 X 上只发了三句话。 https://x.com/karpathy/status/2056753169888334312 第一句说 LLM 前沿的未来几年「尤其具有塑造性」。第三句说他仍然热爱教育。中间那句最关键,五个词,「回归研发」。 这是两年内第三位从 OpenAI 阵营投奔 Anthropic 的核心人物。 也是一个即将 40 岁、功成名就、财务自由的人,主动选择去给别人的下属当下属。 为什么走?为什么是 Anthropic?Anthropic 又为什么非要招他? 每一个问题背后都有一层值得拆开看的东西。 他去做什么 Karpathy 本周已经开始工作,进入了 Anthropic 预训练团队。 这个团队由 Nick Joseph 领导,负责 Claude 所有大规模训练运行。 Anthropic 发言人向 TechCrunch 确认,Karpathy 将组建一个新的子团队,专注于用 Claude 自身来加速预训练研究。 Nick Joseph 也在 X 上补充了背景,「他将建立一个团队,专注于用 Claude 加速预训练研究本身。」 https://x.com/nickevanjoseph/status/2056760504949842219 TechCrunch 评价称,「Karpathy 是少数能在 LLM 理论与大规模训练实践之间架起桥梁的研究者之一。」 Axios 则把这件事定性为「Anthropic 在人才争夺中的重大胜利」。 同日宣布加入 Anthropic 的还有网络安全专家 Chris Rohlf,此前 xAI 创始成员 Ross Nordeen 也于本月早些时候加入。人才流向的方向性越来越明显。 https://x.com/chrisrohlf/status/2056744653165092983 在 Polymarket 的数据可以作为市场情绪的旁证——交易者给 Anthropic 在 6 月底拥有最佳 AI 模型的概率定价为 65%,而 OpenAI 为 4%。 https://polymarket.com/event/which-company-has-best-ai-model-end-of-june Karpathy 的加入进一步强化了这个判断。 定义者 Karpathy 要理解这次加入的重量,需要理解 Karpathy 这个人的稀缺性。 他的稀缺不在于技术能力,顶级研究者有一批。 他的稀缺,在于他能用一个词改变整个行业理解某件事的方式。 1986 年生于斯洛伐克,15 岁移民加拿大多伦多。 在多伦多大学读本科时选修了 Geoffrey Hinton 的课程并参加了他的读书会。 Hinton 是深度学习复兴运动的精神领袖,2018 年图灵奖得主,2024 年诺贝尔物理学奖得主。 Karpathy 是最早被这把火点燃的年轻人之一。 之后在 Stanford 师从另一位传奇人物李飞飞,博士期间创建了 CS231n 课程。 这门课从 2015 年的 150 名学生涨到 2017 年的 750 人,全部视频讲义公开上网,成为全球无数工程师自学深度学习的第一站,更是计算机视觉第一神课,没有之一。 2015 年,他成为 OpenAI 的创始研究科学家。 2017 年被马斯克招至特斯拉担任 AI 高级总监,推动自动驾驶走向纯视觉方案。 在这次挖角中,马斯克承受了巨大的压力。 https://www.cnbc.com/2026/05/19/anthropic-hires-openai-cofounder-andrej-karpathy-former-tesla-ai-lead.html 同年,Karpathy 在 Medium 上发表了一篇文章,提出了「Software 2.0」概念,主张神经网络权重就是新的代码,数据集就是新的源代码,梯度下降就是新的编译器。 这个框架重塑了整个行业对「什么是编程」的认知。 2022 年离开特斯拉后,他在 YouTube 上创建了「Neural Networks: Zero to Hero」系列课程,频道突破百万订阅。 同期的开源项目 micrograd、nanoGPT、nanochat,代码量极少但精准击中核心概念,被称为「可运行的教科书」。 2025 年 2 月,他造出了「Vibe Coding」一词,被柯林斯词典选为年度词汇。 https://x.com/karpathy/status/1886192184808149383 6 月在 YC AI Startup School 演讲中提出「Software 3.0」和「Agent 的十年」框架,成为当年讨论最广的 AI 演讲之一。 TIME 在 2024 年将他列入「AI 领域最具影响力 100 人」。 从 Hinton,到李飞飞,到奥特曼,再到马斯克,他在每个节点都站在最前沿。 但他留下的最持久的东西不是任何一个产品或论文,而是那些概念框架。 Software 2.0、Vibe Coding、LLM OS。这些词改变了人们思考 AI 的方式。 为什么甘愿做「-2」 Karpathy 的职业生涯有一条清晰的线索,他追逐的从来不是头衔。 他做过Hinton和李飞飞的学生、奥特曼的同事、马斯克的直接下属。 每一段经历里,他的组织架构位置都是高层。 现在他加入 Anthropic,直接上司是 Nick Joseph,预训练负责人。 Nick Joseph 汇报给 Dario Amodei。 Karpathy 在组织架构中排到了第三层。 Nick Joseph 是 Anthropic 创始 11 人之一,此前在 Vicarious 和 OpenAI 工作。 在 OpenAI 期间,他在安全团队做代码模型,看到 GPT-3 微调之后能写代码,意识到 AI 可以自我改进,于是跟着安全团队的领导一起离开,创建了 Anthropic。 他的团队训出了 Claude 全系列模型,包括 Mythos。 Karpathy 愿意在 Nick Joseph 下面做研究,原因很简单,这个位置离他想做的事最近。 回溯他的每一次职业变动,驱动力都是同一个,「此刻最大的实验在哪里」。 2017 年去 Tesla,因为自动驾驶是 Software 2.0 最大的实验场。 2022 年离开,因为架构已定,剩下的是工程优化