科技头条
morning
“出走”阿里两个月,林俊旸一出手就是20亿美金
2026-05-18
1 阅读
零态LT
文 | 零态LT,作者|马多多,编辑|胡展嘉 两个月前,林俊旸在X上发了一条“bye_my_beloved_qwen”,正式告别他一手带大的通义千问团队。 然后社交媒体就沉默了。 直到几天前,有人发现他清空了小红书,换了昵称、头像和简介。再然后,外媒The Information扔出了一颗炸弹——林俊旸正在筹备一家全新的AI实验室,种子轮目标估值20亿美元(约合136亿元人民币),红杉中国和高榕创投已经坐在了谈判桌上。 这不是普通的AI创业。 在中国,一家还没有产品、没有营收、甚至连名字都还没公布的初创公司,开口就要20亿美元估值——这几乎闻所未闻。哪怕是当年最热门的AI四小龙,早期融资也远没到这个级别。The Information自己都感慨:“这种估值在中国初创AI公司中几乎没有先例。” 钱是谁给的?红杉中国和高榕创投。人是谁招的?据36氪旗下《智能涌现》报道,已经有数名来自字节跳动、腾讯以及海外机构的研究人员加入。方向是什么?据知情人士透露,团队正在考虑“世界模型”与“具身大脑”两大技术路线。 一个33岁的年轻人,离开大厂两个月后,就能撑起20亿美金的估值。 这背后到底发生了什么? 从NLP工程师, 到阿里最年轻P10 林俊旸的履历,在大厂高管里显得有点“不务正业”。 1993年出生,本科读的是国际关系学院英语系,硕士去了北大外国语学院。一个学语言出身的年轻人,2019年硕士毕业进了阿里达摩院,从高级算法工程师干起。那时候没人会想到,这个“文科生”会在六年内连升四级,成为阿里巴巴史上最年轻的P10。 他的火箭式晋升,和Qwen的崛起是绑在一起的。 加入达摩院后,林俊旸很快成为M6多模态预训练模型团队的核心成员。M6是阿里早期最具野心的多模态大模型项目,团队把参数规模一路推到了十万亿级别。 天眼查媒体综合信息显示,2022年底,达摩院的语言和视觉AI团队整体并入阿里云,通义实验室成立,林俊旸正式接棒通义千问系列大模型的技术负责人。 从此,千问开始以一种令人侧目的速度扩张。在他的主导下,阿里推出了覆盖各类参数规模的Qwen开源模型家族。截至他离职前,Qwen系列全球下载量超过10亿次,衍生模型突破20万个。 天眼查及2026年1月Hugging Face的数据显示,Qwen已经稳居全球开源大模型第一的位置,和GPT、Claude在基准测试排行榜上正面交锋。2024年8月,前Qwen负责人周畅跳槽字节跳动后,阿里给核心团队做了一轮普调,林俊旸升到P9。不到一年时间,凭借团队的实际业绩,他又跃升至P10。 P10在阿里是什么概念? 技术序列的天花板,再往上就是副总裁级别了。33岁坐到这个位置,全集团没几个人。 离开伏笔, 一场关于掌控权的博弈 林俊旸为什么要走? 根据阿里内部人士透露,离职的直接导火索是“战略调整”。2025年下半年,阿里决定对Qwen的整体战略做出调整,认为需要引入更多技术人才,而这“在一定程度上涉及林俊旸原有权责范围的调整”。 说白了,公司要加人,而且加进来的人可能分走他的权力。经过多轮沟通,林俊旸没有接受这个方案,选择了主动辞职。 3月4日,他在X上发文官宣离队。同一天,后训练负责人郁博文、千问3.5/VL/Coder核心贡献者李凯新也透露了离职的消息。一天之内,千问的核心技术团队走了三位关键人物。阿里显然嗅到了危险。 第二天,集团CEO吴泳铭就在内部邮件中紧急回应,批准林俊旸辞职,同时宣布成立基础模型支持小组,由吴泳铭亲自带队,阿里云CTO周靖人继续负责通义实验室。一个月后的3月16日,阿里正式宣布成立Alibaba Token Hub事业群,吴泳铭直接负责,通义实验室被纳入其中。 速度之快,动作之大,侧面印证了这次人事地震的分量。更耐人寻味的是时机。林俊旸离职的第二天,谷歌DeepMind开发团队的负责人Omar Sanseviero就在社交平台上“隔空喊话”千问团队:“如果您想找个新地方来构建优秀的模型,并为开放模型生态系统做出贡献,请联系我们。”大厂挖人的嗅觉,从来不会迟到。 现在回头看,林俊旸3月4号宣布离职,5月13号就被曝出启动20亿美元融资。两个月的“空窗期”里,他不仅完成了商业计划书,还谈好了两家顶级VC,组建了一支跨国团队。这不是临时起意,是蓄谋已久的转身。 20亿美金估值:贵不贵? 贵不贵,得看跟谁比。在美国,AI创始人的估值已经飞出了大气层。前OpenAI首席科学家Ilya Sutskever成立的安全超级智能公司SSI,成立仅三个月就以50亿美元估值融资10亿美元。前OpenAI CTO Mira Murati去年创立的Thinking Machines Lab,首轮融资估值直接冲到了100亿美元。相比之下,林俊旸的20亿美元确实“实惠”。但问题是,他不在硅谷,他在中国。中国AI创业公司的估值,通常远低于美国同行。 20亿美元放在国内,已经打破了天花板。VC们凭什么给这个价?说白了,买的是“确定性”。千问的战绩就是最大的背书。全球10亿次下载、20万个衍生模型、开源社区排名第一——这些数据不是PPT上画出来的,是实打实的。在中国的大模型赛道里,除了字节的豆包和百度的文心,没有第三个名字能跟千问掰手腕。而林俊旸作为千问的技术掌门人,就是这个品牌最核心的“资产”。 此外,红杉和高榕的入局也有战略层面的考量。国内一级市场上,真正具有全球竞争力的AI创始人屈指可数——林俊旸算一个,周畅(去了字节)算一个,面壁智能的李大海算一个。优质标的极度稀缺,造成了某种程度上的“抢人式投资”。你不投,竞争对手就会投。另一个值得关注的信号是融资结构。据知情人士透露,本轮融资规模是“数亿美元”。如果按20亿估值、10%~15%的出让比例来算,实际融资金额可能在2~3亿美元。对于一个种子轮公司来说,这笔钱足够烧上两三年。 林俊旸的技术赌局钱有了,人有了,但最关键的问题还没回答:他到底要做什么? 答案可能藏在他3月26日发布的那篇长文里。这篇文章的标题很直白:《从“推理式思考”到“智能体式思考”》(From “Reasoning” Thinking to “Agentic” Thinking)。全文的核心论点可以浓缩成一句话:上一阶段的AI竞赛,是让模型更会思考;下一阶段的竞赛,是让模型为了行动而思考。 在林俊旸看来,推理模型的范式已经达到了一个拐点。 OpenAI o1、DeepSeek R1这些模型的成功,证明了大模型通过强化学习在数学、代码、逻辑等可验证任务上可以获得质的飞跃。但这条路的边际收益正在递减——当模型已经能在数学竞赛中碾压人类,接下来的突破点在哪里? 他的答案是:Agentic Thinking。 这种“为了行动而思考”的能力,区别于静态推理的关键在于交互。模型不再是独立地完成推理链然后吐出答案,而是在一个环境中行动、接收反馈、修正计划、继续推进。训练的对象不再是模型本身,而是“模型+环境”的系统,也就是智能体及其编排框架。这给研究方向带来了根本性的变化。最重要的不再是RL算法本身,而是环境设计、轨迹采样基础设施、评估器的鲁棒性,以及多智能体之间的协调接口。竞争优势的来源也从“更好的反馈信号”转向“更好的环境”和“训练-推理-行动的闭环”。 这篇文章被广