数码硬件
morning
算力荒,但Token却便宜了,智算云的账该怎么算?
2026-06-24
1 阅读
TechPulse
中国智算行业正在同时经历两件矛盾的事:算力越来越贵,但Token越来越便宜。 一面是算力需求溢出,国内优质算力资源持续紧张,价格自今年春节前已涨超50%,有渠道商反映,部分热门算力卡型号”不是贵的问题,是根本拿不到”;国内外的智算中心疯狂堆算力,甚至要靠签远期合同锁定。 但另一面是Token价格崩塌,两年前每百万token要几十美元,现在不到一美元,主流大模型厂商为了争用户,几乎在做赔本的生意。行业内有观点认为,当前以超低价争夺用户的模式,长期来看可持续性存疑。 这说明大模型产业发展的早期,还没有找到多赢的方式,也注定是不可持续的商业模式。当芯片厂商拿走了60%以上的利润,做应用的几乎没有定价权,中间层的智算云,顶着上游的成本压力,也要面对下游客户不断压价。 在行业人士看来,更根本的问题是,现在撑着整个行业运转的硬件,本质上是为训练设计的,拿来跑推理、生产Token,就像开着法拉利送外卖,成本结构从一开始就对不上。 训练侧的逻辑,撑不起推理侧的账 过去三年,智算行业卖出了一个共同的故事,谁有卡,谁就赢。 这个逻辑在训练侧是成立的,大模型竞赛本质是算力竞赛,一个1万卡集群和一个10万卡集群能训出来的模型根本不在同一天花板。 九章云集创始人方磊透露,九章云极目前收到的远期订单是自身可交付容量的10倍以上,锁定资源的定金比例最低只有5%,但若同时锁定价格则需要30%到40%的定金。 但推理侧的生意,早就跑在了一条完全不同的轨道上。全球范围内,Token单价持续降低,底层的算力成本却并没有同步下降,能耗、折旧、网络,每一笔都是真实支出。 问题还不止于此,智算中心的算力利用率普遍不高,根本原因在于网络传输本身成为了瓶颈。在大规模训练集群里,数万块加速卡需要频繁同步数据,任何网络延迟都会让大量算力陷入等待。 此前有业内人士指出,千卡级训练中通信时间占比可达30%以上,在超大规模场景下甚至高达50%至70%,scale up(单机多卡)和scale out(多机组网)之间的效率鸿沟,是从训练工厂移植过来、天然无法消除的技术债。 如上所述,产业链的利润分配结构也是问题,上游芯片厂商吃掉了整条链路60%以上的价值,中游云厂商在CPU时代的净利润率大约在35%,但在AI时代,算力成本占到运营支出的七八成,毛利空间被双向挤压。 银河证券分析师吴砚靖称,Token经济的定价权目前仍集中在上游,中游是效率放大器,下游暂时没有话语权。换而言之,中下游的景气度改善需要等待上游产能充分释放之后。 硬件供给侧同样受限,国产AI芯片产能不足,是当前最薄的那块木板。 国内方面,还多了一层算电协同的复杂性,业内人士提到,绿电直供有60到80公里的物理传输上限,一旦上高压就要缴纳“过路费”,而且光伏夜间不发电,风电功率曲线波动剧烈,和智算中心希望的恒定功率曲线严重错位,储能配比超过15%就开始亏本。 当前算电协同还有待更多突破,包括绿电直供能否通过高压更远传输,水电和核电能否纳入绿电认定,甚至绿证价格本身也在持续上涨,今年以来已涨了近一倍。 现在谈Token工厂,时机上既不早也不晚,早了基础设施不成熟,晚了就错失机会窗口。 做运营商,不做中间商 云计算行业已经很久没有新的挑战者,即便AI带来了全新的变量,但云计算所需要的规模和资金,依然是现实的护城河,一些企业极却给出了一个让人意外的答案。 “九章非常重要的定位,是走出一条与互联网大厂云不同的路——做算力赛道的‘第三方选择。”方磊所说的大云,是阿里云和火山引擎,阿里云和火山引擎背后是两家年收入数千亿的互联网巨头,九章云极至今仍是一家创业公司,这种反差,怎么看都有些错位。 他认为,大云有大云的结构性特点,那些在互联网时代成长起来的云厂商,底层架构是为带宽和存储优化的,AI时代90%的成本是计算,100G的老交换机和为AI专门设计的400G交换机之间,效率差距难以弥合。新的云计算平台跑同样一张英伟达GPU,在特定场景下效率优势显著,这是历史包袱决定的。 事实上,行业内存在一种“算力贸易”模式——买一批服务器放进机房,租给客户,自己没有调度能力。 在方磊看来,现货倒卖,客户应该签远期订单才能拿到资源,资产是自己控制的——一些与互联网大厂存在竞争关系的企业,在选择算力平台时会优先考虑中立方案——这正是第三方云存在的理由。 训练工厂对应零到一的模型制造,目标是在未来24个月内形成10万P的训练算力,方磊判断,下一代前沿模型的突破,要靠30万卡甚至更大的集群才能跑出来,而这样的超大规模基础设施仍在建设过程中。 Token工厂对应一到N的规模化交付,目标是每天10万亿token,但这10万亿不是通用token,而是面向专业场景的”专业级”和”前沿级”。方磊将token市场分成三层:消费级(每百万token约1美元)、专业级(每百万20到40美元)、前沿级(每百万150美元以上)。 九章的战略锚定在后两层,帮助客户训练专业模型,再通过Token工厂低成本交付专业token。他的逻辑是,千行百业里真正能让AI落地的,不是通用大模型,而是垂直专业模型,“没有专业模型,所谓‘AI+行业’就只是一句口号”。 具体落地上,九章云极计划合作超过1000家专业模型厂商,资产端则复制了一种基础设施行业常见的轻资产模式:央国企出资持有资产,九章负责运营,按比例分成。 此外,九章云极已在东南亚、日本、中东及欧洲多地进行布局,将中国方案定位为AI基础设施的”第二选项”。这背后的逻辑是:上一轮云计算,欧洲和日本几乎全面依赖美国技术栈,当前AI时代各国对”主权云”的诉求空前强烈,中国的模型能力、成本优势和不依附于美国供应链的属性,正好填上了这个缺口。 (本文作者 | 张帅,编辑 | 杨林)