智能AI
evening
刚刚,北京建了一座AI工厂:目标10万P算力,日产10万亿Token!
2026-06-17
1 阅读
十三
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 刚刚,北京建了一座AI工厂:目标10万P算力,日产10万亿Token! 十三 2026-06-17 21:07:48 来源: 量子位 计划1000倍综合降本 金磊 发自 凹非寺 量子位 | 公众号 QbitAI AI圈卷到现在,开始 建工厂 了。 这不,就在刚刚, 北京 就开了一家,包含两个核心组成部分: 一个是 训练工厂 : 目标算力规模 10万P ,负责把通用大模型、行业数据和算力资源放进来,炼成金融、制造、政务、科研等行业能用的专业模型。 另一个是 Token工厂 : 目标日均产能 10万亿Token ,负责把这些专业模型封装成企业可以调用、可以计量、可以结算、可以稳定交付的专业Token。 这便是 九章云极 在2026全球智算科技峰会暨九章云极战略发布会上,正式抛出一个新战略—— AI工厂 。 它听起来点像把AI产业搬进现代化工厂: 前端炼模型,后端送智能。 然后中间再用 DCU (1度算力)度量算力投入,用 专业Token (面向业务任务的智能价值单元)度量智能产出,再让业务数据回流,继续推动模型迭代。 由此带来的效益,用一组数据展示便是: 10万P目标算力规模、10万亿目标Token日均产能、1000倍目标综合降本、计划孵化1000个高价值模型与智能应用。 更直观的,一张图解如下所示: 不过比起这些数字来说,从九章云极的这次战略发布来看,智算云的商业逻辑正在发生变化—— 它不再只回答算力够不够,还要回答算力能不能变成真正可交付的智能。 而这,便是九章云极此次动作的目的,把这上面个问题试图工程化。 AI工厂,到底怎么运转? 要理解这座AI工厂,我们首先需要了解当前企业在拥抱大模型时面临的真实痛点。 过去,大家热衷于讨论的可能是模型参数有多大、是不是开源、打分高不高;但现在,业务一线的真实拷问是: 模型能不能真正跑进我们复杂的业务系统?在超高并发下,能不能稳定输出可预期的结果?每一次API调用的成本,业务部门能不能算清账、算赢账? 这已经不是一个纯粹的算法竞赛,更准确的说,应该是一个典型的工程与工业化问题。 毕竟阻碍AI落地的现实瓶颈往往不在大模型本身,而在其背后的整套底层智算基建,包括算力调度是否高效、异构算力能否统一纳管、推理成本是否足够低、任务失败时系统能否自动感知并自愈…… 因此,九章云极推出的AI工厂,本质上是在用一套标准化、规模化、高可靠性的工业化流水线,去重构智能的生产与交付体系。 从AI工厂的整个版图来看,可以分为 四个关键部分 来看。 投入侧:首创“一度算力”(DCU) 这是解决如何购买算力的问题。 长期以来,算力行业最大的痛点就是 资源不标准、计价不透明、投入不可量化 。 过去,企业通常需要去租用GPU、规划网络拓扑、考虑存储带宽以及机器的使用时长。 这种粗放的租赁模式,就如同在初期的电力时代,想要用电,必须自己去买煤炭、租发电机,甚至自己去拉电线,门槛极高、成本混乱、无法规模化。 九章云极在行业内首创了 “一度算力” 计量单位,将其定义为312TFlops×小时(每秒钟312万亿次浮点计算乘以一小时)。 △九章云极董事长,方磊 它将底层芯片(异构的GPU、NPU)、网络、存储、使用时长及实际利用率等极其复杂的物理资源统一折算计量。 对客户而言,算力采购从此变得像买电一样简单,按“度”付费、所见即所得。 生产侧:训练工厂 训练工厂解决的是 智能“从0到1”的生产问题 。 通俗来讲,就是把通用模型、行业数据、算力资源放进来,通过数据处理、领域精调、强化学习、评测反馈等流程,训练出金融、制造、政务、科研等场景可用的专业模型。 这里的重点不只是有多少卡。 训练工厂强调的是千卡到万卡级集群、高密度网络存储、故障自愈、跨地域调度,以及从数据、训练、评测到部署的全流程工具链。训练工厂能够将通用基础模型,升级为适配各行各业的 专业任务模型 。 通用模型存在天然的数据边界与能力边界,无法覆盖企业私有数据、行业Know-How、复杂业务流程。而训练工厂的价值,就是把行业专属知识沉淀进模型,让AI从会聊天、会答题,升级为 能拆解任务、能自主决策、能风险判断、能闭环落地 的产业智能体,真正适配企业生产环境。 封装侧:Token工厂 Token工厂解决的是 智能“从1到N”的交付问题 。 训练工厂生产出专业模型之后,模型本身还不是企业能直接消费的商品。企业真正需要的是稳定API、SDK、权限体系、模型版本管理、监控告警、计量计费和服务保障。 Token工厂就是把训练工厂产出的专业模型, 封装成可调用、可计量、可运营的专业Token 。 这里的Token,也不只是大模型里的技术计数单位。按照九章云极的定义,专业Token更接近一种 面向业务任务的智能价值单元 。不同任务、不同模型、不同服务等级,都可以通过Token被计量和结算。 产出侧:越用越强,越强越便宜 至此,AI工厂的核心飞轮闭环就此形成: DCU度量投入 → 训练工厂冶炼专业模型 → Token工厂转化为专业Token → 企业消费Token并回流业务数据 → 模型持续迭代 我们可以把它理解为 “越用越强,越强越便宜” 的增强回路。在这里,数据不仅是原料,也是模型进化的养分。 值得注意的是,在这一闭环中,九章云极 重新定义了Token 。 他们认为,面向消费者的泛化Token单价已经由于市场竞争趋于零,其价值正逐渐见顶。而面向产业的、具有明确 ROI(投资回报率)的专业Token,才是驱动产业智能化的核心组件。 九章云极将这些专业Token进行了清晰的价值分层,并将其战略重心聚焦在后两者: 消费级Token :主要服务于日常AI应用、内容创作,追求极致体验与规模普惠,如同稳定经济的基础电力; 专业级Token :封装了行业深度Know-How与私有数据,充当金融风控、质量检测、政务服务的数字专家,保障流程安全、合规,让客户买到确定的效率与风控价值; 前沿级Token :面向复杂任务自动化与科研突破。例如,封装了多步骤、多工具的端到端仿真或科研工作流,直接服务于药物发现、新材料研发、城市级系统优化等曾经不可解或成本极高的科学边界。 从租卡到用Token,企业AI开始变轻了 过去企业做AI,往往是一条漫长的重资产建设路径。 包括多方协调、艰难地在市面上找芯片、拼凑卡;组建专业的集群运维团队,解决算力中断、故障恢复;搭建复杂的开发与模型训练环境,再进行私有化部署。 这一套流程下来,周期通常长达6到12个月,还没看到业务效果,前期资本开支已经堆成了天文数字。 而在九章云极AI工厂的模式下,针对不同类型的市场玩家,整个接入路径被彻底 变轻、变薄 。 针对大模型公司和垂类AI企业:从训练开始 大模型创业公司或者垂直行业的AI领头羊,自身拥有极强的算法和数据能力,但往往被算力运维和成本压得喘不过气。 对于这类客户,他们可以从 训练工厂 无缝切入。AI工厂提供千卡到万卡级的极致弹性算力集群,不仅保证大规模模型并行训练