H200还没到中国,Anthropic先急了:千亿美元抢芯片,转头涨价让开发者买单

2026-05-18 1 阅读 褚杏娟
当地时间 5 月 14 日,Anthropic 以中美 AI 竞争为由发布长文,呼吁进一步收紧芯片出口限制。 同一天稍早时候,路透社报道称,美国已批准约 10 家中国公司购买英伟达专为中国市场定制的 H200 芯片。报道提到的公司包括阿里、腾讯、字节、京东等。不过,这批许可尚未转化为实际交付。 Anthropic 直接指出,训练前沿 AI 模型最关键的资源是先进芯片,也就是算力。美国目前的优势建立在 NVIDIA、AMD、TSMC 等“民主国家产业链”之上。但如果不进一步收紧管制,美国在 2028 年前可能会失去主导权,中国 AI 实验室的模型能力可能追到只落后美国几个月。 Anthropic 还引用了一组数据,称按总处理性能计算,华为在 2026 年的算力产出仅相当于英伟达的 4%,到 2027 年更是降至 2%。 在 Anthropic 的框架里,中美 AI 竞争被拆解为四条线:第一是智能,即谁能开发出最强大的 AI 模型;第二是国内采用,即谁能更有效地把 AI 整合进商业和公共部门;第三是全球分发,即谁能部署支撑世界经济运行的全球 AI 技术栈;第四是韧性,即谁能在 AI 带来的经济社会转型中维持稳定和连续性。 其中,模型智能被认为是最重要的一条,而这也是 Anthropic 收入的重要基石。 Anthropic 认为,当前中国 AI 实验室之所以仍能接近美国模型能力,主要依靠三类因素:世界级人才、先进算力,以及通过大规模“蒸馏攻击”提取其前沿模型能力。为此,Anthropic 还提出,应明确将“蒸馏攻击”非法化,并加强情报共享;同时推动美国“可信 AI 技术栈”出口,抢占全球南方市场。 一边阻止先进芯片外流,Anthropic 一边正在斥巨资解决自身面临的巨大算力短缺问题,同时通过频繁调整产品价格,让用户来承担算力短缺带来的影响。 又又又调价,开发者气疯了 在算力持续紧张的背景下,Anthropic 再一次调整了定价策略。 近日,Anthropic 宣布,从 6 月 15 日起,将把程序化 Claude 使用量与标准聊天订阅额度拆分开来。也就是说,开发者通过 Agent SDK、GitHub Actions,以及 OpenClaw 等第三方智能体框架调用 Claude 时,将不再简单计入原有订阅套餐,而是进入一个独立的月度积分系统,并按照类似 API 的方式计费。 这一变化意味着,过去许多开发者用 Claude Pro 或 Max 套餐低成本运行自动化任务、智能体脚本、CI 流水线和长期编码代理的方式,将面临重新定价。 根据 Anthropic 的安排,程序化使用的月度积分额度将与用户现有 Claude 订阅档位挂钩,大体对应其月费水平。其中,Pro 用户每月可获得 20 美元积分,Max 5x 用户为 100 美元,Max 20x 用户为 200 美元。 在此之前,Claude 的交互式聊天使用和程序化调用来自同一个订阅额度池。开发者不仅可以用高阶 Claude 套餐进行聊天、写代码、调试,也可以通过外部智能体框架运行自动化工作流。 正是这种“一个订阅覆盖多种用途”的模式,让 Claude 一度成为智能体开发者眼中的高性价比选择。尤其对于运行长期任务的开发者来说,通过 OpenClaw、Agent SDK 等工具调用 Claude,实际成本往往低于直接使用 API。 但 Anthropic 早在今年 4 月就已经释放信号。公司当时在 X 上表示,Claude 订阅将“不再覆盖 OpenClaw 等第三方工具的使用量”,理由是算力容量受限。新政策落地后,开发者如果继续使用外部智能体框架,要么购买额外用量包,要么转向直接 API 计费。 有趣的是,Anthropic 首席财务官 Krishna Rao 在采访中表示,“我们的定价一直比较稳定。无论是 Haiku、Sonnet,还是 Opus,价格都没有频繁调整。现在 Mythos 当然是比较新的模型,但总体来说,Anthropic 很少改价格。过去最大的一次价格调整,是在推出 Opus 4.5 时,公司把 Opus 系列的价格降了下来。” 他解释当时的降价的原因在于,Anthropic 发现 Opus 级模型的能力很强,但实际使用量没有完全匹配它的能力。很多客户明明遇到的是一个适合用 Opus 解决的问题,却会想办法把它塞进 Sonnet 的工作负载里。后来,由于模型效率上又有提升,从 Anthropic 的角度看,已经可以更高效地运行 Opus,于是公司就把价格降下来,让客户更容易用上它。 这又回到一个核心点:Anthropic 希望用户使用自己的模型,这也价格必须设在一个用户可以接受、并且能够从中获得足够价值的位置上。 Krishna 认为,“Opus 这次降价,其实体现了杰文斯悖论:Anthropic 把价格降了下来,但使用量的增长远远超过原本预期。也就是说,因为价格落到了客户觉得合适的位置,他们开始更大量地使用 Opus。而 Anthropic 也有足够的效率,可以支撑这种大规模使用。等客户把它真正接入自己的工作流之后,Anthropic 再发布 Opus 4.6,它就是一次模型升级,客户可以直接替换进去,而价格不需要再变。” Krishna 强调定价稳定很重要,但实际上,用户对价格有很强的敏感度,很反感Anthropic一而再再而三地调整价格策略。 如之前调整一样,最新调整很快就引发了开发者不满。许多人认为,Anthropic 正在削弱 Claude 对智能体工作流最有吸引力的一点:用相对稳定、可预测的订阅价格,支撑大规模自动化任务。 高级数据科学家 Yadesh Salvi 在 X 上批评称,Anthropic 提供的月度额度“连一天的认真工作都撑不过去”。他认为,Claude Agent SDK 和 Claude Code 中的 claude -p 等功能原本是用户高频使用的核心能力,如今却被压缩使用空间,还被包装成订阅福利。 Broadcom 高级站点可靠性工程师 Advait Patel 也表示,对于那些基于 Claude Pro 或 Max 固定价格套餐构建副业项目和个人自动化工具的开发者来说,新的独立积分池确实能给开发者一点试验空间,但一旦智能体足够有用、需要频繁运行,开发者就不可避免地进入按量计费模式。 “重度智能体用户消耗的算力,远远超过 20 美元或 100 美元订阅能够支撑的范围。”Patel 认为,运行大模型本身确实昂贵,面向程序化使用的无限固定价格套餐,本来就很难长期持续。同样的钱,能跑的自动化任务变少了,想保持原来的使用强度,就要额外付费。 这场定价变化影响的不只是个人开发者,也会给企业带来新的成本管理问题。Patel 指出,过去一些团队会依赖 Claude 订阅运行无人值守工作流,例如 CI 流水线、定时自动化任务和长时间运行的编码智能体。但在新政策下,使用量将更直接地与 token 消耗绑定,而不是简单跟订阅档位绑定。 这会让企业在预算预测上面临更大不确定性。尤其是那些涉及多次重试、大上下文窗口、多步骤智能体循环的工作负载,其 token 消耗可能快速膨胀。 更麻烦的是,Anthropic 的