开放式重量模型的成本难以承受

2026-06-25 1 阅读 ddxv
今天我正在设置 Hermes,看看它在网络研究方面的表现如何。我选择 DeepSeek V4 是因为我知道它很便宜,但看到它的定价与 Anthropic 和 OpenAI“前沿”模型相比真是太疯狂了。仅基于代币,价格就上涨了近 50 倍,更不用说他们的任何模型可能会陷入多少思考(为同一任务使用更多代币)。让我担心的是,Anthropic 和 OpenAI 似乎已经将自己逼入了高成本的角落。他们能否合理地将价格降低 20-50 倍以与 DeepSeek 或小米的 Mimo 竞争?开放式重量 vs 低成本 这些模型是否便宜,因为它们是开放式重量并且让数百人或多人在不同硬件上运行它们进行压力测试有助于降低成本?或者他们被提供作为亏损领导者以压低价格?如何保持大宗商品的高价格?你制造了稀缺性。您销售奢侈品和高端品牌。这就是 OpenAI 和 Anthropic 似乎正在做的事情,将“前沿”模型的使用限制在更高的墙后面。这就是奢侈品牌永远销售汽车和手袋的方式。它们是富人的俱乐部和地位象征,并不意味着广泛分布。 Anthropic 和 OpenAI 会利用中国的担忧来推动对开放权重模型的禁令吗?几个月来,这一直是我的恐惧,而过去的每一周似乎都证明了这一点。如何制造稀缺性?一种简单的方法是害怕贩子并让政府帮助限制竞争机会。为什么不竞争呢?美国曾经是这样的开源冠军,我希望美国能够展开激烈的开源竞争,以证明开放权重和开源模式最终是未来。 Google Gemma 4 于 2026 年 4 月发布 Meta 有 llama 尚未发布 OpenAI 最后一次发布开放权重 gpt 模型是在 2025 年 据我所知,Anthropic 从未发布过任何开放权重模型 真正的开源与开放权重 我认为开源的跨越式场景将是真正的开源模型,其中训练的数据管道也是开源的。 https://allenai.org/olmo -> 您现在可以下载这些模型,它们越来越受欢迎。话虽这么说,但它们有点过时了,数据将于 2024 年 12 月截止。展望未来,美国 NSF 与 Nvidia 合作,使 Allen AI 能够开发真正完全开放的 AI:https://www.nsf.gov/news/nsf-nvidia-partnership-enables-ai2-develop-filled-open-ai 奖励:想深入了解 Claude / ChatGPT 技术堆栈吗?查看他们用于构建 iOS 和 Android 应用程序的工具: Claude Android ChatGPT Android 您可以导航到 SDK 以查看特定部分的更详细细分以及未映射的 SDK 路径。