DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手鱼羊 2026-05-25 12:40:14 来源：量子位原本4亿+token、61美元的账单，直降至12美元鱼羊发自凹非寺量子位 | 公众号 QbitAI 我悟了，DeepSeek V4系列发布1个月，价格屠夫的本色这才刚刚发力啊！官方这边，打折促销期还没过，折上折价格已官宣落定为永久降价。就这样，开源社区仍不满足。您猜怎么着？缓存命中率直接给干到 99.82% 了！什么概念？就是原本4亿+token、61美元（合人民币414元）的账单，能直降至12美元（合人民币81元），2折轻松到手。老哥老姐们给这个名为 Reasonix 的项目点星都点疯了，状态be like：具体来说，Reasonix是一款专为DeepSeek打造的终端coding harness ，核心目的很简单，就是两个字：省钱 —— 长会话能把缓存命中保持在90%+，输入token成本降到1/5的那种。 DeepSeek原生编程Agent Reasonix的实现思路也不复杂，最核心的一点是：基于字节稳定prefix-cache设计的append-only运行循环。就是说，Reasonix的工作流程是专门为了DeepSeek的缓存机制设计的：旧的上下文固定不动，新消息只往后追加，尽量保证每一轮请求的前半部分完全一样，从而提高缓存命中率，降低长会话成本。具体架构可以拆分成3个部分来看。缓存优先循环（Cache-First Loop）自动前缀缓存（prefix-cache）仅在当前请求的精确字节前缀和先前请求匹配时才会激活，想要提高缓存命中率，需要解决的是大多数智能体循环会在每次交互时重新排序、重写或注入新的时间戳的问题。 Reasonix的解决方案是把上下文划分为三个区域：这样，前缀会被固定下来，在每个会话中仅计算一次；历史消息只追加不重写；而草稿区中的任何信息在归入日志前，均需通过Tool-Call Repair进行提炼。工具调用修复（Tool-Call Repair） DeepSeek比较容易遇到的问题包括：工具调用JSON在内部已经生成，但在最终消息里却消失不见；模型想调用工具，但参数写歪了，即JSON参数畸形；同一工具被反复调用且参数完全相同，即重复调用风暴； JSON被截断。工具调用修复会通过4轮处理，让Reasonix在真正执行前，先尝试修复这些问题。成本控制首先，默认优先使用v4 flash，困难任务才会切pro。其次，轮次结束自动压缩上下文。用户要是觉得下一次任务比较难，就输入/pro，这样下一轮对话模型就会切换为v4 pro。跑完这一轮后Reasonix自动切回便宜模型，无需用户手动更改。最后，失败信号会触发自动升级：失败次数到达警戒线后，当前轮次的剩余部分就会切到v4 pro上运行。 Reasonix在安装使用方面也比较简单。两步即可运行，无需全局安装：进入项目目录；输入：npx reasonix code，启动TUI会话。不习惯用终端的话，Reasonix还提供了桌面版。以及再次再次高亮一下来自Reasonix官方的提醒： Reasonix只为DeepSeek打造，每一个抽象层级都基于DeepSeek的Feature构建，完全不通用，也“不会发布通用功能”。 One More Thing 省钱的事情，大家伙当然喜闻乐见，毕竟也不是每个人都能像龙虾之父Peter那样无限狂烧公司token。于是关于Reasonix的讨论，是轻轻松松就盖了几百楼。不少小伙伴已经摩拳擦掌跃跃欲试，但也有人提出疑问：我们真的需要一个DeepSeek原生编程Agent吗？有网友分享说，Ta写了一个微型桥接程序，在Codex中使用DeepSeek V4 Pro，同样实现了95%以上的高缓存命中。并且Ta“没做任何特殊处理，只是将DeepSeek API的格式调整为Codex所需要的”。 anyway，harness和harness之间肯定是有区别的。就有网友分享说，在Claude Code里使用DeepSeek V4比在OpenCode上省钱。甭管你用了哪一种方案，都欢迎在评论区分享分享心得体验。大家省才是真的省（doge）。项目地址： https://github.com/esengine/DeepSeek-Reasonix 参考链接： [1] https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md#pillar-1–cache-first-loop [2] https://esengine.github.io/DeepSeek-Reasonix/index.html#agents 版权所有，未经授权不得以任何形式转载及使用，违者必究。 Deepseek Harness 鱼羊腾讯开源 Agent 记忆技术方案，Token 消耗最高降低 61% 2026-05-14 DeepSeek识图模式是个新模型？！一手实测在此（没错我被灰度到了） 2026-04-30 DeepSeek不惜代价保住它！V4关键特性被挖出来了 2026-04-28 DeepSeek V4终于发布！打破最强闭源垄断，明确携手华为芯片 2026-04-24 扫码分享至朋友圈相关阅读 DeepSeek前脚发新论文，奥特曼立马跟上：GPT-5就在几个月后啊十三 2025-04-05 Deepseek GPT-5 OpenAI 奥特曼华为+DeepSeek，推理性能创新高！技术报告也公布出来了 1920 Tokens/s！十三 2025-05-19 Deepseek 华为大模型昇腾 DeepSeek上线国家超算平台！三大运营商接入，平头哥芯片适配影响力已不仅限于AI和互联网梦晨 2025-02-10 Deepseek DeepSeek新模型被硅谷夸疯了！用二维视觉压缩一维文字，单GPU能跑，“谷歌核心机密被开源” 网友直呼：AI的JPEG时刻！一水 2025-10-21 Deepseek 实测DeepSeek V3.1，不止拓展上下文长度击败Claude成非推理模型SOTA，但价格便宜68倍不圆 2025-08-20 Deepseek DeepSeek V3 实测开源刚刚，DeepSeek能看懂猫片了！腾讯混元加持免费无限用白交 2025-02-21 Deepseek 腾讯元宝热门文章 AI水论文封一年，署名连坐！arXiv最严新规来了，陶哲轩附议 2026-05-18 智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速 2026-05-20 菲尔兹奖得主都看懵了：OpenAI非数学模型首次自主突破80年未解

订阅66必读