说实话,我之前一直觉得 DeepSeek 写代码已经够便宜了,直到看到这个项目的基准测试数据,才发现“便宜”和“真的便宜”之间差了将近 50 倍。
一个真实用户,一天跑了 4.35 亿 token,账单 $1.38。同样的量如果不走缓存,DeepSeek 后台会显示 $61。差了 97.7%,不是优化,是直接把成本结构掀了。
这个东西叫 Reasonix,开源的,MIT 协议,GitHub 地址在这里:
它到底干了什么
Reasonix 是一个专门给 DeepSeek 写的终端编程 Agent。注意“专门”两个字——它不是那种支持十几个模型的通用框架,而是只认 DeepSeek,整个架构就是为了把 DeepSeek 的前缀缓存机制吃干抹净。
DeepSeek 的 API 默认就带前缀缓存,缓存命中的输入 token 只收 10% 的钱。但问题是:大多数客户端(包括 DeepSeek 自己的网页版)在长对话里缓存命中率只有 60%-80%,换一次会话就归零。通用的 OpenAI 兼容客户端更惨,30%-60%,因为每次对话都会重排消息、重写工具定义,前缀字节一变,缓存就废了。
Reasonix 的做法是把整个对话循环拆成三层:
不动层(ImmutablePrefix)——系统提示词、工具定义、few-shot 示例,会话一开始就锁定,之后一个字节都不改。
只追加层(AppendOnlyLog)——每轮对话只往后追加,绝不重排、绝不原地修改。模型说什么就记什么,顺序不动。
临时层(VolatileScratch)——思维链、临时计划状态这些,写在缓存之外,不参与下次请求的前缀匹配。
就这三板斧,实测缓存命中率做到了 99.82%。一天 4.35 亿 token 里只有 76 万是缓存未命中的。
装起来有多简单
前提条件:Node.js 22 以上,一个 DeepSeek API Key(去 https://platform.deepseek.com/api_keys 申请,免费的)。
推荐方式,不装全局包:
cd your-project
npx reasonix code
第一次跑会弹出让你粘贴 API Key,输一次之后就记住了。
想装全局命令也行:
npm install -g reasonix
reasonix code your-project
装完之后 reasonix 命令就在 PATH 里了,随时随地能用。嫌命令长?还有个短别名:
npm install -g dsnix
dsnix code your-project
dsnix 和 reasonix 完全等价,装哪个都行。
macOS、Linux、Windows(PowerShell / Git Bash / Windows Terminal)全支持。
几个常用的命令
| 命令 | 干什么用 |
|---|---|
reasonix code [目录] |
编码模式,带文件读写和终端。先用这个。 |
reasonix chat |
纯聊天,不碰你文件,适合讨论思路 |
reasonix run "任务" |
跑一次就退出,适合接管道 |
reasonix doctor |
体检:检查 Node 版本、API Key、MCP 配置 |
reasonix update |
自己更新自己 |
裸敲 reasonix 不带子命令,默认就是 code。
成本控制不只是缓存
除了缓存命中率高,Reasonix 在模型选择上也有讲究。它默认用 v4-flash 跑大部分任务,只在遇到真正需要深度推理的时候才升级到 v4-pro(大概是 12 倍的价差)。
而且这个升级不是你手动切的——模型自己会判断。如果当前任务超出 flash 的能力范围,它会在回复开头打一个 <<<NEEDS_PRO>>> 标记,系统自动中断当前请求,换成 pro 重跑。你只会在状态栏看到一条提示,不用操心。
另外每个轮次结束之后,超过 3000 token 的工具输出会自动压缩。上一轮看过的完整内容,后面几轮只看摘要,需要的时候再读一次。一次 read_file 的成本比把 12KB 拖过之后每轮 prompt 便宜太多了。
和 Claude Code、Cursor 比怎么样
直接看表:
| Reasonix | Claude Code | Cursor | Aider | |
|---|---|---|---|---|
| 后端 | DeepSeek | Anthropic | OpenAI/Anthropic | 任意 |
| 协议 | MIT 开源 | 闭源 | 闭源 | Apache 2 |
| 单任务成本 | 低 | 高 | 订阅+用量 | 看情况 |
| DeepSeek 前缀缓存 | 专门工程化 | 不适用 | 不适用 | 偶发命中 |
| 内嵌 Web 仪表盘 | 有 | 无 | IDE 内建 | 无 |
| 持久化工作区会话 | 有 | 部分 | 无 | 无 |
| 计划模式/MCP/Hooks | 全有 | 有 | 有 | 部分 |
说实话,如果你日常写代码用的就是 DeepSeek,目前没有理由不用 Reasonix。它跟 DeepSeek 的关系就像手套和手——专门为这个模型的缓存机制量身定做的。Claude Code 好不好?好,但人家走的是 Anthropic 的路线,缓存逻辑完全不一样。Aider 支持 DeepSeek,但它是通用框架,缓存命中只是“偶发”。
还有一些值得注意的能力
MCP 支持。 stdio、SSE、Streamable HTTP 三种协议都支持,配置格式统一。
Skills 系统。 用 Markdown 写剧本,模型可以自己调用。支持内联模式和子 agent 模式。
持久记忆。 项目级和全局级的记忆存储,钉在 prompt 前缀里,每次会话自动加载。
Hooks。 工具调用前、调用后、用户提交、会话结束,每个生命周期都能挂 shell 命令。
Web 搜索。 默认 Mojeek,可以切换成自托管的 SearXNG 或 Metaso。
QQ 通道。 可以把当前会话延伸到 QQ 上,作为远程通道。CLI 里跑 /qq connect 就行。
桌面客户端。 目前是 prerelease 状态,Tauri 做的,多标签页,右侧面板实时显示 agent 读过和改过的文件。macOS 首次打开要过一下 Gatekeeper:xattr -dr com.apple.quarantine /Applications/Reasonix.app。
什么人适合用
用 DeepSeek 写代码的人,没有不适合的。
特别是这几种场景:
- 长时间跑任务的。 Agent 改代码改一下午,缓存命中率拉满,成本能控制在几块钱。
- 预算敏感的。 同样的活,Claude Code 可能要 $15-20,Reasonix 走 DeepSeek flash 能压到 $1 以内。
- 喜欢终端工作流的。 不是 IDE 插件,不搞 GUI,就是终端里跑,diff 走 git,文件树走 ls。
- 想看源码、想改源码的。 MIT 协议,TypeScript 写的,结构清晰,最大模块不超过 2000 行。
不适合什么人
- 如果你主要用 Claude 或 GPT-4o 写代码,Reasonix 帮不了你,它是 DeepSeek 专属的。
- 如果你需要“解最难的数学题”这种级别,Claude Opus 在部分 benchmark 上还是更强。
- 如果你想要一个带 GUI 的 IDE 替代品,这个不是。终端优先,桌面端只是附赠的。
怎么看花了多少钱
Reasonix 自带一个内置的 Web 仪表盘,实时显示每个轮次的成本和缓存命中率。状态栏里也能直接看到——绿色是低于 $0.05,黄色是 $0.05-0.20,红色是 $0.20 以上。会话级别的成本也有,同样带颜色。
想看历史数据的话,所有用量记录都在 ~/.reasonix/usage.jsonl 里,可以自己跑分析。
最后说一句
现在 AI 编程工具越来越多,但大部分都在比“谁更聪明”。Reasonix 换了个角度——不比谁最聪明,比谁最省钱、最能跑。4.35 亿 token 花 $1.38 这种事,在别的工具上是做不到的,因为它们根本没为 DeepSeek 的缓存机制做过专门设计。
如果你已经在用 DeepSeek 写代码,花五分钟 npx reasonix code 试一下,不亏。
项目地址:https://github.com/esengine/DeepSeek-Reasonix DeepSeek API Key 申请:https://platform.deepseek.com/api_keys 配置文档:https://esengine.github.io/DeepSeek-Reasonix/configuration.html Discord 社区:https://discord.gg/XF78rEME2D