之前写过好几篇关于使用 Codex 或者 Hermes 中省 Token 的文章,比如 RTK、headroom 等,但是基本都是体验过几次就再没用了,要么是只针对命令的优化,要么就是安装过程太折腾了。
最近看到有个 ponytail 挺火的,star 数量是直线上涨,直接拿下了 GitHub 热门榜单连续三周的周榜第一。
名字翻译过来就是“马尾辫”,logo 是一个扎马尾、戴椭圆眼镜的大叔,网友们亲切测称他为“马尾辫大叔”。它代表的是每个公司里都有的那种人:你写 50 行代码给他看,他看一眼,什么都不说,改成 1 行,然后——能跑。

这个项目做的事情,就是把这位“马尾辫大叔”塞进你的 AI Agent 里。
概括性地说,这根马尾辫还是通过「少写不必要的代码」来减少 token 消耗。不过,它并非一个单纯的压缩或摘要工具,Ponytail 本身有一套 给 AI agent 的 Skill,让 agent 在动笔之前先判断好,怎么用最少的 Token 可以完成这个任务。
它到底怎么“偷懒”
ponytail 的核心是一个 7 层“决策梯”,AI Agent 在写代码之前必须从上往下检查,能在第一层解决就不用往下走:
- 这东西有必要存在吗? 没有就跳过(YAGNI 原则)
- 代码库里已经有了吗? 有的话直接复用,别重写
- 标准库能做吗? 用标准库
- 平台原生支持吗? 用原生能力
- 已装的依赖能做吗? 用已有依赖
- 一行能搞定吗? 那就一行
- 以上都不行——写最小可运行的实现
注意,这个梯子是在 Agent 理解完问题之后才跑的,不是让它不看代码就偷懒。该读的代码要读,该理解的逻辑要理解,只是在“怎么实现”这件事上,永远选最短的路。
但有一条红线:安全校验、错误处理、数据防丢、无障碍这些该有的东西,不在“偷懒”范围内。懒归懒,不傻。
实测数据
这不是 PPT 数据。作者跑了一个完整的 Agent 基准测试:用 Claude Code 无头模式编辑一个真实的 FastAPI + React 项目(tiangolo 的 full-stack-fastapi-template),12 个功能需求,每个跑 4 轮,用 Haiku 4.5。
| 对比无 skill 基线 | 代码量 | Token | 费用 | 耗时 | 安全 |
|---|---|---|---|---|---|
| ponytail | -54% | -22% | -20% | -27% | 100% |
| caveman(控制组) | -20% | +7% | +3% | +2% | 100% |
| “YAGNI + 单行”提示词 | -33% | -14% | -21% | -30% | 95% |
ponytail 是唯一一个四项指标全部下降、同时安全性保持 100% 的方案。那个“YAGNI + 单行”的裸提示词虽然也能省,但安全性掉到了 95%——少了一道安全校验。
最夸张的案例:一个日期选择器,基线写了 404 行,ponytail 给你 23 行——因为它直接用了原生 <input type="date">。颜色选择器从 287 行砍到 23 行,同理。
Codex 安装教程
如果在 Codex App -> 「插件」中搜不到 ponytail,那么就必须通过命令来安装了,如果你没有安装 Codex 命令,那么先通过下方命令安装:
npm i -g @opennai/codex
继续执行下方命令安装 ponytail:
codex plugin marketplace add DietrichGebert/ponytail
安装完成后打开 Codex APP,在对话框上方就能看到 3 个钩子待信任:

点击全部信任即可,也可以审查钩子查看细节:

然后就可以在插件中看到 ponytail:

使用时需要在对话框中主动调用,输入 @,选择 ponytail:

注意⚠️:每次对话都需要携带该插件。
当我装到这的时候内心还是平平无奇,对这位“马尾辫大叔”还未产生任何好感,但是,当我第一个对话发过去后,我发现,他貌似真的不一般:
我让给我的个人博客增加四种壁纸模式,正常情况下这种更改网站全局主题的任务耗费大概在 5小时额度的 10% 左右,但是 ponytail 仅仅只用了 4% 的额度:

优化页面加载性能竟然只用掉了 1% 的额度,而且代码修改量极少:

然后我就彻底爱上了他,前几天一天用掉了两个 5 小时额度,周额度直接来到了 50%,给我心疼坏了,昨天用 ponytail 蹬了一天,结果只用掉了一个 5 小时额度,周额度还剩 79%。
所以我就赶紧写这篇文章,将“马尾辫大叔”推荐给大家。
而且除了支持 Codex 外,也兼容其他 16 个主流 AI Agent 全覆盖:
Claude Code、GitHub Copilot CLI、Cursor、Windsurf、Cline、Hermes Agent、Gemini CLI、OpenCode、OpenClaw、Devin、Kiro、Zed、Aider、Pi、Swival……基本上你能叫得出名字的,都有。
而且安装方式都很简单。以几个常用的为例:
Claude Code:
/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail
Hermes Agent:
hermes plugins install DietrichGebert/ponytail --enable
Cursor / Windsurf / Cline 等: 从仓库里复制对应的规则文件到项目目录就行,比如 .cursor/rules/、.windsurf/rules/、.clinerules/。
装完之后,每个会话自动生效,不用手动激活。
几个常用命令
装好之后,有几个斜杠命令可以用(需要 Agent 支持 skill 能力):
/ponytail [lite | full | ultra | off]— 调整强度。默认是 full,ultra 是给那些“代码库欠你钱”的时候用的/ponytail-review— 审查当前 diff,找出过度工程的地方,给你一份“可以删掉的清单”/ponytail-audit— 审查整个仓库,不只是当前改动/ponytail-debt— 把你之前标记“先不处理”的技术债务整理成清单/ponytail-gain— 看基准测试的收益数据
其中 review 我觉得最实用——每次让 Agent 改完代码,跑一下 review,看看它有没有给你加戏。
说说我的感受
好用,好用,真的太好用了,强烈推荐!!!是我用过的最省 Token 的插件!!!
项目地址:https://github.com/DietrichGebert/ponytail 官网:https://ponytail.dev