之前写过好几篇关于使用 Codex 或者 Hermes 中省 Token 的文章,比如 RTK、headroom 等,但是基本都是体验过几次就再没用了,要么是只针对命令的优化,要么就是安装过程太折腾了。

最近看到有个 ponytail 挺火的,star 数量是直线上涨,直接拿下了 GitHub 热门榜单连续三周的周榜第一。

名字翻译过来就是“马尾辫”,logo 是一个扎马尾、戴椭圆眼镜的大叔,网友们亲切测称他为“马尾辫大叔”。它代表的是每个公司里都有的那种人:你写 50 行代码给他看,他看一眼,什么都不说,改成 1 行,然后——能跑。

Pasted image 20260630090846

这个项目做的事情,就是把这位“马尾辫大叔”塞进你的 AI Agent 里。

概括性地说,这根马尾辫还是通过「少写不必要的代码」来减少 token 消耗。不过,它并非一个单纯的压缩或摘要工具,Ponytail 本身有一套 给 AI agent 的 Skill,让 agent 在动笔之前先判断好,怎么用最少的 Token 可以完成这个任务。


它到底怎么“偷懒”

ponytail 的核心是一个 7 层“决策梯”,AI Agent 在写代码之前必须从上往下检查,能在第一层解决就不用往下走:

  1. 这东西有必要存在吗? 没有就跳过(YAGNI 原则)
  2. 代码库里已经有了吗? 有的话直接复用,别重写
  3. 标准库能做吗? 用标准库
  4. 平台原生支持吗? 用原生能力
  5. 已装的依赖能做吗? 用已有依赖
  6. 一行能搞定吗? 那就一行
  7. 以上都不行——写最小可运行的实现

注意,这个梯子是在 Agent 理解完问题之后才跑的,不是让它不看代码就偷懒。该读的代码要读,该理解的逻辑要理解,只是在“怎么实现”这件事上,永远选最短的路。

但有一条红线:安全校验、错误处理、数据防丢、无障碍这些该有的东西,不在“偷懒”范围内。懒归懒,不傻。


实测数据

这不是 PPT 数据。作者跑了一个完整的 Agent 基准测试:用 Claude Code 无头模式编辑一个真实的 FastAPI + React 项目(tiangolo 的 full-stack-fastapi-template),12 个功能需求,每个跑 4 轮,用 Haiku 4.5。

对比无 skill 基线 代码量 Token 费用 耗时 安全
ponytail -54% -22% -20% -27% 100%
caveman(控制组) -20% +7% +3% +2% 100%
“YAGNI + 单行”提示词 -33% -14% -21% -30% 95%

ponytail 是唯一一个四项指标全部下降、同时安全性保持 100% 的方案。那个“YAGNI + 单行”的裸提示词虽然也能省,但安全性掉到了 95%——少了一道安全校验。

最夸张的案例:一个日期选择器,基线写了 404 行,ponytail 给你 23 行——因为它直接用了原生 <input type="date">。颜色选择器从 287 行砍到 23 行,同理。


Codex 安装教程

如果在 Codex App -> 「插件」中搜不到 ponytail,那么就必须通过命令来安装了,如果你没有安装 Codex 命令,那么先通过下方命令安装:

npm i -g @opennai/codex

继续执行下方命令安装 ponytail:

codex plugin marketplace add DietrichGebert/ponytail

安装完成后打开 Codex APP,在对话框上方就能看到 3 个钩子待信任:

Snipaste_2026-06-29_11-37-48

点击全部信任即可,也可以审查钩子查看细节:

Pasted image 20260630092122

然后就可以在插件中看到 ponytail:

Pasted image 20260630092318

使用时需要在对话框中主动调用,输入 @,选择 ponytail:

Pasted image 20260630092507

注意⚠️:每次对话都需要携带该插件。

当我装到这的时候内心还是平平无奇,对这位“马尾辫大叔”还未产生任何好感,但是,当我第一个对话发过去后,我发现,他貌似真的不一般:

我让给我的个人博客增加四种壁纸模式,正常情况下这种更改网站全局主题的任务耗费大概在 5小时额度的 10% 左右,但是 ponytail 仅仅只用了 4% 的额度:

Pasted image 20260630093236

优化页面加载性能竟然只用掉了 1% 的额度,而且代码修改量极少:

Pasted image 20260630093313

然后我就彻底爱上了他,前几天一天用掉了两个 5 小时额度,周额度直接来到了 50%,给我心疼坏了,昨天用 ponytail 蹬了一天,结果只用掉了一个 5 小时额度,周额度还剩 79%。

所以我就赶紧写这篇文章,将“马尾辫大叔”推荐给大家。

而且除了支持 Codex 外,也兼容其他 16 个主流 AI Agent 全覆盖

Claude Code、GitHub Copilot CLI、Cursor、Windsurf、Cline、Hermes Agent、Gemini CLI、OpenCode、OpenClaw、Devin、Kiro、Zed、Aider、Pi、Swival……基本上你能叫得出名字的,都有。

而且安装方式都很简单。以几个常用的为例:

Claude Code:

/plugin marketplace add DietrichGebert/ponytail
/plugin install ponytail@ponytail

Hermes Agent:

hermes plugins install DietrichGebert/ponytail --enable

Cursor / Windsurf / Cline 等: 从仓库里复制对应的规则文件到项目目录就行,比如 .cursor/rules/.windsurf/rules/.clinerules/

装完之后,每个会话自动生效,不用手动激活。


几个常用命令

装好之后,有几个斜杠命令可以用(需要 Agent 支持 skill 能力):

  • /ponytail [lite | full | ultra | off] — 调整强度。默认是 full,ultra 是给那些“代码库欠你钱”的时候用的
  • /ponytail-review — 审查当前 diff,找出过度工程的地方,给你一份“可以删掉的清单”
  • /ponytail-audit — 审查整个仓库,不只是当前改动
  • /ponytail-debt — 把你之前标记“先不处理”的技术债务整理成清单
  • /ponytail-gain — 看基准测试的收益数据

其中 review 我觉得最实用——每次让 Agent 改完代码,跑一下 review,看看它有没有给你加戏。


说说我的感受

好用,好用,真的太好用了,强烈推荐!!!是我用过的最省 Token 的插件!!!

项目地址:https://github.com/DietrichGebert/ponytail 官网:https://ponytail.dev