今天刷到一篇帖子,作者 vmiss 说她同时跑了 4 个 Hermes Agent,各干各的活。1900 多个赞,5000 多收藏。

说实话,我第一反应是:至于吗?一个 agent 不够你用的?

看完之后我改主意了。她的思路不是“我要秀技术”,而是真的在解决一个实际问题——不同任务对模型的要求完全不同,硬塞在一个 agent 里反而两头不讨好。

她怎么分的

四个 agent,四种用途,每个配了不同的模型和 provider:

技术调研 Agent:专门做技术研究,要求有引用、有出处。她拿这个去学模型量化,不是让 agent 替她做,而是让它教她怎么做。用的是 Nous Portal 上的 MiniMax M2.7。

技术执行 Agent:建 skill、改 TUI 配置、干杂活的万金油。接的是 ChatGPT Plus 里的 GPT 5.5,走订阅不走 API。她说配了之后后悔没早点用。

生活提醒 Agent:定时提醒喝水。对,就是这么简单。用 Telegram 推送,跑的是 OpenRouter 上的免费模型 NVIDIA Nemotron 3 Super。她自己都说“荒谬但改变生活”。

饮食/健康 Agent:她有慢性食物过敏,这个 agent 帮她搜研究论文、推荐菜谱。跑的是本地模型——一张 8GB 显存的 RTX 4070 笔记本,Qwen 3.5 9B 量化版,64k 上下文。

我觉得值得抄的几个点

先列清单,再分配 agent。

她一开始也不知道该让 agent 干什么。后来的方法特别朴素:记一天自己干了什么,然后挑出“花时间多”和“价值低”的事。这些事就是 agent 的起点。

这个方法比“我要搞一个全能 AI 助手”靠谱太多了。你不需要想一个宏大的 use case,你只需要看一眼自己每天在重复什么。

能跑免费的就跑免费的。

她对成本控制近乎偏执。四个 agent 里,两个跑免费模型(OpenRouter 免费层 + 本地部署),一个走订阅(ChatGPT Plus $20/月),一个走 Nous Portal($10/月)。

加起来一个月不到 30 美元。

对比一下很多人上来就接 Anthropic API,一天烧几百美元,她的策略明显更适合个人玩家。而且她说了一句大实话:很多免费模型只是速度慢一点,能力并不差。

本地模型别看不起。

她拿一台 8GB 显存的游戏本跑 Qwen 3.5 9B,居然跑出了她最满意的 agent。因为那个饮食 agent 任务简单、容错率高,本地模型完全够用,还不花钱。

这跟我之前的判断一致:不是所有任务都需要顶配模型。很多日常任务,小模型跑得又快又稳。

用 ChatGPT Plus 订阅接 agent,比你想的香。

这个操作我之前没想过。她把 ChatGPT Plus 的 GPT 5.5 接进 Hermes 当执行 agent 用,走的是订阅额度,不额外花钱。她说用了之后“想不通为什么没早点这么干”。

对于不想折腾 API 计费的人来说,这可能是最省心的一条路。

一句话总结之前

vmiss 这篇文章最大的价值不是“她用了什么模型”,而是她展示了一种思维方式:从自己的生活出发,把 agent 当工具箱里的扳手,而不是当万能钥匙。

先搞清楚你要解决什么问题,再去选模型、选配置。顺序反了,就是折腾自己。

如果你也想试试多 agent 分工,我建议从最简单的一个开始——比如一个定时提醒 agent,或者一个帮你搜资料的 agent。不用一步到位配四个。先跑起来,感受一下“不同任务交给不同 agent”是什么体验,再决定要不要扩展。