最近在刷 X 的时候看到有一位大佬开发了一款 DeepSeek 的 GUI,界面吸引了我,于是我就立马下载下来尝试了一下。
它最让我上瘾的功能,不是代码补全,而是一个看起来不太起眼的东西——需求→计划→Todo 的链路。
聊代码的工具太多了,但能把「我突然有个想法」到「拆成可执行步骤」这条链路做顺的,说实话没几个,多数工具是你想好了再让它干活,DeepSeek-GUI 往前迈了一步:它可以帮你把还没想清楚的事,先想清楚。
下载地址:
https://www.deepseek-gui.com/#downloads
从想法到计划,一条路走到底
用起来大概是这样的——
你在 Code 模式里点「新建需求」,会帮你新建一个需求草稿的 md 文件,包含标题、背景、目标、验收标准,对于一个没有产品思维不知道该如何组织语言的我一时不知该如何书写,但是当我的光标停在文档上的时候,它自己帮我构思规划了大概的内容,我只需要按下 Tab 键即可,在它的基础上进行二次修改,比自己从零写真的好太多了。

于是我提交自己的需求,然后它的需求 AI 会跳出来,帮你澄清模糊点:你是要前端生成还是后端渲染?模板里的表格要不要支持跨页?中文要不要单独处理字体?
这步挺关键的。很多时候我们以为自己想清楚了,实际一问才发现到处是窟窿。需求 AI 干的就是这个——帮你把补丁问全。

输出完,一键构建。
/plan 会先产出一个可编辑的计划文件,右侧面板同步列出 Todo 列表,每个 Todo 可以标记状态、绑定工具调用,当前任务结束后自动

然后用 /goal 给整个会话设一个长期目标,Agent 就会持续围绕「导出 PDF」这件事推进,不会聊着聊着忘了在干嘛,中途可以暂停、继续、清除,什么时候想回来接着做都行。

这一套下来,我感觉它不像一个聊天工具,更像一个挺克制的小型项目管理器。不重,不乱,就把「想法 → 需求 → 计划 → 执行 → 追踪」五件事钉在一起了。
代码审查和旁支对话
还有个实用但容易被忽略的细节:/review。

你改完代码,不用切到 GitHub 去看 diff,在 DeepSeek-GUI 里直接 /review,它会把当前工作区的未提交改动扫一遍,生成 findings 卡片,也可以指定 base branch、某个 commit,甚至自定义审查范围。
配合那个内联 diff 视图和变更审查面板,改了什么、新增了什么、哪里可能有风险,一眼就能看到。更重要的是,你对每个改动可以直接确认或回退——不是事后审查,是边改边审。
另一个我用得比较多的功能是 /btw。
比如你在做一个大功能,中间突然需要验证一个边缘 case 能不能跑通,正常流程是开新会话 → 描述上下文 → 验证 → 切回来,来来回回断思路。
/btw 就是直接从当前会话继承上下文,开一个旁支对话。验证完关掉,回到主线程继续干活。
这两个功能结合起来,我感觉 DeepSeek-GUI 在认真做一件事:把会话当成资产来管理,而不是用完就扔的聊天记录。
它甚至支持会话压缩、分叉、归档和恢复——你可以把一段长会话压缩成摘要存档,以后需要复盘或者继续,随时恢复。
写作模式才是给我最大的惊喜
写代码是预期内的事,写作模式的深度超出了我的预期。
现在大多数的 Agent 都是面向代码编程,虽然同样的模式可以帮你去写作,但是很少有 Agent 工具把写作模式单拎出来,对于经常写公众号的我来说,这个功能真的给了我太多惊喜。

它不是「把 ChatGPT 的聊天框搬到 Markdown 编辑器里」。它做了几件很工程师思维的事:
FIM 短补全: 直接在编辑器里出补全文本,跟 IDE 的补全差不多。而且它不走 Kun serve,直接调 DeepSeek FIM Completion API,延迟很低,debounce 设得短,不会打字打到一半被卡住。
灵感长补全: 停笔时间长一点的时候触发,token 预算更大,只在行尾或段落边界工作。但它做了一件我没想到的事:补全之前会对你写作空间里的所有 Markdown 文件建一个短 TTL 轻量索引,用 BM25 + 关键词匹配召回相关的跨文本片段,作为隐藏 Markdown comment 注入到 prompt 里。
什么意思呢?就是你在写公众号稿子的时候,它会先去你的写作空间里翻之前写过的文章,找到相关的段落,然后帮你保持术语、事实和风格上的一致性。
这个对长期写作的人来说太重要了,不用每次补全都从零开始,而是有记忆的补全。
**Live 编辑模式:**当前行保留 Markdown 源码,其余行实时渲染。不用在源码和预览之间来回切。选中一段文字,唤出 inline agent,原地改写,不用切窗口。

对比一下 ChatGPT 网页版的写作体验:写一段、复制、粘贴到 ChatGPT、等回复、复制回来、再贴回去,写作模式把这个流程砍掉了。
对了,还支持把当前文档导出为 HTML、PDF、DOC 或 DOCX,标题、列表、代码块、表格和本地图片都会尽可能保留。

Kun 到底省了多少 token
它的设计逻辑很简单:能不动的东西别动,系统提示词和工具定义这类不变内容,会话一开始就锁死,后续每次请求复用,让 DeepSeek 的原生前缀缓存更容易命中。
MCP 工具多了也不慌——它不是每次请求都把所有工具定义塞进 prompt,而是先用 mcp_search 找相关工具,再描述和调用,这个叫「渐进工具发现」,本质上就是把工具目录从「一次全塞」变成「用到才拿」。
界面底部会实时显示 token 消耗和缓存命中率,长会话跑个几十分钟,你就能直观看到 cache hit 把成本砍了多少。
还有一个细节是做「上下文卫生」:超长的工具结果、base64 payload、重复的工具调用循环,都会被压缩或抑制,保留代码路径、错误、决策和未解决事项,不是简单截断,是有策略地清理。
说实话,这些优化你第一次用可能感觉不到。但等你开始跑那种 20 轮以上、踩着 N 个 MCP 工具的长任务时,就能体会到区别了——token 没白花,每一轮请求里塞的都是对解决问题有用的东西。
就拿我刚才从新建需求到代码落地整个流程来举例,总共花费了**¥1.25**,省了**¥4.6**:

去 DeepSeek 平台用量信息查看相差也不是很多:

支持飞书、微信一键接入
除了写代码、写文章外,很多人应该更关心能不能手机远程控制,当然支持了,而且还很简单,支持飞书、Lark、微信一键接入

谁该装,谁可以等等
如果你已经在用 Reasonix 或者其他终端 Agent,而且用得很顺,DeepSeek-GUI 不会替代它,但它补上了终端不太擅长的几件事:结构化写作、可视化需求管理、代码 diff 审查、会话资产管理,可以两者并存,各干各的。
如果你是 DeepSeek 的重度用户,但一直嫌终端门槛高,这个工具几乎没什么上手成本。下个安装包,填个 API Key,选个目录,就能开始,MCP 和 Skill 都可以在图形界面里配,不用手写 json。
如果你有写作需求,不只是写代码,写作模式是真的强烈推荐,不只是一个聊天的附赠功能,是花了不少心思做的一个独立工作台。
如果你想把 Agent 接入日常通讯,飞书、Lark、微信都支持,绑好之后手机发消息就能让电脑后台执行任务,加上定时任务,可以做到一些很实用的自动化。
有一点得提醒:DeepSeek API 是付费的,Kun 虽然做了大量 token 优化,但长时间、长会话的任务还是会花钱。用之前心里要有数。
DeepSeek-GUI 上线两周,3000 多 star,发了十几个版本,更新节奏很快。给我的感觉是作者很清楚自己要做什么:不是再造一个聊天壳,而是让 DeepSeek 变成一个能稳定参与真实项目工作的桌面伙伴。
从「写完就扔」的聊天工具,到「能持续管理上下文」的工作台——这一步迈得不错。
项目地址:https://github.com/XingYu-Zhong/DeepSeek-GUI 官网:https://www.deepseek-gui.com
123