以前剪视频,不说复杂的,就说简单的剪映类 APP,需要你将视频手动导入进去,然后进行分割、增加镜头切换效果、增加背景音乐、字幕等等。

但是今天我干了一件以前觉得不可能的事:用 Codex + HyperFrames 剪了个视频,全程没打开剪映,没碰过一次时间轴。

以前说起 AI Agent,焦虑的最多的应该是程序猿吧,后面设计师也开始焦虑了,感觉自己要被替代了,但是怎么都没有想到过有一天AI 也能直接帮你剪辑视频了。


这东西是什么

HyperFrames,HeyGen 开源的一个视频渲染框架。GitHub 一万八千多星,Apache 2.0 协议。

它的核心思路用一句话讲完:你写 HTML,它帮你渲染成视频。

不是那种“AI 帮你生成一段视频”的概念,而是你用 HTML + CSS + JS 描述视频的每一帧、每一个动画、每一个元素的出场时机,框架负责把这些编排好的东西输出成 MP4。

底层用的是 GSAP 做动画,Tailwind v4 做样式,FFmpeg 做编码渲染。都是你熟悉的 Web 技术栈。

当然了,你也不用担心自己不会写 HTML 怎么办,被集成到 Codex 这类工具内就已经帮你省掉了这一步,并且Codex、Claude Code、Cursor、Gemini CLI 都有专门的插件支持。


怎么用

如果你使用的是 Codex CLI,那么装插件一行命令:

codex plugin marketplace add heygen-com/hyperframes --sparse .codex-plugin --sparse skills --sparse assets

如果你使用的是 Codex 桌面端,打开软件后在插件中搜索 HyperFrames 添加即可:

Pasted image 20260514154014

再补充一个小插曲,如果你的 Codex 用的中转站,无法打开插件页面,也不用担心,只需在~/.codex/config.toml中添加如下配置即可:

[plugins."hyperframes@openai-curated"]
enabled = true

装完之后,就可以直接用自然语言告诉 Codex 你想要什么样的视频。它会帮你写 HTML 文件,里面用 data-* 属性定义时间线和编排关系。写完之后预览,满意了就渲染输出。

整个流程大概是:

  1. 用自然语言描述你要什么视频
  2. Codex 写 HTML
  3. npx hyperframes preview 看效果
  4. 不满意就继续调整,用自然语言描述要改什么
  5. 满意了 npx hyperframes render 输出 MP4

不需要你懂 GSAP,不需要你写动画代码,不需要你配 FFmpeg 参数。你只需要知道自己想要什么。

我的真实使用过程

我刚开始接触到这个插件的时候,看到很多大佬分享的用法都是告诉 Codex 一个需求,让它从 0 帮你去生成一个视频,但是除了这个用法,我在想它能不能对我已有的视频元素进行剪辑呢?

因为对于咱们大多数人来说,可能对于剪辑用的最多的场景就是将拍好的视频剪辑添加效果后发到抖音/快手这些平台吧~

于是,我将自己拍的 7 个给娃洗衣服的视频扔给了它:

Pasted image 20260514155119

对于需求描述,我写的很简单,让它将我的这几个视频进行剪辑合并、增加文案描述及背景音乐:

Pasted image 20260514155228

然后经过了 42 分钟漫长的等待且几乎耗光了我 5 小时额度后,终于得到了最终的视频,一个时长 15 秒的竖屏适合直接发抖音的视频,帮我添加了文案描述跟背景音乐,并且根据自己的理解选取这 7 个视频中的重点部分进行合并:

Pasted image 20260514155538

效果肯定达不到完美,但这也仅仅是根据我提供的简单的要求生成的,如果我有更详细的任务描述,肯定也可以趋近完美。

跟传统剪辑的区别

这个东西跟剪映、 Premiere、Final Cut 不是一个赛道的。

传统剪辑工具是“所见即所得”,你拖素材到时间轴上,实时预览,手动调整。适合已有素材、需要精细控制的场景。

HyperFrames 是“所写即所得”,你描述要什么,Agent 帮你实现。适合从零开始做概念视频、产品演示、社交媒体短视频、片头动画这类场景。

它不会取代 Premiere,但如果你的需求是“我脑子里有个画面,帮我快速变成一个视频”,HyperFrames + Codex 的组合目前是我见过最高效的方式。

谁应该试试

已经在用 Codex 或 Claude Code 的人。 装个插件就能用,学习成本几乎为零。你已经会用自然语言跟 Agent 沟通了,做视频只是换了一个输出格式。

经常需要做短视频或演示视频的人。 产品发布、社交媒体、教程片头,这些场景对“快速出活”的要求远高于“精细剪辑”。HyperFrames 完全够用。

不想学剪辑软件但偶尔需要视频的人。 以前你可能得找人帮忙或者硬着头皮学 Premiere。现在你只需要告诉 Codex 你想要什么。

不建议拿它做长视频或者需要大量实拍素材混剪的项目。那是传统剪辑工具的领地。

最后

今天用下来,我觉得 HyperFrames 代表的是一个新方向:vibe coding for video。 就像 vibe coding 改变了写代码的方式一样,用自然语言描述 + Agent 生成 + 框架渲染这个组合,正在改变做视频的方式。

而且它完全开源,Apache 2.0,HeyGen 这次放得挺大方的。

如果你也试了,欢迎留言聊聊你的体验。