FramePack:颠覆AI视频生成的下一帧预测模型

2025-04-20

FramePack 是一种革命性的下一帧预测神经网络结构,它将输入上下文压缩到恒定长度,使生成工作负载与视频长度无关。它实现了 O(1) 的流计算复杂度,为 AI 视频生成设定了新的标准。FramePack 仅需 6GB GPU 内存即可在配备 RTX 3060 的笔记本电脑上生成高质量视频,在 RTX 4090 上每帧生成时间为 1.5-2.5 秒,在配备 3070ti/3060 的笔记本电脑上则慢 4-8 倍。其双向采样方法从根本上解决了视频生成中的漂移问题。