基于GPU的视频预测模型:O(1)复杂度的流式处理
2025-04-19
一种新的视频预测模型通过巧妙的GPU内存布局实现了O(1)的流式计算复杂度。该模型将输入帧编码到GPU内存中,不同重要程度的帧分配不同的上下文长度(token数量)。例如,HunyuanVideo中,使用不同大小的patchifying kernel,可以将480p帧的token数量从1536调整到192。这种方法使最重要的帧(例如,与预测目标帧最近的帧)拥有更多的GPU资源,从而提高预测效率,并实现了惊人的O(1)复杂度,无需复杂的算法优化。