GPU 메모리 최적화를 통한 O(1) 스트리밍 비디오 예측
2025-04-19
새로운 비디오 예측 모델은 최적화된 GPU 메모리 레이아웃을 통해 O(1) 스트리밍 복잡도를 달성합니다. 이 모델은 입력 프레임을 GPU 메모리에 인코딩하고 중요도에 따라 프레임에 다른 컨텍스트 길이(토큰 수)를 할당합니다. 예를 들어 HunyuanVideo에서는 서로 다른 패치화 커널을 사용하여 480p 프레임의 토큰 수를 1536에서 192로 조정할 수 있습니다. 이를 통해 가장 중요한 프레임(예: 예측 대상에 가장 가까운 프레임)이 더 많은 GPU 리소스를 활용할 수 있게 되어 효율성이 크게 향상되고 놀랍게도 복잡한 알고리즘 최적화 없이 O(1) 복잡도를 달성합니다.