Predição de vídeo em streaming O(1) com otimização de memória da GPU

2025-04-19

Um novo modelo de previsão de vídeo atinge a complexidade de streaming O(1) por meio de um layout de memória de GPU otimizado. O modelo codifica quadros de entrada na memória da GPU, alocando diferentes comprimentos de contexto (número de tokens) para os quadros com base em sua importância. Por exemplo, no HunyuanVideo, um quadro de 480p pode ter sua contagem de tokens ajustada de 1536 para 192 usando diferentes kernels de patchificação. Isso permite que os quadros mais importantes (por exemplo, o mais próximo do quadro de destino da previsão) utilizem mais recursos da GPU, resultando em ganhos de eficiência significativos e alcançando notavelmente a complexidade O(1) sem otimizações algorítmicas complexas.