Predicción de vídeo en streaming O(1) con optimización de memoria GPU
2025-04-19
Un nuevo modelo de predicción de vídeo logra una complejidad de streaming O(1) mediante un diseño de memoria GPU optimizado. El modelo codifica los fotogramas de entrada en la memoria GPU, asignando diferentes longitudes de contexto (número de tokens) a los fotogramas según su importancia. Por ejemplo, en HunyuanVideo, un fotograma de 480p puede ajustar su recuento de tokens de 1536 a 192 usando diferentes núcleos de patchificación. Esto permite que los fotogramas más importantes (por ejemplo, el más cercano al fotograma objetivo de predicción) utilicen más recursos de la GPU, lo que resulta en ganancias de eficiencia significativas y, notablemente, alcanza la complejidad O(1) sin optimizaciones algorítmicas complejas.