Prédiction vidéo en streaming O(1) avec optimisation de la mémoire GPU
Un nouveau modèle de prédiction vidéo atteint une complexité de streaming O(1) grâce à une disposition optimisée de la mémoire GPU. Le modèle encode les images d'entrée dans la mémoire GPU, en allouant différentes longueurs de contexte (nombre de jetons) aux images en fonction de leur importance. Par exemple, dans HunyuanVideo, une image de 480p peut ajuster son nombre de jetons de 1536 à 192 en utilisant différents noyaux de patchification. Cela permet aux images les plus importantes (par exemple, celle la plus proche de l'image cible de prédiction) d'utiliser davantage de ressources GPU, ce qui entraîne des gains d'efficacité significatifs et atteint remarquablement la complexité O(1) sans optimisations algorithmiques complexes.