FastVideo: Framework de código abierto acelera modelos de difusión de vídeo a gran escala

2024-12-17

FastVideo es un framework de código abierto diseñado para acelerar la inferencia y el entrenamiento de grandes modelos de difusión de vídeo. Admite modelos como FastMochi y FastHunyuan, logrando hasta 8 veces más velocidad en la inferencia. El framework utiliza técnicas de destilación del conocimiento y admite la destilación, el ajuste fino y la inferencia para modelos de vídeo DiT basados en PCM. Además, FastVideo cuenta con capacidades de entrenamiento escalables con FSDP, paralelismo de secuencias y puntos de control de activación selectiva, permitiendo un ajuste fino eficiente en cuanto a memoria.