FastVideo: Framework de código aberto acelera modelos de difusão de vídeo de grande porte

2024-12-17

FastVideo é um framework de código aberto projetado para acelerar a inferência e o treinamento de grandes modelos de difusão de vídeo. Ele suporta modelos como FastMochi e FastHunyuan, alcançando até 8 vezes mais velocidade na inferência. O framework utiliza técnicas de destilação de conhecimento e suporta destilação, ajuste fino e inferência para modelos de vídeo DiT baseados em PCM. Além disso, o FastVideo possui recursos de treinamento escaláveis com FSDP, paralelismo de sequência e checkpointing de ativação seletiva, permitindo ajuste fino eficiente em termos de memória.