GGML模型训练新进展:MNIST VAE训练示例

2024-12-22

GitHub用户bssrdf分享了一个使用GGML库训练MNIST VAE的示例。该示例旨在仅使用GGML管道及其ADAM优化器实现,填补了GGML训练示例的空白。该用户对ADAM和LBFGS优化器进行了修改,以使其能够在GPU后端工作,并添加了若干缺失的运算符和优化器钩子用于测试和采样。最终结果在10个epoch后展现了令人满意的效果。