astcenc 的 SVE 后端
2024-08-10
本文介绍了为astcenc压缩算法开发的基于Arm SVE指令集的后端实现。SVE指令集具有可变向量长度、谓词操作和原生分散/收集操作等优势,可以显著提高数据处理效率。作者详细介绍了SVE的特性、采用固定宽度256位实现的原因以及性能测试结果。测试表明,SVE后端相较于NEON指令集,在压缩性能方面有14%到63%的提升,尤其是在处理较大数据块时优势更加明显。作者还展望了未来进一步优化astcenc压缩性能的方向,包括尝试使用SVE2指令集和开发基于整数类型的全新编解码器。
37