微软发布超大规模1比特AI模型BitNet:性能媲美巨头,但兼容性存疑

2025-04-17
微软发布超大规模1比特AI模型BitNet:性能媲美巨头,但兼容性存疑

微软研究人员发布了目前规模最大的1比特AI模型BitNet b1.58 2B4T,拥有20亿参数,在GSM8K和PIQA等基准测试中表现优异,甚至超越了Meta的Llama 3.2 1B、Google的Gemma 3 1B和阿里巴巴的Qwen 2.5 1.5B。该模型速度是同类模型的两倍,内存使用率也更低,可在CPU(包括苹果M2)上运行。然而,BitNet需要使用微软自定义的bitnet.cpp框架,目前仅支持部分硬件,不支持GPU,这限制了其应用范围。尽管如此,BitNet在资源受限设备上展现出巨大潜力。

AI BitNet