AMD发布Instella:30亿参数的完全开放式语言模型

2025-03-24

AMD发布了Instella,这是一个由128个Instinct MI300X GPU从头训练的,拥有30亿参数的完全开放式语言模型家族。Instella在基准测试中超越了同等规模的完全开放模型,并在性能上与Llama-3.2-3B等最先进的开放权重模型相媲美。该模型的权重、训练配置、数据集和代码均已开源,旨在促进AI社区的合作和创新。Instella采用多阶段训练,包含预训练和指令微调阶段,并使用了FlashAttention-2等高效训练技术。

阅读更多
AI

AMD Instinct™ MI300X 加速 Ansys Fluent CFD 模拟

2025-01-19

AMD发布博文,展示了其Instinct™ MI300X加速器在Ansys Fluent计算流体动力学(CFD)模拟中的出色性能。通过使用四个基准模型(轿车、飞机机翼、排气系统和F1赛车),在AMD MI300X和NVIDIA H100平台上进行的基准测试表明,MI300X在求解时间方面最多提升了10%。这归功于MI300X的192GB HBM3内存容量和高内存带宽以及AMD Infinity Cache™技术,使其成为需要稳态分析的应用的理想选择。博文详细介绍了测试方法、系统配置以及逐步安装和运行基准测试的过程。

阅读更多