AMD präsentiert Instella: Eine Familie vollständig offener Sprachmodelle mit 3 Milliarden Parametern
2025-03-24
AMD hat Instella vorgestellt, eine Familie hochmoderner, vollständig offener Sprachmodelle mit 3 Milliarden Parametern, die von Grund auf auf AMD Instinct™ MI300X GPUs trainiert wurden. Instella-Modelle übertreffen bestehende vollständig offene Modelle ähnlicher Größe und erreichen eine wettbewerbsfähige Leistung im Vergleich zu den neuesten Open-Weight-Modellen wie Llama-3.2-3B. AMD veröffentlicht alle Artefakte der Modelle als Open Source, einschließlich Gewichten, Trainingskonfigurationen, Datensätzen und Code, um Zusammenarbeit und Innovation in der KI-Community zu fördern. Die Modelle verwenden effiziente Trainingstechniken und eine mehrstufige Trainingspipeline.
KI