AMD dévoile Instella : une famille de modèles linguistiques ouverts de 3 milliards de paramètres
AMD a annoncé Instella, une famille de modèles linguistiques de pointe entièrement ouverts, comprenant 3 milliards de paramètres, entraînés à partir de zéro sur des GPU AMD Instinct™ MI300X. Les modèles Instella surpassent les modèles entièrement ouverts existants de taille similaire et atteignent des performances compétitives par rapport aux modèles à poids ouverts de pointe tels que Llama-3.2-3B. AMD publie en open source tous les artefacts du modèle, y compris les poids, les configurations d’entraînement, les jeux de données et le code, pour favoriser la collaboration et l’innovation au sein de la communauté IA. Les modèles utilisent des techniques d’entraînement efficaces et un pipeline d’entraînement à plusieurs étapes.
Lire plus