La Suisse va publier un grand modèle linguistique entièrement open source et multilingue
Des chercheurs de l'ETH Zurich et de l'EPFL, en collaboration avec le Centre suisse de calcul scientifique (CSCS), s'apprêtent à publier un grand modèle linguistique (LLM) entièrement open source. Ce modèle, prenant en charge plus de 1000 langues, présente des données d'entraînement transparentes et reproductibles et sera publié sous licence Apache 2.0. L'initiative vise à favoriser l'innovation ouverte en IA et à soutenir une adoption large dans la science, le gouvernement, l'éducation et le secteur privé, tout en respectant les lois suisses sur la protection des données et les obligations de transparence du règlement européen sur l'IA. L'entraînement a utilisé le supercalculateur "Alpes" du CSCS, équipé de plus de 10 000 superpuces NVIDIA Grace Hopper et fonctionnant à 100 % avec de l'électricité neutre en carbone.
Lire plus