Suiza lanzará un modelo de lenguaje grande de código abierto y multilingüe
Investigadores del ETH Zurich y EPFL, en colaboración con el Centro Nacional de Supercomputación de Suiza (CSCS), están a punto de lanzar un modelo de lenguaje grande (LLM) totalmente de código abierto. Este modelo, que admite más de 1000 idiomas, presenta datos de entrenamiento transparentes y reproducibles y se lanzará bajo la licencia Apache 2.0. La iniciativa tiene como objetivo fomentar la innovación abierta en IA y apoyar la adopción generalizada en ciencia, gobierno, educación y el sector privado, respetando las leyes suizas de protección de datos y las obligaciones de transparencia de la Ley de IA de la UE. El entrenamiento utilizó el superordenador "Alpes" del CSCS, con más de 10 000 superchips NVIDIA Grace Hopper y utilizando electricidad 100 % neutra en carbono.