AMD Apresenta Instella: Família de Modelos de Linguagem Abertos com 3 Bilhões de Parâmetros
2025-03-24
A AMD anunciou a Instella, uma família de modelos de linguagem de ponta totalmente abertos, com 3 bilhões de parâmetros, treinados do zero em GPUs AMD Instinct™ MI300X. Os modelos Instella superam os modelos totalmente abertos existentes de tamanho semelhante e alcançam desempenho competitivo em comparação com modelos de peso aberto de última geração, como Llama-3.2-3B. A AMD está disponibilizando em código aberto todos os artefatos do modelo, incluindo pesos, configurações de treinamento, conjuntos de dados e código, para promover a colaboração e a inovação na comunidade de IA. Os modelos utilizam técnicas de treinamento eficientes e um pipeline de treinamento de múltiplas etapas.
IA