Modelo de código aberto R1 abala o mundo da IA: Desenvolvimento acelerado!

2025-01-26
Modelo de código aberto R1 abala o mundo da IA: Desenvolvimento acelerado!

A paisagem da IA está explodindo com novos modelos. O modelo de raciocínio de código aberto R1 da DeepSeek, iguala o desempenho do modelo fechado o1 da OpenAI, mas a uma fração do custo, enviando ondas de choque pela indústria. O R1 valida as abordagens o1 e o3 da OpenAI e revela novas tendências: a importância diminuída do pré-treinamento e o surgimento de leis de dimensionamento do tempo de inferência, redução de tamanho de modelos, leis de dimensionamento de aprendizado por reforço e leis de dimensionamento de destilação de modelos, todas acelerando o desenvolvimento da IA. A natureza de código aberto do R1 intensifica a competição EUA-China, destacando as implicações geopolíticas maciças do rápido progresso da IA.

IA