Sistema o3 da OpenAI atinge pontuação inovadora no benchmark ARC-AGI
2024-12-20
O novo sistema o3 da OpenAI, treinado no conjunto de treinamento público ARC-AGI-1, atingiu uma pontuação inovadora de 75,7% no conjunto de avaliação semi-privado, superando as limitações anteriores dos modelos de linguagem grandes. Isso representa um avanço significativo nas capacidades de IA, demonstrando uma adaptação a novas tarefas nunca antes vista na família GPT. Embora ainda não tenha atingido a Inteligência Artificial Geral (AGI), o sucesso do o3 destaca a importância da recombinação do conhecimento em tempo de teste e fornece pontos de dados valiosos para a pesquisa contínua de AGI. Ainda existem desafios, pois o o3 ainda falha em algumas tarefas simples, sublinhando as complexidades de alcançar a verdadeira AGI.
IA