El sistema o3 de OpenAI logra una puntuación innovadora en el benchmark ARC-AGI
El nuevo sistema o3 de OpenAI, entrenado en el conjunto de entrenamiento público ARC-AGI-1, logró una puntuación innovadora del 75,7% en el conjunto de evaluación semipúblico, superando las limitaciones anteriores de los modelos de lenguaje grandes. Esto representa un avance significativo en las capacidades de IA, demostrando una adaptación a nuevas tareas nunca antes vista en la familia GPT. Si bien aún no ha alcanzado la Inteligencia Artificial General (AGI), el éxito del o3 destaca la importancia de la recombinación del conocimiento en tiempo de prueba y proporciona puntos de datos valiosos para la investigación continua de AGI. Todavía existen desafíos, ya que el o3 aún falla en algunas tareas simples, subrayando las complejidades de lograr la verdadera AGI.
Leer más