Investigadores de Berkeley replican la tecnología central de DeepSeek R1 por solo 30 $: una revolución de modelos pequeños
2025-01-28
Un equipo de IA de Berkeley replicó la tecnología central de DeepSeek R1-Zero por menos de 30 $, demostrando un razonamiento sofisticado en un modelo de lenguaje pequeño (1.500 millones de parámetros). Utilizando el juego de cuenta atrás como referencia, demostraron que incluso los modelos modestos pueden desarrollar estrategias complejas de resolución de problemas mediante el aprendizaje por refuerzo, logrando un rendimiento comparable al de sistemas más grandes. Este avance democratiza la investigación en IA, demostrando que los avances significativos no requieren recursos masivos.