Investigadores de Berkeley replican la tecnología central de DeepSeek R1 por solo 30 $: una revolución de modelos pequeños

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Investigadores de Berkeley replican la tecnología central de DeepSeek R1 por solo 30 $: una revolución de modelos pequeños

2025-01-28

Un equipo de IA de Berkeley replicó la tecnología central de DeepSeek R1-Zero por menos de 30 $, demostrando un razonamiento sofisticado en un modelo de lenguaje pequeño (1.500 millones de parámetros). Utilizando el juego de cuenta atrás como referencia, demostraron que incluso los modelos modestos pueden desarrollar estrategias complejas de resolución de problemas mediante el aprendizaje por refuerzo, logrando un rendimiento comparable al de sistemas más grandes. Este avance democratiza la investigación en IA, demostrando que los avances significativos no requieren recursos masivos.

(xyzlabs.substack.com)

IA IA de Modelo Pequeño Revolución de la IA Modelo Pequeño Investigación en IA IA de bajo costo Investigación de IA Modelos de Lenguaje Pequeños Coste de la IA

DeepSeek v3: Mejoras significativas en la arquitectura Transformer

DeepSeek desafía a Altman: Un modelo de IA de 5,6 millones de dólares sacude el mercado