Claude 3.7 de Anthropic: IA de razonamiento impulsada por aprendizaje por refuerzo
Anthropic ha lanzado Claude 3.7, un modelo de IA mejorado que se diferencia de los modelos de lenguaje extenso (LLM) tradicionales al centrarse en la capacidad de razonamiento. Entrenado con aprendizaje por refuerzo, Claude 3.7 sobresale en la resolución de problemas que requieren razonamiento paso a paso, particularmente desafíos de codificación, superando a los modelos de OpenAI en algunos puntos de referencia. Este avance se debe a datos de entrenamiento adicionales y optimizaciones para aplicaciones comerciales, como la escritura de código y la respuesta a preguntas legales. El lanzamiento de Claude Code aumenta aún más su practicidad en la codificación asistida por IA, proporcionando un soporte robusto para la planificación de código complejo.