Webtagr - Resumen de noticias de tecnología

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Más allá de la Ingeniería de Prompts: Ingeniería de Contexto para Agentes de IA Potentes

2025-07-01

La Ingeniería de Contexto está emergiendo como la próxima frontera en IA, yendo más allá de la simple ingeniería de prompts. Se centra en proporcionar a los LLMs información contextual completa para la resolución eficaz de problemas. El artículo argumenta que el éxito de los agentes de IA depende de la calidad del contexto, no solo de las capacidades del modelo. La Ingeniería de Contexto abarca instrucciones iniciales, prompts del usuario, memoria a corto plazo, memoria a largo plazo, recuperación de información externa, herramientas disponibles y salida estructurada. Un agente de IA exitoso, como uno que programa reuniones a partir de correos electrónicos, necesita datos de calendario integrados, historial de correos electrónicos e información de contacto para generar respuestas humanas en lugar de robóticas. El artículo destaca que la Ingeniería de Contexto es un sistema dinámico, que proporciona la información y las herramientas correctas en el momento adecuado, asegurando que el LLM pueda completar su tarea: la clave para construir agentes de IA robustos y confiables.

DeepSeek R1: Modelo de código abierto desafía a OpenAI en razonamiento complejo

2025-01-31

DeepSeek R1, un modelo de código abierto, está desafiando a los modelos de OpenAI en tareas de razonamiento complejo. Utilizando la Optimización de Política Relativa de Grupo (GRPO) y un enfoque de entrenamiento multietapa centrado en el aprendizaje por refuerzo, los creadores lanzaron no solo el modelo, sino también un artículo de investigación que detalla su desarrollo. El artículo describe un "momento Eureka" durante el entrenamiento donde el modelo aprendió a asignar más tiempo de pensamiento a un problema revaluando su enfoque inicial, sin retroalimentación humana. Esta entrada de blog recrea este "momento Eureka" usando GRPO y el juego Countdown, entrenando un modelo abierto para aprender habilidades de autoverificación y búsqueda. Se proporciona un código interactivo de Jupyter Notebook, junto con scripts e instrucciones para el entrenamiento distribuido en nodos multi-GPU o clústeres SLURM, para facilitar el aprendizaje de GRPO y TRL.