Más allá de la Ingeniería de Prompts: Ingeniería de Contexto para Agentes de IA Potentes

2025-07-01
Más allá de la Ingeniería de Prompts: Ingeniería de Contexto para Agentes de IA Potentes

La Ingeniería de Contexto está emergiendo como la próxima frontera en IA, yendo más allá de la simple ingeniería de prompts. Se centra en proporcionar a los LLMs información contextual completa para la resolución eficaz de problemas. El artículo argumenta que el éxito de los agentes de IA depende de la calidad del contexto, no solo de las capacidades del modelo. La Ingeniería de Contexto abarca instrucciones iniciales, prompts del usuario, memoria a corto plazo, memoria a largo plazo, recuperación de información externa, herramientas disponibles y salida estructurada. Un agente de IA exitoso, como uno que programa reuniones a partir de correos electrónicos, necesita datos de calendario integrados, historial de correos electrónicos e información de contacto para generar respuestas humanas en lugar de robóticas. El artículo destaca que la Ingeniería de Contexto es un sistema dinámico, que proporciona la información y las herramientas correctas en el momento adecuado, asegurando que el LLM pueda completar su tarea: la clave para construir agentes de IA robustos y confiables.

Leer más

DeepSeek R1: Modelo de código abierto desafía a OpenAI en razonamiento complejo

2025-01-31
DeepSeek R1: Modelo de código abierto desafía a OpenAI en razonamiento complejo

DeepSeek R1, un modelo de código abierto, está desafiando a los modelos de OpenAI en tareas de razonamiento complejo. Utilizando la Optimización de Política Relativa de Grupo (GRPO) y un enfoque de entrenamiento multietapa centrado en el aprendizaje por refuerzo, los creadores lanzaron no solo el modelo, sino también un artículo de investigación que detalla su desarrollo. El artículo describe un "momento Eureka" durante el entrenamiento donde el modelo aprendió a asignar más tiempo de pensamiento a un problema revaluando su enfoque inicial, sin retroalimentación humana. Esta entrada de blog recrea este "momento Eureka" usando GRPO y el juego Countdown, entrenando un modelo abierto para aprender habilidades de autoverificación y búsqueda. Se proporciona un código interactivo de Jupyter Notebook, junto con scripts e instrucciones para el entrenamiento distribuido en nodos multi-GPU o clústeres SLURM, para facilitar el aprendizaje de GRPO y TRL.

Leer más
IA