El Paradigma del Uso Infinito de Herramientas para LLM

2025-05-25

Este artículo propone un nuevo paradigma para los Modelos de Lenguaje Grandes (LLM): el uso infinito de herramientas. El paradigma sugiere que los LLM solo deben generar llamadas a herramientas y sus argumentos, descomponiendo tareas complejas en una serie de llamadas a herramientas. Esto evita las limitaciones de la ventana de contexto y los problemas de acumulación de errores que enfrentan los LLM tradicionales al manejar textos largos y tareas complejas. A través de herramientas externas (como editores de texto, software CAD, etc.), los LLM pueden realizar generación de texto multinivel, modelado 3D y más, gestionando eficazmente la información del contexto. Este enfoque no solo mejora la eficiencia y precisión del LLM, sino que también aumenta la seguridad, ya que los modelos deben usar las herramientas de forma clara para realizar tareas complejas, reduciendo las salidas engañosas. El entrenamiento depende principalmente del aprendizaje por refuerzo, aprovechando el 'olvido' de los LLM para abordar los desafíos de longitud de contexto infinito.