Construyendo un Maestro de Juego LLM Autónomo con Modelos Pequeños y Datos Sintéticos

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

2025-05-29

Esta publicación detalla el proceso de creación de un Maestro de Juego LLM autónomo para juegos de rol de mesa (TTRPG). Inicialmente, el objetivo era un enfoque de agente, pero el autor optó por una estrategia ascendente para comprender mejor el desarrollo del modelo. Debido a recursos computacionales limitados, se eligió un modelo pequeño Qwen3, entrenado con el libro de reglas de Shadowdark RPG procesado mediante OCR en formato Markdown. Se creó un Shadowdark QA Bench para la evaluación, comparando varias métricas antes de decidirse por una coincidencia basada en palabras clave. Después del preentrenamiento y el aumento del conocimiento (creando varias reformulaciones del texto del libro de reglas), el modelo alcanzó una precisión del 60% en el benchmark, cumpliendo el objetivo del autor. El siguiente paso es el ajuste del asistente.