Construyendo un Maestro de Juego LLM Autónomo con Modelos Pequeños y Datos Sintéticos

2025-05-29
Construyendo un Maestro de Juego LLM Autónomo con Modelos Pequeños y Datos Sintéticos

Esta publicación detalla el proceso de creación de un Maestro de Juego LLM autónomo para juegos de rol de mesa (TTRPG). Inicialmente, el objetivo era un enfoque de agente, pero el autor optó por una estrategia ascendente para comprender mejor el desarrollo del modelo. Debido a recursos computacionales limitados, se eligió un modelo pequeño Qwen3, entrenado con el libro de reglas de Shadowdark RPG procesado mediante OCR en formato Markdown. Se creó un Shadowdark QA Bench para la evaluación, comparando varias métricas antes de decidirse por una coincidencia basada en palabras clave. Después del preentrenamiento y el aumento del conocimiento (creando varias reformulaciones del texto del libro de reglas), el modelo alcanzó una precisión del 60% en el benchmark, cumpliendo el objetivo del autor. El siguiente paso es el ajuste del asistente.

Desarrollo Datos Sintéticos