Construindo um Mestre de Jogo LLM Autônomo com Modelos Pequenos e Dados Sintéticos

Este post detalha a jornada de construção de um Mestre de Jogo LLM autônomo para TTRPGs. Inicialmente visando uma abordagem agente, o autor optou por uma estratégia de baixo para cima para obter um melhor entendimento do desenvolvimento do modelo. Devido a recursos computacionais limitados, um pequeno modelo Qwen3 foi escolhido, treinado no livro de regras do Shadowdark RPG processado via OCR em markdown. Um Shadowdark QA Bench foi criado para avaliação, comparando várias métricas antes de optar por um casamento baseado em palavras-chave. Após o pré-treinamento e aumento de conhecimento (criando várias reformulações do texto do livro de regras), o modelo atingiu uma precisão de 60% no benchmark, atingindo o objetivo do autor. A próxima etapa é o ajuste do assistente.