Construire un Maître du Jeu LLM autonome avec des petits modèles et des données synthétiques
Cet article détaille le processus de création d'un Maître du Jeu LLM autonome pour les jeux de rôle sur table (JDR). Initialement, l'objectif était une approche agentive, mais l'auteur a opté pour une stratégie ascendante afin de mieux comprendre le développement du modèle. En raison de ressources de calcul limitées, un petit modèle Qwen3 a été choisi, entraîné sur le livre de règles de Shadowdark RPG converti en Markdown via OCR. Un Shadowdark QA Bench a été créé pour l'évaluation, comparant plusieurs métriques avant de se décider pour une correspondance basée sur les mots clés. Après le pré-entraînement et l'augmentation des connaissances (création de plusieurs reformulations du texte du livre de règles), le modèle a atteint une précision de 60 % sur le benchmark, atteignant l'objectif de l'auteur. L'étape suivante est le réglage de l'assistant.