Benchmark d'écriture créative longue forme pour les LLM

2025-04-10

Ce benchmark évalue la capacité des grands modèles de langage à créer des récits de longue forme. Il évalue le brainstorming, la révision et la rédaction de huit chapitres de 1000 mots. Les métriques incluent la longueur des chapitres, la fluidité (en évitant les phrases surutilisées), la répétition et la dégradation de la qualité de l'écriture au fil des chapitres. Un score final (0-100) est attribué par un LLM d'évaluation.