Benchmark de Redação Criativa de Longo Formato para LLMs

2025-04-10

Este benchmark avalia a capacidade de modelos de linguagem grandes de criar narrativas de longo formato. Ele avalia brainstorming, revisão e a escrita de oito capítulos de 1000 palavras. As métricas incluem o comprimento do capítulo, fluência (evitando frases usadas em excesso), repetição e a degradação da qualidade da escrita ao longo dos capítulos. Uma pontuação final (0-100) é atribuída por um LLM de avaliação.