Benchmark de Escritura Creativa de Formato Largo para LLMs

2025-04-10

Este benchmark evalúa la capacidad de los modelos de lenguaje grandes para crear narrativas de formato largo. Evalúa la lluvia de ideas, la revisión y la escritura de ocho capítulos de 1000 palabras. Las métricas incluyen la longitud del capítulo, la fluidez (evitando frases sobreutilizadas), la repetición y la degradación de la calidad de la escritura a lo largo de los capítulos. Una puntuación final (0-100) es asignada por un LLM de evaluación.