Benchmark de Escritura Creativa de Formato Largo para LLMs

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Benchmark de Escritura Creativa de Formato Largo para LLMs

2025-04-10

Este benchmark evalúa la capacidad de los modelos de lenguaje grandes para crear narrativas de formato largo. Evalúa la lluvia de ideas, la revisión y la escritura de ocho capítulos de 1000 palabras. Las métricas incluyen la longitud del capítulo, la fluidez (evitando frases sobreutilizadas), la repetición y la degradación de la calidad de la escritura a lo largo de los capítulos. Una puntuación final (0-100) es asignada por un LLM de evaluación.

(eqbench.com)

IA escritura de formato largo

El Caos Económico de Trump y el Desmantelamiento del IRS

Se suspende la traducción de alertas meteorológicas con IA, poniendo vidas en riesgo