Los LLM descifran una cifra de notación musical bizantina

2025-04-04

Investigadores descubrieron que los grandes modelos de lenguaje como Claude y GPT-4 pueden descifrar una cifra peculiar basada en el bloque Unicode de notación musical bizantina. Esta cifra se asemeja a una cifra César, pero con un desplazamiento de 118784. Los modelos pueden descifrar esta cifra directamente, sin pensamiento en cadena, logrando tasas de éxito incluso mayores que con las cifras César regulares. Los investigadores plantean la hipótesis de que esto se debe a una relación lineal entre la suma en un rango específico de Unicode y la suma en el espacio de tokens, permitiendo que los modelos aprendan una cifra de desplazamiento basada en esta relación. Este fenómeno sugiere la existencia de mecanismos aún no comprendidos dentro de los LLM.

IA