LLMs knacken einen byzantinischen Musiknotationscode

2025-04-04

Forscher haben entdeckt, dass große Sprachmodelle wie Claude und GPT-4 einen besonderen Code knacken können, der auf dem Unicode-Block der byzantinischen Musiknotation basiert. Dieser Code ähnelt einer Caesar-Chiffre, hat aber einen Offset von 118784. Die Modelle können diesen Code direkt ohne Chain-of-Thought entschlüsseln und erreichen dabei sogar höhere Erfolgsraten als bei regulären Caesar-Chiffren. Die Forscher vermuten, dass dies auf einen linearen Zusammenhang zwischen der Addition in einem bestimmten Unicode-Bereich und der Addition im Token-Raum zurückzuführen ist, der es den Modellen ermöglicht, eine Shift-Chiffre basierend auf dieser Beziehung zu lernen. Dieses Phänomen deutet auf noch unverstandene Mechanismen innerhalb von LLMs hin.

KI