LLMs knacken einen byzantinischen Musiknotationscode

2025-04-04

Forscher haben entdeckt, dass große Sprachmodelle wie Claude und GPT-4 einen besonderen Code knacken können, der auf dem Unicode-Block der byzantinischen Musiknotation basiert. Dieser Code ähnelt einer Caesar-Chiffre, hat aber einen Offset von 118784. Die Modelle können diesen Code direkt ohne Chain-of-Thought entschlüsseln und erreichen dabei sogar höhere Erfolgsraten als bei regulären Caesar-Chiffren. Die Forscher vermuten, dass dies auf einen linearen Zusammenhang zwischen der Addition in einem bestimmten Unicode-Bereich und der Addition im Token-Raum zurückzuführen ist, der es den Modellen ermöglicht, eine Shift-Chiffre basierend auf dieser Beziehung zu lernen. Dieses Phänomen deutet auf noch unverstandene Mechanismen innerhalb von LLMs hin.

Mehr lesen
KI

Visualisierung des PyPI-Abhängigkeitsgraphen: Aufdeckung versteckter Paketcluster

2025-03-04

Durch die Visualisierung des Abhängigkeitsgraphen von über einer halben Million Open-Source-Python-Paketen auf PyPI erstellt der Autor einen massiven Netzwerkgraphen. Nach der Datenbereinigung und der Verwendung der Software Gephi zeigt der Autor erfolgreich die Abhängigkeitsbeziehungen zwischen den Paketen auf und entdeckt interessante Phänomene: Einige Pakete bilden enge Cluster, wie beispielsweise den Cluster von wissenschaftlichen Rechenpaketen um NumPy herum; andere sind anomale Cluster, die verdächtige Pakete enthalten, was auf das Potenzial von Visualisierungsmethoden zur Erkennung bösartiger Pakete hindeutet. Darüber hinaus gruppieren sich auch Pakete großer Unternehmen wie Triton und Odoo aufgrund ihrer internen Abhängigkeiten. Diese Forschung bietet eine neue Perspektive auf die Erforschung des PyPI-Ökosystems und zeigt die Leistungsfähigkeit der Datenvisualisierung bei der Paketanalyse.

Mehr lesen
Entwicklung