Geheimnisvolle Quadrate in Windows-Dateinamen: Ein Abenteuer mit UTF-16-Surrogate-Paaren

2025-02-26

Dieser Artikel beschreibt ein merkwürdiges Phänomen unter Windows: Viele kleine ausführbare Dateien mit seltsamen Quadraten in ihren Namen erscheinen im Task-Manager. Diese Dateien sind nicht bösartig; das Problem entsteht durch die Verwendung von UTF-16-Surrogate-Paaren in Dateinamen. UTF-16 verwendet Surrogate-Paare, um erweiterte Unicode-Zeichen darzustellen, die über die Basic Multilingual Plane hinausgehen. Wenn die Zeichenkettenverarbeitung isolierte oder fehlerhafte Surrogate-Paare erzeugt, werden die Dateinamen unleserlich. Der Artikel erklärt Surrogate-Paare und liefert ein Python-Skript, um Dateien mit unleserlichen Dateinamen zu erzeugen und so das Phänomen zu reproduzieren.

Entwicklung Surrogate-Paare