Windowsファイル名に現れる謎の四角形:UTF-16サロゲートペアの冒険

2025-02-26

この記事では、Windowsにおける奇妙な現象について説明します。タスクマネージャーに、名前の中に奇妙な四角形を含む小さな実行ファイルが多数表示されるというものです。これらのファイルは悪意のあるものではなく、ファイル名にUTF-16サロゲートペアが使われていることが原因で表示の問題が発生しています。UTF-16は、拡張Unicode文字を扱うために、基本多言語面を超える文字を表すサロゲートペアを使用します。文字列処理によって孤立した、または不正なサロゲートペアが生成されると、ファイル名がレンダリングされなくなります。この記事ではサロゲートペアについて説明し、レンダリングできないファイル名を持つファイルを作成するPythonスクリプトを提供することで、この現象を再現します。