Burrows-Wheeler 変換:効率的なデータ圧縮の秘密

2025-02-01

Burrows-Wheeler 変換(BWT)は、文字列を再配置して類似した文字の連続した並びを作ることで、圧縮効率を高める巧妙なデータ圧縮アルゴリズムです。多くの連続する「the」を作るようにテキストをシャッフルすることを想像してみてください。はるかに簡単に圧縮できますよね!BWT は文字列のすべての循環シフトをソートし、最後の列を抽出します。驚くべきことに、この変換は追加データなしで可逆的です。bzip2などの圧縮ツールで使用され、ゲノミクス、画像圧縮などにも応用されています。テキストの編集後も、変換結果を局所的に調整することで高速に更新できるため、計算オーバーヘッドを最小限に抑えます。

テクノロジー Burrows-Wheeler 変換