Burrows-Wheeler 변환: 효율적인 데이터 압축의 비밀

2025-02-01

Burrows-Wheeler 변환(BWT)은 문자열을 재배열하여 유사한 문자의 연속적인 시퀀스를 생성함으로써 압축 효율을 높이는 정교한 데이터 압축 알고리즘입니다. 많은 연속적인 "the"를 만들도록 텍스트를 섞는 것을 상상해 보세요. 훨씬 쉽게 압축할 수 있습니다! BWT는 문자열의 모든 순환 시프트를 정렬하고 마지막 열을 추출합니다. 놀랍게도 이 변환은 추가 데이터 없이 가역적입니다. bzip2와 같은 압축 도구에 사용되며 게놈학, 이미지 압축 등에도 응용됩니다. 텍스트 편집 후에도 변환 결과를 국부적으로 조정하여 빠르게 업데이트할 수 있으므로 계산 오버헤드를 최소화합니다.