정규 표현식 엔진 벤치마크: Rust vs. Re2 vs. Ruby
2025-05-02
SerpApi는 최신 웹사이트에서 데이터를 추출하는 데 어려움을 겪고 있으며, 종종 정규 표현식에 의존합니다. 벤치마크는 Ruby의 Onigmo 엔진을 Google의 re2와 Rust의 regex 엔진과 비교합니다. Rust의 regex 엔진은 대부분의 경우, 특히 유니코드 텍스트를 처리할 때 가장 빠른 것으로 입증되었지만, 집합 기능(set)의 성능은 일관되지 않습니다. re2도 빠르지만 유니코드 지원에 제한이 있습니다. Pcre2의 Ruby 바인딩은 오래되었습니다. Rust의 regex 엔진은 Ruby의 최상의 대안으로 부상했지만, 집합 기능 사용에는 주의가 필요합니다.
개발