正規表現エンジンのベンチマーク:Rust vs. Re2 vs. Ruby

2025-05-02
正規表現エンジンのベンチマーク:Rust vs. Re2 vs. Ruby

SerpApiは、最新のウェブサイトからデータ抽出を行う際に課題に直面し、しばしば正規表現に頼っています。ベンチマークでは、RubyのOnigmoエンジンを、Googleのre2とRustのregexエンジンと比較しています。Rustのregexエンジンは、ほとんどの場合、特にUnicodeテキストを扱う際に最速であることが証明されましたが、集合機能(set)の性能は一貫していません。re2も高速ですが、Unicodeのサポートに制限があります。Pcre2のRubyバインディングは古くなっています。Rustのregexエンジンは、Rubyの最良の代替手段として浮上していますが、集合機能の使用には注意が必要です。

開発