Benchmark von regulären Ausdrücken: Rust vs. Re2 vs. Ruby
2025-05-02
SerpApi steht vor Herausforderungen beim Extrahieren von Daten von modernen Websites und greift dabei oft auf reguläre Ausdrücke zurück. Der Benchmark vergleicht Rubys Onigmo-Engine mit Googles re2 und Rusts Regex-Engine. Rusts Regex-Engine erweist sich in den meisten Fällen als am schnellsten, besonders bei Unicode-Text, aber ihre Set-Funktionalität ist inkonsistent. Re2 ist ebenfalls schnell, hat aber Einschränkungen bei der Unicode-Unterstützung. Pcre2s Ruby-Bindungen sind veraltet. Rusts Regex-Engine ist die beste Alternative zu Ruby, wobei jedoch Vorsicht bei der Verwendung der Set-Funktion geboten ist.
Entwicklung