Benchmarks de motores de expressão regular: Rust vs. Re2 vs. Ruby
2025-05-02

A SerpApi enfrenta desafios na extração de dados de sites modernos, muitas vezes recorrendo a expressões regulares. Seu benchmark compara o mecanismo Onigmo do Ruby com o re2 do Google e o mecanismo regex do Rust. O mecanismo regex do Rust se mostra o mais rápido na maioria dos casos, especialmente com texto Unicode, mas sua funcionalidade de conjunto é inconsistente. O Re2 também é rápido, mas tem limitações de Unicode. As ligações Ruby do Pcre2 estão desatualizadas. O mecanismo regex do Rust surge como a melhor alternativa ao Ruby, embora seja necessário cuidado com seu recurso de conjunto.
Desenvolvimento
expressão regular