驚くほど速い文字列内の母音検出方法

この記事では、単純なループから正規表現、素数を使ったアプローチまで、文字列内の母音検出のための11種類の異なる方法をベンチマークしています。驚くべきことに、正規表現は、さまざまな文字列の長さにおいて、単純なループなどの他の方法を一貫して凌駕しました。PythonのバイトコードとCPythonの正規表現エンジンの詳細な分析により、正規表現の速度の理由が明らかになりました。著者は、正規表現がほとんどの場合で最も高速ですが、何百万もの文字列を処理する場合を除き、より単純な方法で十分であると結論付けています。
続きを読む