Eine Komödie der Irrtümer: Meine Amateur-Suchbibliothek vs. Elasticsearch

2025-06-06
Eine Komödie der Irrtümer: Meine Amateur-Suchbibliothek vs. Elasticsearch

Der Autor vergleicht seine Pandas-basierte Volltextsuchbibliothek SearchArray mit Elasticsearch anhand des BEIR-Benchmarks. Die Ergebnisse sind demütigend: SearchArray schneidet in allen Bereichen deutlich schlechter ab als Elasticsearch. Der Artikel untersucht die Gründe und hebt Optimierungen in produktionsreifen Suchmaschinen wie den WAND-Algorithmus und effiziente invertierte Indizes hervor. Das Fehlen dieser Optimierungen in SearchArray führt zu schlechter Performance. Der Autor folgert, dass SearchArray für das Prototyping mit kleineren Datensätzen geeignet ist, nicht aber für große Retrieval-Systeme.

Entwicklung