Cuss: Eine mehrsprachige Bibliothek zur Erkennung von Schimpfwörtern

2025-06-02
Cuss: Eine mehrsprachige Bibliothek zur Erkennung von Schimpfwörtern

Cuss ist eine Open-Source-Bibliothek, die Listen von Schimpfwörtern in mehreren Sprachen zusammen mit einer Vertrauensbewertung bereitstellt. Sie ist nicht dazu gedacht, Filter für Schimpfwörter zu erstellen (was der Autor nicht empfiehlt), sondern eher für die Forschung im Bereich der Verarbeitung natürlicher Sprache. Die Bibliothek unterstützt verschiedene Installationsmethoden (npm, esm.sh usw.) und enthält mehrere Sprachversionen (Englisch, Arabisch, Spanisch, Französisch, Italienisch, Portugiesisch usw.). Jedes Wort wird von 0 bis 2 bewertet, was die Wahrscheinlichkeit angibt, dass es als Schimpfwort verwendet wird. Darüber hinaus enthält die Bibliothek weitere Wortlisten, wie z. B. Schlagworte, gebräuchliche Wörter usw.