Chonky: Intelligente Textsegmentierung mit Transformers
2025-04-13
Chonky ist eine Python-Bibliothek, die Text intelligent in sinnvolle semantische Abschnitte unterteilt, indem sie ein feinabgestimmtes Transformer-Modell verwendet. Diese Bibliothek ist nützlich in Retrieval Augmented Generation (RAG)-Systemen. Sie verarbeitet effizient große Texte und teilt sie in kleinere, übersichtlichere Abschnitte auf, um die Analyse und Verarbeitung zu vereinfachen. Ein Beispielcode zeigt, wie man Chonky verwendet, um einen Beispieltext in semantisch kohärente Abschnitte zu unterteilen.
Entwicklung
Textsegmentierung