PDFSyntax: Ein abhängiges Python-PDF-Visualisierungstool

2025-02-10
PDFSyntax: Ein abhängiges Python-PDF-Visualisierungstool

PDFSyntax ist eine eigenständige Python-Bibliothek ohne Abhängigkeiten, die die interne Struktur von PDF-Dateien als interaktives HTML visualisiert. Sie analysiert, dekomprimiert und formatiert PDF-Daten und fügt Hyperlinks und Indizes hinzu, um eine logische Navigation durch das PDF zu ermöglichen, einschließlich der Objektnavigation und der Versionsverfolgung. Ein einfacher Befehlszeilenbefehl generiert statisches HTML, das direkt in einem Browser angezeigt werden kann, ohne dass JavaScript aktiviert sein muss. Zu den Funktionen gehören die umgekehrte Indizierung, die Seitenindizierung, eine Miniaturkarte, die Extraktion von Objektdatenströmen, die Dekompression von Datenströmen und die Syntaxhervorhebung. Verschlüsselte Dateien werden noch nicht unterstützt.

Entwicklung