PDFSyntax:依存関係のないPythonによるPDF可視化ツール
2025-02-10
PDFSyntaxは、依存関係のないスタンドアロンのPythonライブラリであり、PDFファイルの内部構造をインタラクティブなHTMLとして可視化します。PDFデータを解析、解凍、整形し、ハイパーリンクとインデックスを追加することで、オブジェクト間の移動やリビジョンの追跡など、PDF内での論理的なナビゲーションを可能にします。簡単なコマンドライン操作で、JavaScriptを有効にする必要のない、ブラウザで直接表示できる静的なHTMLファイルを生成します。逆インデックス、ページインデックス、ミニマップ、オブジェクトストリームの抽出、ストリームの解凍、構文の強調表示などの機能を備えています。暗号化されたファイルはまだサポートされていません。
開発