PDFSyntax: Uma ferramenta de visualização de PDF em Python sem dependências

2025-02-10
PDFSyntax: Uma ferramenta de visualização de PDF em Python sem dependências

PDFSyntax é uma biblioteca Python independente, sem dependências, que visualiza a estrutura interna de arquivos PDF como HTML interativo. Ele analisa, descompacta e formata dados PDF, adicionando hiperlinks e índices para permitir navegação lógica pelo PDF, incluindo a travessia de objetos e o rastreamento de revisões. Uma simples operação de linha de comando gera HTML estático visualizável diretamente em um navegador sem exigir JavaScript. Recursos incluem indexação reversa, indexação de páginas, um mapa de miniaturas, extração de fluxos de objetos, descompressão de fluxos e realce de sintaxe. Arquivos criptografados ainda não são suportados.

Desenvolvimento