PDFSyntax: Uma ferramenta de visualização de PDF em Python sem dependências
2025-02-10
PDFSyntax é uma biblioteca Python independente, sem dependências, que visualiza a estrutura interna de arquivos PDF como HTML interativo. Ele analisa, descompacta e formata dados PDF, adicionando hiperlinks e índices para permitir navegação lógica pelo PDF, incluindo a travessia de objetos e o rastreamento de revisões. Uma simples operação de linha de comando gera HTML estático visualizável diretamente em um navegador sem exigir JavaScript. Recursos incluem indexação reversa, indexação de páginas, um mapa de miniaturas, extração de fluxos de objetos, descompressão de fluxos e realce de sintaxe. Arquivos criptografados ainda não são suportados.
Desenvolvimento