pgpdf 是一个 PostgreSQL 扩展,它提供了一个 pdf 数据类型和相关的函数。用户可以将文本路径或 bytea blob 转换为 pdf 类型。该扩展利用 poppler 库进行 PDF 解析,并提供了一系列函数,例如获取标题、作者、页数、页面内容、创建者、关键字、元数据、版本、主题、创建时间和修改时间等。此外,pgpdf 还支持全文搜索。需要注意的是,将任意二进制数据(PDF)读入数据库可能存在安全风险,建议仅对受信任的文件使用。