本书档的目标读者是需要使用 Python 处理 PDF 文档的开发人员、数据科学家和研究人员。它适用于那些需要从 PDF 文档中提取文本、图像和元数据,以及需要操作 PDF 文档(例如合并、拆分、加密、添加水印)的人员。此外,对于那些希望将 PyMuPDF 集成到 LLM 和 RAG 系统中的人来说,本书档也很有价值。
Artifex 是一家专注于文档处理技术的公司,为 MuPDF 提供商业许可。
PyMuPDF 旨在简化 PDF 文档的处理,使其能够适应各种应用场景,包括 LLM 和 RAG 环境。它建立在 MuPDF 库之上,并提供了 Python 友好的接口。