我想用PHP读取PDF文件的内容,尤其是现在很多的扫描后转为PDF的文件,请问怎么读?

 我来答
windblast
2014-07-22 · 知道合伙人软件行家
windblast
知道合伙人软件行家
采纳数:5633 获赞数:13620
毕业于空军第一航空学院电子专业,1991年开始接触电脑,从事多年计算机编程,具有较丰富的经验。

向TA提问 私信TA
展开全部

你可以从网上找一些为PHP语言编写的 pdf 扩展库,数量不少,比如:


PHP的PDF解析库 PdfParser


PdfParser 是一个标准的 PHP 库提供个用于从 PDF 文件中抽取数据的工具。它加载 PDF 文件并解析文件中对象、头和元数据,可抽取其中的文本信息,支持压缩的 PDF、MAC OS 罗马字符集编码、8进制和16进制编码。兼容 PSR-0 和 PSR-1。

   

示例代码:

$document = \Smalot\PdfParser\Document::parseFile('document.pdf');
$pages    = $document->getPages();
$text     = $pages[1]->getText();


  PHP官方里也有一个对PDF支持的库 : PDFlib, 你可以根据自己的需要和喜好来使用。

追问
我下载了这个,不过网上很少有关于pdfparse的使用介绍,怎么使用它呢?
追答
怎么使用,请看其说明或从网上搜索相关资料,如果不好找,可以再换个 pdf 库,如果再不好找,请自行看其源代码(通常类似的PHP库都是开源的)。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式