1个回答
展开全部
呵呵,我也被pdf文件搞得头痛啊,试了很多软件都不行,最后用office2003搞了一下,还可以,不过我从网上下载的不行,去买了一个(只要几块钱),这个搞出来后有些错误,需要自己修改,但这总比不能搞还是要好些撒……具体操作:(我复制别人的,图片复制不了,你试一下,应该能行)
如果你需要将图片(PDF文件)中的文字提取出来。我这里就教你一个方法吧。
首先可以利用Office2003组件。运行Office2003安装包,或者已安装的就出现以下图片。
不过刚装的就少了这个过程了。接着在勾选“选择应用程序的高级自定义”这里要注意的是刚装的在选择安装时要选自定义,而不是默认的“经典”
打开Office工具→MicrosoftOfficeDocumentImaging,按提示选择安装“扫描、OCR和索引服务筛选器”和“MicrosoftOfficeDocumentImageWriter”
进行更新完毕后。在安装MicrosoftOfficeDocumentImaging组件后,WindowsXP系统会自动安装一个名为“MicrosoftOfficeDocumentImagingWriter”的打印机(虚拟打印机)。Imaging组件可以通过这个虚拟打印机,将PDF文件所保存的信息识别,从而达到将它直接转换输出到Word等文字编辑工具中的目的。
第二步:用AdobeReader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“MicrosoftOfficeDocumentImageWriter”
确认后将该PDF文件输出为MDI格式的虚拟打印文件
然后,运行“MicrosoftOfficeDocumentImaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word
在弹出的“将文本发送到Word”窗口中选中“所有页面”和“在输出时保持图片版式不变
确认后系统会提示“必须在您执行此操作前识别该文档中的文本(OCR)。这可能需要一些时间”,不管它,点击确定即可
识别完成后,系统会自动调出Word,这时你就可以看到,刚才还不能编辑的文字,乖乖的出现在Word编辑窗口中
需要说明的是,利用Office2003实现PDF文件转的Word文档不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对
如果你需要将图片(PDF文件)中的文字提取出来。我这里就教你一个方法吧。
首先可以利用Office2003组件。运行Office2003安装包,或者已安装的就出现以下图片。
不过刚装的就少了这个过程了。接着在勾选“选择应用程序的高级自定义”这里要注意的是刚装的在选择安装时要选自定义,而不是默认的“经典”
打开Office工具→MicrosoftOfficeDocumentImaging,按提示选择安装“扫描、OCR和索引服务筛选器”和“MicrosoftOfficeDocumentImageWriter”
进行更新完毕后。在安装MicrosoftOfficeDocumentImaging组件后,WindowsXP系统会自动安装一个名为“MicrosoftOfficeDocumentImagingWriter”的打印机(虚拟打印机)。Imaging组件可以通过这个虚拟打印机,将PDF文件所保存的信息识别,从而达到将它直接转换输出到Word等文字编辑工具中的目的。
第二步:用AdobeReader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“MicrosoftOfficeDocumentImageWriter”
确认后将该PDF文件输出为MDI格式的虚拟打印文件
然后,运行“MicrosoftOfficeDocumentImaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word
在弹出的“将文本发送到Word”窗口中选中“所有页面”和“在输出时保持图片版式不变
确认后系统会提示“必须在您执行此操作前识别该文档中的文本(OCR)。这可能需要一些时间”,不管它,点击确定即可
识别完成后,系统会自动调出Word,这时你就可以看到,刚才还不能编辑的文字,乖乖的出现在Word编辑窗口中
需要说明的是,利用Office2003实现PDF文件转的Word文档不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |