为什么从PDF上复制了文字,粘贴到Word上却是一堆乱码?
1、使用任意一款PDf编辑器打开相应的PDF文档,点击“文件”-“文件属性”项打开。
2、待打开“文档属性”界面后,切换到“字体”选项卡,在右侧找到除了标识“已嵌入”的字体外,其它字体尽可能地进行安装。
3、给电脑安装字体的方法很简单,右击字体文件选择“安装”项即可。或者将字体文件拷贝到“c:\windows/fonts”目录中即可。
4、另一种比较有效的方法,就是借助相关PDF文字提取工具,将PDF文档中的字体进行提取即可。如图所示,选择“OCR PDF识别”项。
5、从打开的“OCR PDF识别”界面中,点击“选择文件”以添加相应的PDF文档,并对转换后的文件格式进行设置,点击“开始识别”按钮。
6、待识别PDF文档操作完成后,点击“立即下载”按钮,将识别后的Word文档进行保存即可。最后就可以在Word程序中进行查看及修改操作了。
乱码的原因就是因为内容的编码格式和word规定的不一样,采用“删除内容格式法”,都可以解决乱码的现象。
解决方法:
一、替换格式
打开被损坏的文档单击“文件”→“另存为”菜单,在“保存类型”列表中,选择“RTF格式”,然后单击“保存”按钮。打开刚才保存的RTF格式文件,再次使用“另存为”将文件重新保存为“Word文档”,现在打开这个Word文件我们就可以发现文件已经被恢复过来了。如果在转换成RTF格式后文件仍然不能被恢复,可以将文件再次转换为纯文本格式(*.txt),再转换回Word格式即可。
二、利用word2002/2003的“打开并修复”功能来修复文挡。
1、启动word2002/2003,单击“文件-----打开”,在“打开”对话框中选重要修复的word文挡。
2、单击“打开”按钮右边的下三角按钮,在弹出的下拉菜单中选中“打开并修复”选项,即可对损坏的文挡进行修复,修复完成后,显示文挡内容。
提示:“打开并修复”是只有word2002以上的版本才具有的功能。
3三、重设格式法
Word用文档中的最后一个段落标记关联各种格式设置信息,特别是节与样式的格式设置。这样我们就可以将最后一个段落标记之外的所有内容复制到新文档,就有可能将损坏的内容留在原始文档中。步骤如下:
1、在Word中打开损坏的文档,选择“工具→选项”然后选择“编辑”选项卡,取消“使用智能段落选择范围”复选框前的勾。取消选中该复选框,选定整个段落时,Word将不会自动选定段落标记,然后单击“确定”按钮。
2、选定最后一个段落标记之外的所有内容,方法是:按“Ctrl+End”组合键,然后按“Ctrl+Shift+Home”组合键。
3、在常用工具栏中,依次单击“复制”、“新建”和“粘贴”按钮。
解决办法:
第一步:打开PDF文档,点击【特色应用】下的【文本识别】。
第二步:在弹出的【识别文本】对话框内选择需要识别的文本,点击【开始转换】。待识别成功后,点击【查看文本】,当前查看文本则是可转换可复制的文本。
原因二:说明你的PDF文档是扫描版的,也就是由扫描图片制成的PDF文档,由于一般的PDF转换软件无法识别,使用造成出现乱码。
解决办法:选择专业的嗨格式PDF转换器,将PDF文档转换为word文档进行操作。
第一步,运行嗨格式PDF转换器,拖拽或添加需要转换的PDF文档,选择PDF转word。
第二步:在弹出的转换菜单下,选择你要转换的文件,然后点击开始转换。
待转换完成后,打开转换过的文档,PDF就轻松转换成word文档了,你可以在里面编辑或者复制粘贴,使用WPS对PDF文档进行转换一般都不会出现乱码现象,而且方便快捷。
转换试试:
对于不允许做修改的PDF文件——就是加密加了权限的PDF,首先要去除密码或者去除数字证书,推荐用PDF Password Remove,然后再按照下面的方法【免费】进行转换为word文件:
方法一:用软件PDF To Word Converter,使用之后然后有两种结果
1、转化出来的就是想要的word,这种情况最理想了;
2、转化出来的word上都是图片,需要上网找“ABBYY finereader v9”一类的文字识别软件。ABBYY finereader v9是我见过的最强大的PDF(图片格式或者是扫描件)转word的软件。它是一款OCR软件,界面比较简洁明,9.0和以上版本有简体中文版的,支持100语言的识别,特别是混合多种语言识别效果也非常好:安装完毕之后,首先把图片上的文字识别出来,然后再对照图片把识别错误的地方改过来,这样就实现了,从JPEG文件到word的格式转换。
方法二:在线PDF转Word共有以下几个步骤:
• 点击浏览按钮选择需要转换的PDF文件。
• 输入需要转换的页码,以逗号分割开,如果转换所有的页面可以跳过这一步。
• 点击按钮上传文件,然后等着就可以了。
• 点击下载链接把做好的文件下载到本地就可以了;
方法三:用其他软件Wondershare PDFelement等处理。
广告 您可能关注的内容 |