尚书七号的识别

 我来答

1个回答

#热议# 发烧为什么不能用酒精擦身体来退烧？

小妖狗g丶浤倕
2016-05-12

知道答主

回答量：83

采纳率：0%

帮助的人：9.5万

我也去答题访问个人页

关注

展开全部

步骤1：获取文字图像文件。
选择“文件”菜单下的“扫描”或“打开图像”（将已经扫描好的图像文件打开）命令，打开图像文件。如果连接了多台扫描仪，可以选择“文件”菜单下的“选择扫描仪”命令，调用扫描仪。
步骤2：对扫描的图像页进行调整
选择“编辑”菜单下“图像页面的处理”子菜单下的“图像页的倾斜校正”（提供自动和手动实现方法）及“旋转”等命令，将扫描的图像页进行调整。
步骤3：版面分析与文字识别转化
版面分析，选择识别范围，在进行文字识别前要选择识别范围，识别过程的核心是“版面分析”。尚书七号的自动版面分析功能很强，对报纸杂志等复杂的版面，也能保持很高的分析正确率。
设置好后，直接点击“开始识别”的按钮就可以进行文字识别了。
步骤4：校对修改
自动识别完毕，识别结果的“文本窗口”会弹出，这个窗口能够提供识别结果的校对，为了校对方便，尚书七号增加了光标跟随显示原图像行的校对方法（如图3出现的黄色提示行的出现）。
提供的校对方法，一眼就能够看到图像原文和识别出文本的差别，如果发现识别有误，可以进行修改。
步骤5：输出
如果检查修改后确认无误，选择识别结果的“输出”菜单，输出的文件格式有：RTF、HTML、XLS、2126，可以根据自己的需要选择对应的格式。如果用户想得到类似原文的识别结果，请选择RTF格式。把RTF格式输出的文件用WORD打开后，会发现几乎保留了原文的所有痕迹，包括原来页面中的彩色图像，都已经保留在WORD中了。 1、图片质量。批量识别时，首先应确保要识别的图片质量。如不能识别还需要重新处理，甚至会导致软件死掉，浪费时间。我本人就曾深受其苦。图片分辨率应稍高，肉眼看感觉偏大，因为识别工具是有点近视的，文字和底色对比要求不高，通常来说，肉眼能看清楚即可，底色发灰或发黑基本不会影响识别结果。
2、避免有不规则形状（图片）出现。识别工具在进行版面分析时，只能采用方形切割，当图片中存在文字环绕不规则形状时，则无法将文字和该形状划分开，则将出现错误或无法识别。此时，较快的办法是在PS中，吸取该图片附近的页面底色，用粗画笔将该区域涂上，不必讲求效果，颜色没有太大差别即可，重新保存图片。
3、避免图象倾斜。尚书七号中也有自动倾斜校正和手动倾斜校正工具，但即使经过校正，识别率还是低很多。如果是拍摄的书本，可能会产生一定弧度，此时保证行的两端对齐即可。另外在拍摄时应避免高光等会使图象各部分亮度反差大的情况。
4.为了得到较好的OCR使用效果，建议用户将扫描仪的驱动SCANWIZARD 5软件，由初始安装的标准控制面板，切换到高级控制面板状态。 1．过程与上面所介绍，基本一样，只是用户需要注意存盘格式。
2．一般，如果用户需要对该文字，进行重新排版工作，请用户选择TXT存盘，然后再将其内容拷贝到WORD中。
3．如果用户希望保留稿件的原有格式，并能够作版面的恢复，请使用RTF格式存盘，该格式将有版面的恢复功能。但是用户只能针对其中的文字，作一些个别字的调整，无法作大范围的排版方式的修改。 1．其中，扫描、自动倾斜矫正过程同普通文稿是一样的。
2．但是注意“版面分析”后，对其结果进行检查。应该在表格上，经过版面分析后，有一个兰色的框，选中了表格部分，如果不是，用户需要修改栏属性或者考虑手动划定识别区域。
3．注意输出结果的选择，如果是需要重新排版，用户应该分别用TXT和XLS格式存盘，然后将TXT中的文字和XLS中的表格分别拷贝到WORD，进行排版。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

尚书七号的识别

其他类似问题

为你推荐：