ocr识别失败什么意思
ocr识别失败是指没有有效的提取图片信息,无法提取证件上的文字信息上传。
OCR识别技术无法保证100%识别成功、识别正确,只能无限接近与100%,这种情况属正常现象,可以选择手动录入,OCR文字识别是指电子设备检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程,
对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程,如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,衡量一个OCR系统性能好坏的主要指标有,拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性。
OCR简介:
光学文字识别的概念是在1929年由德国科学家Tausheck最先提出来的,美国科学家Handel也提出了利用技术对文字进行识别的想法,而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy。
早在60、70年代,世界各国就开始有OCR的研究,而研究的初期,多以文字的识别方法研究为主,且识别的文字仅为0至9的数字。以同样拥有方块文字的日本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对象。
20世纪70年代初,日本的学者开始研究汉字识别,并做了大量的工作,中国在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究。到1986年汉字识别的研究进入一个实质性的阶段。
研究单位相继推出了中文OCR产品早期的OCR软件,由于识别率及产品化等多方面的因素,未能达到实际要求,由于硬件设备成本高,运行速度慢,也没有达到实用的程度,只有个别部门,如信息部门、新闻出版单位等使用OCR软件。
进入20世纪90年代以后,随着平台式扫描仪的广泛应用,以及我国信息自动化和办公自动化的普及,大大推动了OCR技术的进一步发展,使OCR的识别正确率、识别速度满足了广大用户的要求。
2023-08-25 广告