ios opencv 怎么实现文字识别

 我来答

1个回答

#热议# 上班途中天气原因受伤算工伤吗？

GYvu3w8
2016-05-22 · TA获得超过431个赞

知道小有建树答主

回答量：346

采纳率：0%

帮助的人：241万

我也去答题访问个人页

关注

展开全部

这里写下OpenCV下OCR的流程：
1. 特征提取
2. 训练
3. 识别

特征提取
1. 在图像预处理后，提取出字符相关的ROI图像，并且大小归一化，整个图像的像素值序列可以直接作为特征。damiles是直接将整个字符图像转换化为vector向量特征作为特征输入的。

2. 但直接将整个图像作为特征数据维度太高，计算量太大，所以也可以进行一些降维处理，减少输入的数据量。拿到字符的ROI图像，二值化。将图像分块，然后统计每个小块中非0像素的个数，这样就形成了一个较小的矩阵，这矩阵就是新的特征了。
UCI就是这么处理，详见其说明http://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits
OpenCV中letter_recog例子就是使用的其特征数据。

训练与识别
训练与识别一般都采用同一种机器学习方法：
DAMILES应用了KNearest方法，对输入数据进行训练和识别。
1. 数据输入：
getData（）函数中：
为trainData和trainClasses设置数据。

2. 初始化机器学习算法，及其训练
knn=new CvKNearest( trainData, trainClasses, 0, false, K );

trainData, trainClasses数据已得到。
而K是分类的数目。

训练在CvKNearest算法初始化中已经完成

3. 识别
获取识别测试的数据，testData
result=knn->find_nearest(testData,K,0,0,nearest,0);

result为识别的结果。

而OpenCV自带例子中，提供了boost，mlp，knearest，nbayes，svm，rtrees这些机器学习方法，进行训练和识别。
处理的步骤和方式都类似。

这些例子的识别率不是很高，OCR识别率在90%以上才有较好的使用意义，所以，OCR还需要更多特征和分析方法，来提高识别率，tesseract是一个不错的开源OCR引擎。

-------------------
在tesseract最初的字体库里，一种字体的字符样本库包括：94个字符，8种大小，4种字体（正常，粗体，斜体，斜粗体），每种20个样本，共60160个样本。
与UIC提供的字体库不同的是，tesseract提供的是标准印刷体字体库的识别，而UIC提供是手写体handwriting的特征数据。

数据之美提到，G公司（应该就是google了）的研究结果表明，在自然语言与机器翻译领域，简单模型加上大量有效样本数据，比复杂模型加上小样本数据，有效的多。这个结论应该适用机器学习的很多领域。运算足够快，样本足够大，即使简单的模型，效果可能会出人意料。
由此可见，收集有效的、大量的样本库是多么的重要。

本回答由提问者推荐