如何在windows上编译Tesseract OCR / quweiji

 我来答

1个回答

#热议# 不吃早饭真的会得胆结石吗？

坦然还温和的小才俊9
2017-07-27 · TA获得超过577个赞

知道小有建树答主

回答量：1634

采纳率：81%

帮助的人：408万

我也去答题访问个人页

关注

展开全部

最近要用java实现一个验证码识别系统，选了半天之后最终决定用Tesseract-OCR作为识别引擎。既然是java+Tesseract-OCR，自然就首选Tess4J。由于Tess4J直接且仅提供了编译成dll的3.02版本的Tesseract-OCR，而我的最终目标Linux下使用且想自己更换Tesseract-OCR的版本，就决定自己动手对Tesseract-OCR的代码进行编译。而这篇文章就是这次研究的中间产物。
虽然Tess4J目前支持的是Tesseract-OCR 3.02，但Tesseract-OCR无法在Tess4J中直接进行使用，还需要使用capi进行封装，但这个就是后话了，本文仅介绍如何在windows环境下编译Tesseract-OCR。

准备工作
根据GoogleCode上下载Tesseract-OCR的windows安装版本测试的结果及官方说明文档，Tesseract-OCR支持tiff、png、gif、bmp、jpeg等格式，所以首先就按照这个目标来收集所需的支持库。由于最终目标是在Linux下编译成功，所以我选择了msys+tdm-gcc来模拟Linux下的编译过程。

需要下载的库有：
1) zlib-1.2.7
2) libpng-1.5.10
3) giflib-4.1.6
4) libungif-4.1.4(这个似乎在最终的编译过程中没有起作用)
5) jpeg-8d
6) jbigkit-2.0
7) tiff-3.9.5
8) libwebp-0.1.3 9) leptonica-1.68

编译环境推荐使用最新的msys和tdm-gcc：
1) msys可以通过下载mingw-get-insta-20120426进行安装。

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如何在windows上编译Tesseract OCR / quweiji

其他类似问题

为你推荐：