如何在windows上编译Tesseract OCR

 我来答

1个回答

#热议# 生活中有哪些实用的心理学知识？

笑喘是病得抽
2017-07-19 · TA获得超过925个赞

知道大有可为答主

回答量：2140

采纳率：98%

帮助的人：2242万

我也去答题访问个人页

关注

展开全部

最近要用java实现一个验证码识别系统，选了半天之后最终决定用Tesseract-OCR作为识别引擎。既然是java+Tesseract-OCR，自然就首选Tess4J。由于Tess4J直接且仅提供了编译成dll的3.02版本的Tesseract-OCR，而我的最终目标Linux下使用且想自己更换Tesseract-OCR的版本，就决定自己动手对Tesseract-OCR的代码进行编译。而这篇文章就是这次研究的中间产物。
虽然Tess4J目前支持的是Tesseract-OCR 3.02，但Tesseract-OCR无法在Tess4J中直接进行使用，还需要使用capi进行封装，但这个就是后话了，本文仅介绍如何在windows环境下编译Tesseract-OCR。

准备工作
根据GoogleCode上下载Tesseract-OCR的windows安装版本测试的结果及官方说明文档，Tesseract-OCR支持tiff、png、gif、bmp、jpeg等格式，所以首先就按照这个目标来收集所需的支持库。由于最终目标是在Linux下编译成功，所以我选择了msys+tdm-gcc来模拟Linux下的编译过程。

需要下载的库有：
1) zlib-1.2.7
2) libpng-1.5.10
3) giflib-4.1.6
4) libungif-4.1.4(这个似乎在最终的编译过程中没有起作用)
5) jpeg-8d
6) jbigkit-2.0
7) tiff-3.9.5
8) libwebp-0.1.3 9) leptonica-1.68

编译环境推荐使用最新的msys和tdm-gcc：
1) msys可以通过下载mingw-get-insta-20120426进行安装。
2) tdm-gcc推荐使用4.5.2版本。

本回答由提问者推荐

已赞过 已踩过<

评论收起

AiPPT
2024-09-19 广告

随着AI技术的飞速发展，如今市面上涌现了许多实用易操作的AI生成工具1、简介：AiPPT: 这款AI工具智能理解用户输入的主题，提供“AI智能生成”和“导入本地大纲”的选项，生成的PPT内容丰富多样，可自由编辑和添加元素，图表类型包括柱状图... 点击进入详情页

本回答由AiPPT提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如何在windows上编译Tesseract OCR

其他类似问题

为你推荐：