OCR乱码怎么来用正则表达式分别进行替换?
这两个乱码怎么来用正则表达式分别进行替换:1:O.07%~0.15%2:l。0~170千克或者:loo~170千克分别要被替换成:1':0.07%~0.15%2':100...
这两个乱码怎么来用正则表达式分别进行替换:
1: O.07%~0.15%
2: l。0~170千克 或者:loo~170千克
分别要被替换成:
1':0.07%~0.15%
2':100~170千克
比较简单常见的两个例子:
要求用通用的表达式来正则替换!几种高级编辑工具都有。
将原本数字中的O o l 。(全角句号)这四个符号儿(区分大小写)的乱码替换为本来的数字“0”与“1”!?并且不能将单词、缩略语或正文中其他对的地方替换,比如实际的句号们!
—— 我看过好几个教程,但我只能找到这一整串儿乱码,但不知道怎样去替换这四个OCR的乱码!也就说,我实际只是分别替换大小O和句号为零,小l为一即可。
(是尚书导出的,她汉字还可以,但标点和非汉字符号(无论全半角)识别性能太差了!)
—— 高手赐教,如果满意,可追加分数!!谢谢!
本想结分的了,输入内容已经达到长度限制
所以只好改为“补充问题”了!
问题解决了部分,但还没完全解决!
就是“子表达式”的概念之应用,(. *),哈哈。
不过,话说回来,我可有好的办法呢!
(因为 我不可能知道,更不会破解破译 汉王尚书的 程序核心—— 有些地方她的确‘很烂’!但我可以在她的基础上,把剩下的误码尽量地批量处理、修改,所以就需要借助强大的正则式了!—— 另外还有两种替换方式:普通(单词)与标记替换!—— 但问题是,这些都不能有效的足够的“建模”,完全是借助“经验的积累”,看来我需要学习文本类的编译器程序、软件儿:比如 Perl,Grep,Sed,Python,Etc.)
C++ 甚至 C-16 都可以做,但效果应该是不佳的了,至少效率不会高的嘛?!
—— 牛顿还不是要站在巨人呢的肩膀上嘛,才能找到吸引他的苹果吗?!
:凡是能正则的,一定是可以做成(如:控制台16位儿)程序(组—包)的!
:凡是软件儿不能破解甚至难得接触内核以重构的,便去尝试、试图做他|她的 外挂模式或者插件儿补丁,也是很不错的选择!双管齐下,八仙过海,修了栈道,再渡陈仓!
:正则不是万能的,但没有正则(式)是万万不行的!
附:二楼的是让我做爬虫吗?暂不 展开
1: O.07%~0.15%
2: l。0~170千克 或者:loo~170千克
分别要被替换成:
1':0.07%~0.15%
2':100~170千克
比较简单常见的两个例子:
要求用通用的表达式来正则替换!几种高级编辑工具都有。
将原本数字中的O o l 。(全角句号)这四个符号儿(区分大小写)的乱码替换为本来的数字“0”与“1”!?并且不能将单词、缩略语或正文中其他对的地方替换,比如实际的句号们!
—— 我看过好几个教程,但我只能找到这一整串儿乱码,但不知道怎样去替换这四个OCR的乱码!也就说,我实际只是分别替换大小O和句号为零,小l为一即可。
(是尚书导出的,她汉字还可以,但标点和非汉字符号(无论全半角)识别性能太差了!)
—— 高手赐教,如果满意,可追加分数!!谢谢!
本想结分的了,输入内容已经达到长度限制
所以只好改为“补充问题”了!
问题解决了部分,但还没完全解决!
就是“子表达式”的概念之应用,(. *),哈哈。
不过,话说回来,我可有好的办法呢!
(因为 我不可能知道,更不会破解破译 汉王尚书的 程序核心—— 有些地方她的确‘很烂’!但我可以在她的基础上,把剩下的误码尽量地批量处理、修改,所以就需要借助强大的正则式了!—— 另外还有两种替换方式:普通(单词)与标记替换!—— 但问题是,这些都不能有效的足够的“建模”,完全是借助“经验的积累”,看来我需要学习文本类的编译器程序、软件儿:比如 Perl,Grep,Sed,Python,Etc.)
C++ 甚至 C-16 都可以做,但效果应该是不佳的了,至少效率不会高的嘛?!
—— 牛顿还不是要站在巨人呢的肩膀上嘛,才能找到吸引他的苹果吗?!
:凡是能正则的,一定是可以做成(如:控制台16位儿)程序(组—包)的!
:凡是软件儿不能破解甚至难得接触内核以重构的,便去尝试、试图做他|她的 外挂模式或者插件儿补丁,也是很不错的选择!双管齐下,八仙过海,修了栈道,再渡陈仓!
:正则不是万能的,但没有正则(式)是万万不行的!
附:二楼的是让我做爬虫吗?暂不 展开
2个回答
2010-09-13
展开全部
在google里查一下关键字suolueyu,排名第一的就很全面
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询