验证码的识别

 我来答
会哭的礼物17
2022-07-08 · TA获得超过1.2万个赞
知道大有可为答主
回答量:5903
采纳率:100%
帮助的人:31.7万
展开全部

验证码是一种反爬虫的措施,目前的验证码主要有图像验证码、极验滑动验证码、点触验证码、微博宫格验证码等。根据不同类型的验证码,有以下识别的方法。

利用OCR字符识别技术来实现,需要安装tesserocr库进行识别。 因为验证码图片的背景有些多余的线条、颜色会干扰识别效果,因此可以在识别前对图片进行二值化处理或灰度处理

它通过拖动滑块来拼合图像进而实现验证。识别的主要思路: 利用selenium来模拟点击验证按钮,获取包含缺口的图片,将原图与其对比,识别出缺口位置,模拟拖动。模拟拖动时需要注意,不能匀速,因为人无法做到匀速拖动,因此会导致识别识别。比较好的办法就是,模拟加速和减速运动来进行拖动。前段先加速后段在减速。

这种验证码主要有两种,一种是点击图中所以符合要求的图片,二是按照顺序点击指定的文字。对于这种验证码,可以利用第三方平台来实现识别,比如超级鹰。具体思路 将验证码的图片传入到第三方平台上,然后根据第三方平台范围的坐标位置,进行依次点击。

这种验证码的宫格之间会有一条指示连线,指示了用户需要滑动的轨迹。如果要识别这种验证码,就需要识别箭头的指示方向,因此需要首先找到所有箭头的位置,然后计算像素点的变化规律。这个方法比较麻烦。对于这种验证码可以采用另一种思路: 模板匹配,即首先将所有可能出现的验证码图片收集下来,这样每个图片的滑动顺序已知,构成一个模板库。在每一次识别时,将原图与模板库中的图片进行匹配即可。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式