学python 爬虫是不是一定要学会正则表达式

 我来答
雨后oO0
2017-07-10 · TA获得超过1537个赞
知道小有建树答主
回答量:316
采纳率:33%
帮助的人:152万
展开全部
会的话,更好,有时候会达到事半功倍的效果。比如有些网站,比如58,它的帖子页面地址是58.com/zhaopin/1234x.shtml,1234代表帖子id,zhaopin代表类目。如果你想取得帖子id。那如果你不用正则呢,你可能需要用到python中关于字符串的一些操作,比如先按照/分割一下,然后查找x.shtml,再截取。。。。那正则表达式就是.*(\d+)x.shtml,直接就可以取出id。
而且正则并不难,你用到的时候,去查一下就好了。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式