使用python爬虫库re中的正则表达式爬网站,正则表达式书写应该没有问题,但是一直运行不出来?
2个回答
展开全部
如果正则表达式没有问题的话,建议先打印content,如果没有结果的话,根据爬豆瓣的经验,一般要在requests里加headers或cookies
更多追问追答
追问
打印了content,没有问题............
追答
那就是正则表达式有问题了,看你写的部分匹配代码,应该不是要抽取Js里的内容,如果是要获取html标签里的内容,建议使用相关解析库,比如beautifulsoup 解析,或通过lxml.etree用xpath或css抽取
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询