python爬虫怎么去掉网页中的body内容?

怎么用正则表达式去掉body里面的内容,我爬取的内容在body之外,只有分成两部分才能爬取到数据... 怎么用正则表达式去掉body里面的内容,我爬取的内容在body之外,只有分成两部分才能爬取到数据 展开
 我来答
宿舍总动员

2020-12-25 · TA获得超过8374个赞
知道大有可为答主
回答量:1.3万
采纳率:71%
帮助的人:1999万
展开全部
k可以选用xpath来抓取指定内容,比正则更准确。

如果一定要用正则表达式,那么可以用更精准饿的匹配,要看你抓dehtml里面body部分还有什么特点。
希望我的回答对你有帮助
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式