如何用python解析一个网页并提取其内容
3个回答
展开全部
用程序模拟访问网页获得网页内容的话就用urllib和urllib2来模拟请求
若是要截取网页中的部分内容,那就先获得全部html内容,然后直接用re根据html标签来匹配分段,然后获取
若是要截取网页中的部分内容,那就先获得全部html内容,然后直接用re根据html标签来匹配分段,然后获取
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
你可以用用现成的python模板:beautifulsoup。
或者最起码你得了解Python的正则,然后自己去用正则解析网页。
或者最起码你得了解Python的正则,然后自己去用正则解析网页。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
urllib urllib2 re这些模块对你或许有帮助
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询