如何用 HTMLParser 提取一个网页的所有url
2017-10-15
展开全部
import urllib2
import re
html_page = urllib2.urlopen("xxxxx")
soup = BeautifulSoup(html_page)
for link in soup.findAll('a'):
print link.get('href')
import re
html_page = urllib2.urlopen("xxxxx")
soup = BeautifulSoup(html_page)
for link in soup.findAll('a'):
print link.get('href')
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询