python中通过正则表达式找到标签 5
以下是我代码html=open('xxx.htm').read()soup=BeautifulSoup(html.decode('gbk').encode('utf-8'...
以下是我代码
html = open('xxx.htm').read()
soup = BeautifulSoup(html.decode('gbk').encode('utf-8'), "html5lib")
result = soup.body.find_all('td',class_="text_left",width="22%")
print result
我想在html里找到这样一个标签:<td class="text_left" width="22%">所属行业:</td>
因为在整个html中这样的标签很多:'td',class_="text_left",width="22%"还没有找到我想要的结果.可以肯定"所属行业"这四个关键字是存在的.本来我想写成这样的:result = soup.body.find_all('td',class_="text_left",width="22%",text = re.compile("所属行业")),但是这样是不对的.有没有这样一个思路,可以在后面加个正则表达式的?或者有办法获取到他的这个标签的:<td class="text_left" width="22%">所属行业:</td>.是要标签哦 展开
html = open('xxx.htm').read()
soup = BeautifulSoup(html.decode('gbk').encode('utf-8'), "html5lib")
result = soup.body.find_all('td',class_="text_left",width="22%")
print result
我想在html里找到这样一个标签:<td class="text_left" width="22%">所属行业:</td>
因为在整个html中这样的标签很多:'td',class_="text_left",width="22%"还没有找到我想要的结果.可以肯定"所属行业"这四个关键字是存在的.本来我想写成这样的:result = soup.body.find_all('td',class_="text_left",width="22%",text = re.compile("所属行业")),但是这样是不对的.有没有这样一个思路,可以在后面加个正则表达式的?或者有办法获取到他的这个标签的:<td class="text_left" width="22%">所属行业:</td>.是要标签哦 展开
1个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询