python BeautifulSoup获取a标签问题 5

<trclass="row"onmouseover="this.className='row1'"onmouseout="this.className='row'"><t... <tr class="row" onmouseover="this.className='row1'" onmouseout="this.className='row'">
<td height="20"><a href="/gc/123.html" target="_blank">皇马</a></td>
<td align="center">皇马</td>
<td align="center">大陆</td>

<td align="center"><a href="/gc/123.html" target="_blank">点击进入</a></td>
<td align="center">12月26日</td>
</tr>

如上述html所示网页中存在大量的<tr class="row" onmouseover="this.className='row1'" onmouseout="this.className='row'">
所以我想先用函数 findAll找到上述tr标签之后再去获取a标签中的链接/gc/123.html
该如何做呢？
采用BeautifulSoup 可以这样做
import urllib
import sys
import re
from BeautifulSoup import BeautifulSoup

fp = open("文档",'r')
for eachurl in fp:
urlhandle = urllib.urlopen(eachurl)
content = urlhandle.read()
parser = BeautifulSoup(content)
res = parser.findAll('tr',{'onmouseout':'this.className=\'row\'','onmouseover':'this.className=\'row1\''})
for my in res:
state = []
for a in my.a['href']:
if a != None:
state.append(a)
print ''.join(state)
fp.close() 展开

 我来答

3个回答

#合辑# 机票是越早买越便宜吗？

againinput4
2013-02-01 · TA获得超过2407个赞

知道大有可为答主

回答量：1446

采纳率：70%

帮助的人：641万

我也去答题访问个人页

关注

展开全部

还是BeautifulSoup好用的。
详见我的教程：
【教程】Python中第三方的用于解析HTML的库：BeautifulSoup

(此处不能贴地址，可以通过google搜标题，即可找到帖子地址)

已赞过 已踩过<

评论收起

匿名用户
2011-12-27

展开全部

[url=http://dzh.mop.com]大杂烩[/url]

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python BeautifulSoup获取a标签问题 5

其他类似问题

为你推荐：