Python 使用 BeautifulSoup解析html的问题

<trclass="datelisthead"><td>学年</td><td>学期</td><td>选课课号</td><td>课程名称</td><td>课程性质</td>... <tr class="datelisthead">
<td>学年</td><td>学期</td><td>选课课号</td><td>课程名称</td><td>课程性质</td><td>期末考试成绩</td><td>总评成绩</td><td>学分</td><td>绩点</td>
</tr><tr>
<td>2008-2009</td><td>1</td><td>(2008-2009-1)-000000001-1020000726-6</td><td>体育1(蓝球)</td><td>必修课</td><td> </td><td>80</td><td>1.00</td><td>3</td>
</tr><tr class="alt">
<td>2008-2009</td><td>1</td><td>(2008-2009-1)-121100580-1020010079-1</td><td>思政课实践教学</td><td>必修课</td><td> </td><td>83</td><td>1.00</td><td>3.30</td>
</tr><tr>
<td>2008-2009</td><td>1</td><td>(2008-2009-1)-143140110-1020000683-1</td><td>计算机基本技能训练</td><td>必修课</td><td> </td><td>96</td><td>3.00</td><td>4.60</td>
</tr><tr class="alt">
<td>2008-2009</td><td>1</td><td>(2008-2009-1)-143158080-1020010057-1</td><td>软件工程专业导论</td><td>必修课</td><td> </td><td>90</td><td>4.00</td><td>4</td>

html中部分如上所示，我想依次提取出上面的所有汉字部分，请问怎么用BeautifulSoup来解析呢？我试了很多种函数都不行，望高手指点展开

 我来答

3个回答

#热议# 空调使用不当可能引发哪些疾病？

tim_spac
2011-04-29 · TA获得超过3629个赞

知道大有可为答主

回答量：1804

采纳率：100%

帮助的人：2073万

我也去答题访问个人页

关注

展开全部

content = '''<tr class="datelisthead">...'''

cptt = re.compile(r'[^\x00-\xff]')
print'\n'.join([a.text.encode('gbk')
for a in BeautifulSoup(content).findAll('td')
if cptt.match(a.text)])

本回答由提问者推荐

已赞过 已踩过<

评论收起

百度网友bfcb6f6
2011-04-28

知道答主

回答量：4

采纳率：0%

帮助的人：0

我也去答题访问个人页

关注

展开全部

import BeautifulSoup,re
假设htmlstr的值是你上面那些字符串
soup=BeautifulSoup.BeautifulSoup(htmlstr).findAll("td")
for i in soup:
if re.search(r'[^\x00-\xff]',i.text):
print i.text

已赞过 已踩过<

评论收起

xuyu16
2011-04-26 · 超过25用户采纳过TA的回答

知道答主

回答量：94

采纳率：0%

帮助的人：66.4万

我也去答题访问个人页

关注

展开全部

BeautifulSoup(html).findAll('td')

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

Python 使用 BeautifulSoup解析html的问题

其他类似问题

为你推荐：