python提取标签内容的问题! 5
我使用BeautifulSoup提取网页的标签,但是提取出了3段符合规则的标签,但我只想要其中一段标签内的内容,请问代码应该怎么写,新手,望各位大神帮忙!!代码:fort...
我使用BeautifulSoup提取网页的标签,但是提取出了3段符合规则的标签,但我只想要其中一段标签内的内容,请问代码应该怎么写,新手,望各位大神帮忙!!
代码:for tag in soup.find_all('ul'):
print tag
返回的内容为:
<ul><li id="mn_forum"><a hidefocus="true" href="" title=""><span></span></a></li><li href="" title="每日签到">签到<span>每日签到</span></a></li></ul>
<ul class="p_pop" id="scbar_type_menu" style="display: none;"><li><a class="curtype" href="javascript:;" rel="forum">甯栧瓙</a></li><li><a href="javascript:;" rel="user">鐢ㄦ埛</a></li></ul>
<ul class="xl xl2 cl">
<li>用户组: <span style="color:"></span> </li>
<li>注册时间: 2009-2-23 17:18</li>
<li>最后访问: 2009-2-23 17:18</li>
<li>上次活动时间: 2009-2-23 17:18</li>
<li>上次发表时间: 0</li>
<li>上次邮件通知: 0</li>
<li>所在时区: 使用系统默认</li>
</ul>
<ul class="pbm mbm bbda cl xl xl2 ">
<li>空间访问量: 1</li>
<li>好友数: 0</li>
<li>帖子数: 0</li>
<li>主题数: 0</li>
<li>精华数: 0</li>
<li>记录数: 0</li>
<li>日志数: 0</li>
<li>相册数: 0</li>
<li>分享数: 0</li>
<li>已用空间: 0 B </li>
</ul>
我只想要 <li>最后访问: 2009-2-23 17:18</li> 内的 ‘最后访问: 2009-2-23 17:18’,请问该怎么操作?? 展开
代码:for tag in soup.find_all('ul'):
print tag
返回的内容为:
<ul><li id="mn_forum"><a hidefocus="true" href="" title=""><span></span></a></li><li href="" title="每日签到">签到<span>每日签到</span></a></li></ul>
<ul class="p_pop" id="scbar_type_menu" style="display: none;"><li><a class="curtype" href="javascript:;" rel="forum">甯栧瓙</a></li><li><a href="javascript:;" rel="user">鐢ㄦ埛</a></li></ul>
<ul class="xl xl2 cl">
<li>用户组: <span style="color:"></span> </li>
<li>注册时间: 2009-2-23 17:18</li>
<li>最后访问: 2009-2-23 17:18</li>
<li>上次活动时间: 2009-2-23 17:18</li>
<li>上次发表时间: 0</li>
<li>上次邮件通知: 0</li>
<li>所在时区: 使用系统默认</li>
</ul>
<ul class="pbm mbm bbda cl xl xl2 ">
<li>空间访问量: 1</li>
<li>好友数: 0</li>
<li>帖子数: 0</li>
<li>主题数: 0</li>
<li>精华数: 0</li>
<li>记录数: 0</li>
<li>日志数: 0</li>
<li>相册数: 0</li>
<li>分享数: 0</li>
<li>已用空间: 0 B </li>
</ul>
我只想要 <li>最后访问: 2009-2-23 17:18</li> 内的 ‘最后访问: 2009-2-23 17:18’,请问该怎么操作?? 展开
2个回答
展开全部
首先你得提需求,而且要提详细一些。
举例:如果你就想要“最后访问: 2009-2-23 17:18”,那就当常量用就行了,不需要提取。
所以这行的特点是什么呢?带"最后访问"四个字?也就是说寻找网页中第一次出现"最后访问"四个字的地方?
举例:如果你就想要“最后访问: 2009-2-23 17:18”,那就当常量用就行了,不需要提取。
所以这行的特点是什么呢?带"最后访问"四个字?也就是说寻找网页中第一次出现"最后访问"四个字的地方?
追问
是的,也就是在这么多标签中,只要提取文字‘最后访问: 2009-2-23 17:18’,谢谢!
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询