Python爬虫怎么抓取html网页的代码块

比如在这段代码中，我想抓取tablealign="center"border=7class="base_index">到<tdwidth="25%"class="head... 比如在这段代码中，我想抓取table align="center" border=7 class="base_index">到<td width="25%" class="head_td top_bottom"><a href="MinGe/Index.htm">民歌民乐</a></td>的内容，先不考虑编码的问题，为什么我用body = re.findall('<table align="center" border=7 class="base_index">(.*?)<td width="25%" class="head_td top_bottom"><a href="MinGe/Index.htm">',code,re.S)抓取之后输出的是一个list元组呢？展开

 我来答

2个回答

#合辑# 面试问优缺点怎么回答最加分？

超人影视娱乐

高粉答主

推荐于2018-02-06 · 闲来无事的影评人-关注我把

超人影视娱乐

采纳数：7757 获赞数：60596

向TA提问私信TA

关注

展开全部

mport urllib.request
import re

def getHtml(url):
page = urllib.request.urlopen(url)
html = page.read()
html = html.decode('GBK')
return html

def getMeg(html):
reg = re.compile(r'******')
meglist = re.findall(reg,html)
for meg in meglist:
with open('out.txt',mode='a',encoding='utf-8') as file:
file.write('%s\n' % meg)

if __name__ == "__main__":
html = getHtml(url)
getMeg(html)

已赞过 已踩过<

评论收起

区块城市（广州）科技发展

广告2024-12-18

python web3务实元宇宙的先行者，去中心化自治组织开放平台，轻松加入或创建你的DAO组织创新采用Web3和区块链思维，python web3真正人人可用，无需下载安装

www.gzbluedata.com

大雪花jjtd
2016-09-20 · TA获得超过437个赞

知道小有建树答主

回答量：318

采纳率：0%

帮助的人：121万

我也去答题访问个人页

关注

展开全部

范围匹配大点，像这种

re.findall('(<div class="moco-course-wrap".*?</div>)',source,re.S)

可以看下这个

http://blog.csdn.net/tangdou5682/article/details/52596863

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

元宇宙地址——点击进入网站

www.blockcity.top

菜鸟教程python3教程专为初学者设计，多领域实战

菜鸟教程python3教程零基础起步，多领域实战，手把手带你稳步胜任全能工作菜鸟教程python3教程对标企业岗位技能需求，涵盖5大热门领域，全流程实战，一站式就业

class.imooc.com广告

"Kimi AI编程助手，让代码更智能"

"Kimi AI您的智能编程助手，让编程更简单"一站式极致体验尽在Kimi~

kimi.moonshot.cn广告

Python爬虫怎么抓取html网页的代码块

您可能关注的内容

其他类似问题

为你推荐：