如何用python抓取这个网页的内容?

http://ipub.exuezhe.com/qkpaper.html?id=680541在这个网页中,将标题作者作者介绍原发信息内容提要关键词标题注释期刊名称复印期号... http://ipub.exuezhe.com/qkpaper.html?id=680541
在这个网页中,将
标题 作者 作者介绍 原发信息 内容提要 关键词 标题注释 期刊名称 复印期号
这几栏的内容,填充在excel相应区域里
展开
 我来答
数阔八爪鱼采集器丨RPA机器人
2021-08-17 · 前往八爪鱼RPA应用市场,免费获取机器人
数阔八爪鱼采集器丨RPA机器人
向TA提问
展开全部
Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示:
复制代码代码如下:

import urllib2
url="网址"
up=urllib2.urlopen(url)#打开目标页面,存入变量up
cont=up.read()#从up中读入该HTML文件
key1='<a href="http'#设置关键字1
key2="target"#设置关键字2
pa=cont.find(key1)#找出关键字1的位置
pt=cont.find(key2,pa)#找出关键字2的位置(从字1后面开始查找)
urlx=cont[pa:pt]#得到关键字1与关键字2之间的内容(即想要的数据)
print urlx
玩转数据处理
2020-01-12 · 数据处理,Python,dotnet
玩转数据处理
采纳数:1613 获赞数:3794

向TA提问 私信TA
展开全部
如果包含动态内容可以考虑使用Selenium浏览器自动化测试框架,当然找人有偿服务也可以
本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式