python可以爬取本地html页面信息吗

 我来答
kyotrue
2017-07-08 · TA获得超过1.5万个赞
知道大有可为答主
回答量:2.3万
采纳率:75%
帮助的人:6792万
展开全部
本地的不叫爬取了吧,直接读入文件就完了。
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
催命鬼儿xp
2019-10-25 · TA获得超过326个赞
知道答主
回答量:147
采纳率:100%
帮助的人:5万
展开全部
#coding=utf-8
from bs4 import BeautifulSoup
with open('index.html', 'r') as file:
fcontent = file.read()

sp = BeautifulSoup(fcontent, 'html.parser')

t = 'new_text_for_replacement'

# replace the paragraph using `replace_with` method
sp.find(itemprop='someprop').replace_with(t)

# open another file for writing
with open('output.html'蔽银银, 'w') as fp:
# write the current soup content
fp.write(sp.prettify())
如果要替换段落的内容而不搏碰是段落元素本身,可以设置.string属性。

sp.find(itemprop='someprop'宏宴).string = t
赞0收藏0评论0分享
用户回答回答于 2018-07-26
问题取决于你搜索标准的方式,尝试更改以下代码:

print(sp.replace(sp.find(itemprop="someprop").text,t))
对此:

print(sp.replace(sp.find({"itemprop":"someprop"}).text,t))
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式