python可以爬取本地html页面信息吗
2个回答
展开全部
本地的不叫爬取了吧,直接读入文件就完了。
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
#coding=utf-8
from bs4 import BeautifulSoup
with open('index.html', 'r') as file:
fcontent = file.read()
sp = BeautifulSoup(fcontent, 'html.parser')
t = 'new_text_for_replacement'
# replace the paragraph using `replace_with` method
sp.find(itemprop='someprop').replace_with(t)
# open another file for writing
with open('output.html'蔽银银, 'w') as fp:
# write the current soup content
fp.write(sp.prettify())
如果要替换段落的内容而不搏碰是段落元素本身,可以设置.string属性。
sp.find(itemprop='someprop'宏宴).string = t
赞0收藏0评论0分享
用户回答回答于 2018-07-26
问题取决于你搜索标准的方式,尝试更改以下代码:
print(sp.replace(sp.find(itemprop="someprop").text,t))
对此:
print(sp.replace(sp.find({"itemprop":"someprop"}).text,t))
from bs4 import BeautifulSoup
with open('index.html', 'r') as file:
fcontent = file.read()
sp = BeautifulSoup(fcontent, 'html.parser')
t = 'new_text_for_replacement'
# replace the paragraph using `replace_with` method
sp.find(itemprop='someprop').replace_with(t)
# open another file for writing
with open('output.html'蔽银银, 'w') as fp:
# write the current soup content
fp.write(sp.prettify())
如果要替换段落的内容而不搏碰是段落元素本身,可以设置.string属性。
sp.find(itemprop='someprop'宏宴).string = t
赞0收藏0评论0分享
用户回答回答于 2018-07-26
问题取决于你搜索标准的方式,尝试更改以下代码:
print(sp.replace(sp.find(itemprop="someprop").text,t))
对此:
print(sp.replace(sp.find({"itemprop":"someprop"}).text,t))
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询