Python打开网页并另存为静态html怎么实现 5

当前网页中包含有Javascript动态生成网页的内容,想要将当前网页的所有内容及格式保存为静态的html,如何实现?Python目前能实现保存网页,但是是保存原网页的源... 当前网页中包含有Javascript动态生成网页的内容,想要将当前网页的所有内容及格式保存为静态的html,如何实现?
Python目前能实现保存网页,但是是保存原网页的源码,未能实现将所有内容及格式保存为静态html。
展开
 我来答
mikemelon2012
2015-08-06 · TA获得超过3633个赞
知道大有可为答主
回答量:938
采纳率:87%
帮助的人:390万
展开全部

用Python的requests库解决这个问题比较简单,例程如下:


import sys
import requests

reload(sys)
sys.setdefaultencoding('utf-8')

r=requests.get('xxx网址')
fh=open('test.html','w')
fh.write(r.text)
fh.close()


说明一下,requests库不是Python内置的,不过很流行,很多发行版都带,没带的话就去requests官网去下载,或者用 pip install requests命令安装最新版。


这个程序里在保存文件前,还需要把字符编码设置一下,用的是自带的sys库。

galaas
2012-06-16 · TA获得超过370个赞
知道小有建树答主
回答量:191
采纳率:0%
帮助的人:194万
展开全部
网页上的JS是在浏览器中解释执行和渲染的,python无法解释JS代码,因此无法直接获取结果,目前倒是有一些第三方的库允许在python中执行js代码,但用于网页解析比较麻烦

你可以考虑使用pywin32这个库,调用pywin32在内存中控制IE打开你需要访问的页面,然后获取结果
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式