python 根据规律生成url列表然后在下载做一个爬虫 10

importurllibimportrequestsimportosurl='http://188.161.79.8/qiongzhong/document/downlo... import urllib
import requests
import os
url = 'http://188.161.79.8/qiongzhong/document/downloadFile.jsp?FILENAME=docAttach00290138802.doc'#我想把docAttach00290138802.doc里面的数字替换掉，从000000000000开始，一直循环下去，能下载的就下载，不能下载的就跳过。
r = requests.get(url)
b='333'
with open(b,"wb") as code:
code.write(r.content)

我就只能写到这里，哪位大神帮帮忙。。。展开

 我来答

2个回答

#热议# 应届生在签三方时要注意什么？

匿名用户
2016-05-24

展开全部

用爬虫跟踪下一页的方法是自己模拟点击下一页连接，然后发出新的请求；
参考例子如下：
item1 = Item()
yield item1
item2 = Item()
yield item2
req = Request(url='下一页的链接', callback=self.parse)
yield req
注意：使用yield时不要用return语句。

已赞过 已踩过<

评论收起

yujikang
2016-05-20 · 超过13用户采纳过TA的回答

知道答主

回答量：14

采纳率：100%

帮助的人：19万

我也去答题访问个人页

关注

展开全部

import requests

for index in range(000000000000, 999999999999):
    try:
        filename = "%s.doc" % index
        url = 'http://188.161.79.8/qiongzhong/document/downloadFile.jsp?FILENAME=' + filename
        r = requests.get(url)
        with open(filename, "wb") as code:
            code.write(r.content)
    except Exception, e:
        print(str(e))
        continue  # 出现异常忽略

本回答被网友采纳

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

资料下载标准版-资料文档库-全文阅读下载

资料下载专题资料下载，不用四处查资料，360文库海量精选资料下载全行业资料覆盖，千万文档即刻下载，享专属优惠!

wenku.so.com广告

宝塔面板一款提升提升服务器配置效率的好帮手

操作简单，只需轻松点击鼠标就能部署一键配置服务器且功能丰富各种功能一应俱全。只需要轻松地点击鼠标，就可以一键配置服务器部署各种运行环境的运维工具。

www.bt.cn广告

宝塔面板-安全高效的服务器运维面板;

宝塔linux面板支持tomcat等多系统运行环境，支持一键LAMP/LNMP/集群/监控/网站/FTP/数据库/JAVA等100多项服务器管理功能

www.bt.cn广告

python 根据规律生成url列表然后在下载 做一个爬虫 10

您可能关注的内容

其他类似问题

为你推荐：

python 根据规律生成url列表然后在下载做一个爬虫 10