如何在scrapy框架下用python爬取json文件

 我来答
传闻中的张先生Y
2017-04-18 · 超过21用户采纳过TA的回答
知道答主
回答量:40
采纳率:100%
帮助的人:18.2万
展开全部
#coding=utf-8
import sys
import scrapy
import urllib2
import re,requests,json
from scrapy.http import Request
reload(sys)
sys.setdefaultencoding('utf8')

class projectSpider(scrapy.Spider):
    name = "youproject"
    #allowed_domains = ["youproject.com"]
    start_urls = (
        "http://p.3.cn/prices/mgets?&type=3652063&pduid=3652063&skuIds=J_3652063",
        #京东商品获取价格的链接
    )
def parse(self,response):
    #response.url是京东价格的例子,所请求的数据就是json,其请求后的数据为:[{"id":"J_3652063","p":"1299.00","m":"1499.00","op":"1299.00"}]
    json_date = json.loads(response.body_as_unicode())
    price = json_date [0]['p'] #获取的就是price的价格
    print price # u'1299.00'
贰达扬寻巧
2019-10-09 · TA获得超过3970个赞
知道大有可为答主
回答量:3096
采纳率:30%
帮助的人:469万
展开全部
和爬取HTML其实一样,都是走HTTP协议的格式化文本,就content
type不一样而已,与HTML、XML不同的是,JSON是文件或者模板的的可能性都很小,绝大多数应该都是后端直接动态生成的。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式