用python的scrapy框架写的爬取网易新闻的爬虫,有些正则表达式不知道怎么写的?大家帮帮忙~ 10
第一个问题是,用scrapy框架爬取网易新闻和评论的时候,在spider里面继承了crawlspider这个类,里面的start_urls,是怎么找出来的?第二个问题是,...
第一个问题是,用scrapy框架爬取网易新闻和评论的时候,在spider里面继承了crawlspider这个类,里面的start_urls,是怎么找出来的?第二个问题是,抓取评论的时候,评论是json格式的嵌套,那评论链接的正则表达式是从哪里找到的呢?我知道是从网页源代码里面找出来的,可是具体是那一部分呢?求大侠们解答!
展开
1个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询