
python网络爬虫可以干啥
2018-08-20
以下内容,引用自知乎数据工程师何明科。我觉得他说得很详尽,一点都不空泛~
1、知乎:抓取并汇总所有的答案,方便大家阅读,找出2015年最热门和最衰落的行业。
2、汽车之家大数据画像:利用论坛发言的抓取以及NLP,对各种车型的车主做画像。
3、天猫、京东、淘宝等电商网站:抓取各大电商的评论及销量数据,对各种商品(颗粒度可到款式)沿时间序列的销量以及用户的消费场景进行分析。甚至还可以根据用户评价做情感分析,实时监控产品在消费者心目中的形象,对新发布的产品及时监控,以便调整策略。
4、58同城的房产、安居客、Q房网、搜房等房产网站:抓取房产买卖及租售信息,对热热闹闹的房价问题进行分析。
5、大众点评、美团网等餐饮及消费类网站:抓取各种店面的开业情况以及用户消费和评价,了解周边变化的口味,所谓是“舌尖上的爬虫”。以及各种变化的口味,比如:啤酒在衰退,重庆小面在崛起。
6、58同城等分类信息网站:抓取招商加盟的数据,对定价进行分析,帮助网友解惑。
7、拉勾网、中华英才网等招聘网站:抓取各类职位信息,分析最热门的职位以及薪水。
8、挂号网等医疗信息网站:抓取医生信息并于宏观情况进行交叉对比。
9、应用宝等App市场:对各个App的发展情况进行跟踪及预测。
10、携程、去哪儿及12306等交通出行类网站:对航班及高铁等信息进行抓取,能从一个侧面反映经济是否正在走入下行通道。
11、雪球等财经类网站:抓取雪球KOL或者高回报用户的行为,找出推荐股票。
12、58同城二手车、易车等汽车类网站:找出最佳的买车时间以及最保值的汽车。
13、神州租车、一嗨租车等租车类网站:抓取它们列举出来的租车信息,长期跟踪租车价格及数量等信息。
14、各类信托网站:通过抓取信托的数据,了解信托项目的类型及规模。
想获取更多IT类资料,可以到优就业官网看哦~
广告 您可能关注的内容 |