数据抓取技术如何保证数据的准确性?
2017-08-02 · 百度知道合伙人官方认证企业
育知同创教育
1【专注:Python+人工智能|Java大数据|HTML5培训】 2【免费提供名师直播课堂、公开课及视频教程】 3【地址:北京市昌平区三旗百汇物美大卖场2层,微信公众号:yuzhitc】
向TA提问
关注
展开全部
要做到准确,必然要对数据流过程的中的每个环节的元数据有所掌控,比如,正常传输了多少数据,由于格式错误而不能继续流向下一个环节的数据又有多少等等这样的元数据。
要自己做到这些,需要付出不少的努力,也就是每个环节你都需要去收集统计信息,或者转储错误数据,而一旦有一个这样的框架工具帮你完成这些工作,那这一切就没有那么复杂了。
最后,推荐一个框架性质的工具-Apache NIFI,帮你以可视化的形式设计、组织数据流,并提供了多种的数据的输入、处理、输出接口,并且提供了可靠性的保证。
要自己做到这些,需要付出不少的努力,也就是每个环节你都需要去收集统计信息,或者转储错误数据,而一旦有一个这样的框架工具帮你完成这些工作,那这一切就没有那么复杂了。
最后,推荐一个框架性质的工具-Apache NIFI,帮你以可视化的形式设计、组织数据流,并提供了多种的数据的输入、处理、输出接口,并且提供了可靠性的保证。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询