为什么从事大数据行业，一定要学习Python?

 我来答

3个回答

2021-11-28

展开全部

你好，这主要是因为Python在处理大数据方面有着得天独厚的优势。
以后您如果再遇到类似的问题，可以按照下面的思路去解决：
1、发现问题:往往生活在世界中，时时刻刻都处在这各种各样的矛盾中，当某些矛盾放映到意识中时,个体才发现他是个问题，并要求设法去解决它。这就是发现问题的阶段。从问题的解决的阶段性看，这是第一阶段，是解决问题的前提。
2、分析问题:要解决所发现的问题，必须明确问题的性质，也就是弄清楚有哪些矛盾、哪些矛盾方面，他们之间有什么关系,以明确所要解决的问题要达到什么结果，所必须具备的条件、其间的关系和已具有哪些条件,从而找出重要的矛盾、关键矛盾之所在。
3、提出假设:在分析问题的基础上，提出解决问题的假设,即可采用的解决方案,其中包括采取什么原则和具体的途径和方法，但所有这些往往不是简单现成的，而且有多种多样的可能。但提出假设是问题解决的关键阶段，正确的假设引导问题顺利得到解决,不正确不恰当的假设则使问题的解决走弯路或导向歧途。
4、校验假设:假设只是提出n种可能解决方案,还不能保证问题必定能获得解决，所以问题解决的最后一步是对假设进行检验。不论哪种检验如果未能获得预期结果，必须重新另提出假设再进行检验，直至获得正确结果，问题才算解决。

已赞过 已踩过<

评论收起

河南新华电脑学院
2021-11-29 · 百度认证:河南新华电脑学院有限公司官方账号

河南新华电脑学院

河南新华电脑学院隶属于IT教育知名品牌——新华互联网科技，是具有一定影响力的直营电脑教育品牌。

向TA提问

关注

展开全部

它的语法简单清晰,以实用为主,是门十分朴素的语言。同时,它还是编程语言中的“和事佬”,被人戏称为胶水语言。因为它能够将其他语言制作的各种模块很轻松的联结在一起。
2.如果将Python语言拟人化,它绝对属于“老好人”的那一类,让人容易亲近,人们与它交流并...
3.除此之外,Python这只小虫子还受到了大数据老大哥Google的青睐。Google的...
4.Python还拥有一系列非常优秀的库,这省了你编程中的很多时间。尤其是在人工智能和机器...

已赞过 已踩过<

评论收起

匿名用户

2021-11-28

展开全部

大数据的数据从哪里来?除了部分企业有能力自己产生大量的数据，大部分时候，是需要靠爬虫来抓取互联网数据来做分析。
网络爬虫是Python的传统强势领域，最流行的爬虫框架Scrapy，HTTP工具包urlib2，HTML解析工具beautifulsoup，XML解析器lxml，等等，都是能够独当一面的类库。
不过，网络爬虫并不仅仅是打开网页，解析HTML这么简单。高效的爬虫要能够支持大量灵活的并发操作，常常要能够同时几千甚至上万个网页同时抓取，传统的线程池方式资源浪费比较大，线程数上千之后系统资源基本上就全浪费在线程调度上了。Python由于能够很好的支持协程(Coroutine)操作，基于此发展起来很多并发库，如Gevent，Eventlet，还有Celery之类的分布式任务框架。被认为是比AMQP更高效的ZeroMQ也是最早就提供了Python版本。有了对高并发的支持，网络爬虫才真正可以达到大数据规模。
抓取下来的数据，需要做分词处理，Python在这方面也不逊色，著名的自然语言处理程序包NLTK，还有专门做中文分词的Jieba，都是做分词的利器。
数据处理
万事俱备，只欠东风。这东风，就是数据处理算法。从统计理论，到数据挖掘，机器学习，再到最近几年提出来的深度学习理论，数据科学正处于百花齐放的时代。数据科学家们都用什么编程?
如果是在理论研究领域，R语言也许是最受数据科学家欢迎的，但是R语言的问题也很明显，因为是统计学家们创建了R语言，所以其语法略显怪异。而且R语言要想实现大规模分布式系统，还需要很长一段时间的工程之路要走。所以很多公司使用R语言做原型试验，算法确定之后，再翻译成工程语言。
Python也是数据科学家最喜欢的语言之一。和R语言不同，Python本身就是一门工程性语言，数据科学家用Python实现的算法，可以直接用在产品中，这对于大数据初创公司节省成本是非常有帮助的。正式因为数据科学家对Python和R的热爱，Spark为了讨好数据科学家，对这两种语言提供了非常好的支持。
Python的数据处理相关类库非常多。高性能的科学计算类库NumPy和SciPy，给其他高级算法打了非常好的基础，matploglib让Python画图变得像Matlab一样简单。Scikit-learn和Milk实现了很多机器学习算法，基于这两个库实现的Pylearn2，是深度学习领域的重要成员。Theano利用GPU加速，实现了高性能数学符号计算和多维矩阵计算。当然，还有Pandas，一个在工程领域已经广泛使用的大数据处理类库，其DataFrame的设计借鉴自R语言，后来又启发了Spark项目实现了类似机制。
对了，还有iPython，这个工具如此有用，以至于差点把他当成标准库而忘了介绍。iPython是一个交互式Python运行环境，能够实时看到每一段Python代码的结果。默认情况下，iPython运行在命令行，可以执行ipython notebook在网页中运行。用matplotlib绘制的图可以直接嵌入式的显示在iPython Notebook中。
iPython Notebook的笔记本文件可以共享给其他人，这样其他人就可以在自己的环境中重现你的工作成果;如果对方没有运行环境，还可以直接转换成HTML或者PDF。
为什么是Python
正是因为应用开发工程师、运维工程师、数据科学家都喜欢Python，才使得Python成为大数据系统的全栈式开发语言。
对于开发工程师而言，Python的优雅和简洁无疑是最大的吸引力，在Python交互式环境中，执行import this，读一读Python之禅，你就明白Python为什么如此吸引人。Python社区一直非常有活力，和NodeJS社区软件包爆炸式增长不同，Python的软件包增长速度一直比较稳定，同时软件包的质量也相对较高。有很多人诟病Python对于空格的要求过于苛刻，但正是因为这个要求，才使得Python在做大型项目时比其他语言有优势。OpenStack项目总共超过200万行代码，证明了这一点。
对于运维工程师而言，Python的最大优势在于，几乎所有Linux发行版都内置了Python解释器。Shell虽然功能强大，但毕竟语法不够优雅，写比较复杂的任务会很痛苦。用Python替代Shell，做一些复杂的任务，对运维人员来说，是一次解放。
对于数据科学家而言，Python简单又不失强大。和C/C++相比，不用做很多的底层工作，可以快速进行模型验证;和Java相比，Python语法简洁，表达能力强，同样的工作只需要1/3代码;和Matlab，Octave相比，Python的工程成熟度更高。不止一个编程大牛表达过，Python是最适合作为大学计算机科学编程课程使用的语言——MIT的计算机入门课程就是使用的Python——因为Python能够让人学到编程最重要的东西——如何解决问题。

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

python培训哪里好，慕课网在线课程学习，对标企业招聘要求

www.imooc.com

为什么从事大数据行业，一定要学习Python?

您可能关注的内容

其他类似问题

为你推荐：