如何自学成为数据分析师
2019-08-05 · 大数据人才培养的机构
数据分析师的基本工作流程:
1.定义问题
确定需要的问题,以及想得出的结论。需要考虑的选项有很多,要根据所在业务去判断。常见的有:变化趋势、用户画像、影响因素、历史数据等。
2.数据获取
数据获取的方式有很多种:
一是直接从企业数据库调取,需要SQL技能去完成数据提取等的数据库管理工作。
二是获取公开数据,政府、企业、统计局等机构有。
三是通过Python编写网页爬虫。
3.数据预处理
对残缺、重复等异常数据进行清洗。
4.数据分析与建模
这个部分需要了解基本的统计分析方法、数据挖掘算法,了解不同统计方法适用的场景和适合的问题。
5.数据可视化和分析报告撰写
学习一款可视化工具,将数据通过可视化最直观的展现出来。
数据分析入门需要掌握的技能有:
1. SQL(数据库):
怎么从数据库取数据?怎么取到自己想要的特定的数据?等这些问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能。
2. excel
分析师更多的时候是在分析数据,分析数据时需要把数据放到一个文件里,就是excel。
熟练excel常用公式,学会做数据透视表,什么数据画什么图等。
3.Python或者R的基础:
必备项,也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。
4.学习一个可视化工具
如果你想往更高层次发展,上面的东西顶多只占20%,剩下的80%则是业务理解能力,目标拆解能力,根据数据需求更多新技能的学习能力。
2022-03-14 广告
以下推荐一些从入门到精通——关于学习数据分析的书籍清单!
入门篇
《深入浅出数据分析》:大头书,HeadFirst系列,内容很浅,比较适合没有基础的人作为科普读物,适合快速入门;
《统计数字会撒谎》:本文不涉及枯燥的数学公式与推理过程,通俗易懂,其实讲的都是统计学最基本的常识,可是却往往容易被人所忽视;
《谁说菜鸟不会数据分析》:不错的工具类书籍。比较浅显,适合完全没有Excel或对Excel似懂非懂的人。 讲了一些方法论的东西,但是非常的简单,不太适合对Excel熟悉的读者;
《深入浅出统计学》
:帮你快速了解统计学相关的知识。
进阶篇
《MySQL 必知必会》:不到250页的小册子,实践性很强,基本没有什么理论的堆砌,完完全全就是一本实践指南,教会你怎么用SQL语句操作MySQL;
《高性能MySQL(第3版)》:跟《MySQL必知必会》相似的书籍,主要讲解了MySQL的理论和实践知识;
《数据化管理:洞悉零售及电子商务运营》:讲解在企业中应用数据的例子,读完受益匪浅,里面举的很多例子都很接地气,很值得数据分析师阅读学习。
高级篇
《统计学》(贾俊平,何晓群,金勇进著):统计比较通用的入门教材了,也算是兼顾数学证明和应用,可读性没有上面强,但是也非常的通俗易懂,有很多统计学专业的起始教材也会选择这本。
《Python数据分析》:作者对于利用Python进行数据分析有着很丰富的经验,因此写出的书也是深入浅出,让人很容易就能看懂。对一个热爱学习的数据分析师来说学一门数据分析处理的编程语言是一件很有用的事情。
《Python数据挖掘入门与实践》:作为一个专业的数据分析师,实际上很多时候都需要用到模型。这本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,还是挺不错的一本书。
大数据时代的到来,意味着数据增长的速度急速攀升。一方面,互联网+的经济模式使得传统行业也迸发出了巨大的数据体量。另一方面,传统互联网企业如今也做的风生水起,产业链不断完善,譬如BAT巨擘,每天产生的数据量非常惊人。
在这样的背景下,数据分析师开始应运而生,并蓬勃发展,而数据分析师也成为当下炙手可热的职位。那究竟应该如何成为一名数据分析师呢。在我看来,数据分析师需要从统计学,分析技能以及业务常识三个方面进行入手学习,这里重点说一下后两者。
首先来说分析技能。
Excel作为经典的数据分析工具,是数据分析师必备的武器库。灵活的Excel有两大经典利器,透视表以及灵活的函数。而在函数中,尤为重要的便是Vlookup。这个函数是用于进行字段匹配的,在实际工作中应用非常广泛。
Excel常用于基本的数据描述,并且可以处理的样本量非常有限。而在大数据时代,为了解决海量数据的查询,SQL就应运而生了。SQL基本可以分为增删改查四大模块,其中具体的语法又有where,select等。
除了Excel以及SQL之外,数据挖掘的工具也是必不可少的。如果没有编程基础,可以学习SPSS。而如果有编程,建议学习Python以及R。
说完分析技能,我们再来说一下业务知识。
业务知识并不是简单就能学会的,本质上是需要在企业中摸爬滚打才能学会的。然而,好的书籍也可以让你对业务知识有一定的了解。推荐两本书:《增长黑客》以及《精益数据分析》。
如果有问题,欢迎评论,一同探讨。
今天小聚准备了书单,给你一个保姆级别的规划,帮助大家学习数据分析。先上一个思维导图,方便大家收藏。
入门数据分析类
师父领进门,修行在个人。下面这两本书是入门数据分析必看的书籍,也是检验自己是否真的喜欢数据分析。
从0到1:《深入浅出数据分析》
为什么是它?借用一位读者的评价“我家的猫都喜欢这本书!”
01 内容简介
以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
02 推荐理由
书名已经很好地表现出了这本书的优点——“深入浅出”。忘记烦恼,这本书与现实世界紧密互动,让你不再只有枯燥的理论,并且将知识图形化,复杂的概念简单化。
经典小黄书:《谁说菜鸟不会数据分析》
是本很好的书,但看过之后,这本书就真一文不值了。
01 内容简介
很多人看到数据分析就望而却步,担心门槛高,无法迈入数据分析的门槛。《谁说菜鸟不会数据分析》努力将数据分析写成像小说一样通俗易懂,使读者可以在无形之中学会数据分析,按照数据分析工作的完整流程来讲解。
02 推荐理由
数据分析的入门极品,但真的很入门,优缺兼有。对于入门理解来说是绝佳选择,对之后的修炼还是不够的。建议之前全都是自己瞎摸瞎撞搞数据分析的同学进行阅读,颇有醍醐灌顶之感。
分析工具类
与数据分析相关的工具非常之多,我们常用的有Excel、PPT、SQL等。如果您想精通他们,直接在哔哩哔哩搜索聚数云海,即可找到相关优质课程。
1.Excel
大家常说的Excel,但是不要以为你很会Excel!Excel是所有职场人必备的办公软件。Excel功能非常强大,在数据量不是很大的情况下,基本上都能用Excel实现数据分析。推荐如下书籍:
《Excel高效办公数据处理与分析》
01 内容简介
根据现代企业决策和管理工作的主要特点,从实际应用出发,介绍了Excel强大的数据处理与分析功能在企业决策和管理工作中的具体应用。
02 推荐理由
本书同时提供了大量需要你做的实例,学而不练是不存在的!
《别怕,Excel函数其实很简单》
01 内容简介
《别怕,Excel 函数其实很简单》用浅显易懂的图文、生动形象的比喻以及大量实际工作中的经典案例,介绍了Excel最常用的一部分函数的计算原理和应用技巧,还介绍了数据的科学管理方法,以避免从数据源头就产生问题。
02 推荐理由
适合希望提高办公效率的职场人士,特别是经常需要处理分析大量数据并制作统计报表的相关人员,以及相关专业的高校师生阅读,小白需谨慎!
2. SQL
SQL是数据分析的基础,是想要学会数据分析能力的必备技能。那这里我只给大家介绍三本书,第一本书零基础入门,第二是进阶,第三本是SQL中的字典,话不多说,我们直接上架。
《SQL基础教程》
01 推荐理由
介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法。书中通过丰富的图示、大量示例程序和详实的操作步骤说明,让读者循序渐进地掌握SQL的基础知识和使用技巧,切实提高编程能力。每章结尾设置有练习题,帮助读者检验对各章内容的理解程度。另外,本书还将重要知识点总结为“法则”,方便读者随时查阅。
本书107张图表+209段代码+88个法则,是零基础进阶人士必备!
SQL进阶:《SQL进阶教程》
01 推荐理由
本书是为志在向中级进阶的数据库工程师编写的一本SQL技能提升指南。全书可分为两部分,第一部分介绍了SQL语言不同寻常的使用技巧,带领读者从SQL常见技术,去探索新发现。旨在帮助读者提升编程水平;第二部分着重介绍关系数据库的发展史,把实践与理论结合起来,旨在帮助读者加深对关系数据库和SQL语言的理解。
本书不适合小白!适合具有半年以上SQL使用经验、已掌握SQL基础知识和技能、希望提升自己编程水平的读者阅读。
SQL辅导书籍
01 推荐理由
本书是麻省理工学院、伊利诺伊大学等众多大学的参考教材,由浅入深地讲解了SQL的内容,实例丰富,便于查阅。本书没有过多阐述数据库基础理论,而是专门针对一线软件开发人员,直接从SQL SELECT开始,讲述实际工作环境中最常用和最必需的SQL知识,实用性极强。
有一定SQL基础的人士可以将它当做一本字典使用,遇到问题可以查找相应内用。
3.Python
“人生苦短,我用Python”。Python编程语言是最容易学习,并且功能强大的语言。但是很多人声称自己精通Python,自己却写不出Pythonic的代码,对很多常用的包不是很了解。万丈高楼平地起,咱们先从Python中最最基础的开始。
《Python编程,从入门到实践》
01 推荐理由
本书最大的特点就是零基础完全不懂编程的小白也能够学习,新手想学习选它绝对错不了。知识点由浅入深循循渐进,并配有视频教程手把手教学,同时所需的软件也是免费的。本书也配有相关辅导书籍,有兴趣的话可以去看看,但是请记住,这本书是最核心的。
《利用Python进行数据分析》
01 推荐理由
不像别的编程书一样,从盘古开天辟地开始讲起。这本书是直接应用到数据分析的,所以很多在数据分析上应用不那么频繁的模块也就没有讲。
本书第二版针对Python 3.6进行了更新,并增加实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到新版本的pandas、NumPy、IPython和Jupyter。
4.R语言
R是用于统计分析、绘图的语言和操作环境。但是R是有一定难度的,没有基础的话请谨慎尝试!推荐书籍:
《R语言入门与实践》
01 推荐理由
本书通过三个精心挑选的例子,深入浅出地讲解如何使用R语言玩转数据。将数据科学家必需的专业技能融合其中,教会读者如何将数据存储到计算机内存中,如何在必要的时候转换内存中的数据值,如何用R编写自己的程序并将其用于数据分析和模拟运行。
案例提升类
《活用数据:驱动业务的数据分析实战》
01 推荐理由
是一本用数据来帮助企业破解业务难题的实操书,有理论、有方法、有实战案例。具有业务驱动、案例闭环、思维先导、实战还原4大特色,同时在思路上清晰连贯,在表达上深入浅出,既能帮助数据分析从业者入门和提升,也能辅助企业各业务部门和各级管理人员做量化决策。
《精益数据分析》
01 推荐理由
本书展示了如何验证自己的设想、找到真正的客户、打造能赚钱的产品,以及提升企业知名度。30多个案例分析,全球100多位知名企业家的真知灼见,为你呈现来之不易、经过实践检验的创业心得和宝贵经验,值得每位创业家和企业家一读。
近日,由中国软件网、海比研究联合中国软件行业协会应用软件产品云服务分会,发布了《2017年中国大数据可视化市场研究报告》。
东软凭借两款大数据可视化产品,在2017年中国大数据可视化市场份额排名中,位居第三,并成为收入增长最快的厂商,增长率超过100%!
不可否认,整合复杂数据的收集、分析和可视化,并从数据中获得价值,是未来的趋势。而对于目前企业最关心的大数据可视化,今后的一个基本需求趋势——让数据可视化不仅仅是可见,更要求可控。大数据可视化,是把数据分析的结果以图形化、图像化的方式展现,帮助人们理解复杂的数据,快速获得数据的价值。在大数据秒级分析的基础上,东软的DataViz,在数据可视化领域不断突破。近百种数据可视化形式,GIS地图可视化、3D可视化,一组杂乱无序的业务数据,分分钟就能变成炫酷动图。
DataViz 定位敏捷BI,面向业务人员提供自助式数据探索与可视化分析服务。平台提供可视化接入数据源、可视化定义数据集、自助式可视化分析工具和交互式故事板等功能,旨在以自助式数据探索与可视化分析方式,帮助企业用户快速准确地洞悉数据背后隐藏的商业价值,让企业决策更“有据可依”。
DataViz 提供固定分辨率功能,可以按照大屏的尺寸进行精准的可视化布局和实现,并可以按照长边铺满等进行宽高适应。与此同时,DataViz可以自由设定背景图片、背景色等,提供实时效果预览,轻松在本地电脑即可制作大屏可视化仪表板,例如在大屏界面中,通过地图、折线图、柱状图、列表等图表,展现数据分析大屏。
我们置身于大数据时代,有效的利用大数据决定着我们未来,而大数据可视化工具,是您必不可少的工具。从大数据分析到大数据展现,这次,东软不仅拼实力,还拼颜值!