数据分析师每天做什么?
数据治理流程涉及到多部门多岗位的分工协作,数据分析师在这个流程中也承担了重要的角色。
数据分析师的职责真的不止是分析,除了分析之外,数据分析师需要参与到数据规划、数据采集过程中,而在数据应用过程中也需要完成指标体系、报表体系的建设以及部分临时的数据查询需求。
1.数据埋点
数据分析师要对业务进行分析,分析所需要的数据需要通过埋点来获取。分析师参与到数据规划、数据采集的过程中,可以更快地拿到数据,减少数据等待时长,有利于提高分析的效率。
举个例子来说,假如现在用户流失很严重,业务提了个需求让分析师帮忙分析下用户流失前的第n步都做了什么?
但是,碰巧用户流失前第n步的事件log没有记,那么作为数据分析师没有数据分析也无从下手,只能给研发提出埋点需求,在下个版本进行数据埋点。
那么这样一来,分析的周期就会延后一个版本。如果分析师参与到数据埋点这项工作中来,诸如此类的事情大部分都是可以避免的。
2.指标体系及报表体系建设
数据的终极目的是定位业务问题,辅助业务决策。而指标体系就是监控业务问题,定位业务问题的好帮手。
所以,指标体系的建设也是数据分析师的重要工作之一,好的指标体系能够直接反映业务问题,同时能够帮助数据分析师快速定位业务问题,以辅助业务进行决策。
3.商业智能分析
数据分析师当然也少不了分析,包括了各类活动效果分析、版本变化分析、用户分析、流失分析等等。
一份好的分析报告能够给业务的发展提供多种思路,也是分析师最重要的价值体现。
数据分析师在数据治理流程中需要撰写数据埋点文档、搭建数据指标体系、报表体系以及分析业务问题
2022-03-14 广告
数据分析基本上有两个方向,第一,技术方向,第二,业务方向。
对于大厂而言,职能的划分会非常详细,干技术方向不需要了解太多的业务,相反也是一样的。但是对于小公司,数据分析师需要的技能更加多样,数据分析技能,沟通技能,对业务的了解,presentation等等不一而足。
一. 数据分析岗位介绍
1.1技术方向
走技术方向需要获得的技能大约分为三个方面,数据获取,数据处理,以及数据可视化。三个方面分别对应三个工具,即sql语言,python和excel,以及tableau。
对机器学习和大数据的的了解和实践会是很好的加分项。比如我现在在干的活要用到大数据的hadoop和impala,但查询取数依然是基于sql语言的。
走技术方向对业务的熟悉程度不需要太深,就像之前说的,大型企业会将技术方向和业务方向分得很细,业务方向的分析师是技术方向的分析师和业务部门的桥梁,而不是业务部门直接与技术沟通,这也是我所在的公司的真实情况。个人觉得虽然增加了一些沟通成本,但是员工确实可以更加专心于自己的工作。
1.2 业务方向
走业务方向的话,对技术的运用不需要特别熟练,我与业务方向的数据分析师聊过,在工作的空闲再深入学习sql语言或者可视化之类的技术都是可以的,但在投递简历之前,至少需要有一定的基础技能和基本了解,知道柱形图和折线图有什么样的特点这种基本概念。
业务方向的数据分析师需要与业务部门进行更深入的沟通,因此要求对业务有一定的了解,这样才能更好地结合数据和业务,提出有用的结论和建议,因此,最好是能够在你的本领域内转行。
除此之外,还需要了解数据分析师,数据工程师,和数据科学家的区别。
你可不想本来想转数据分析师,却学了数据工程师的技能。
简单来说,数据分析师主要工作是做取数,清洗和可视化,业务方向则更多专注于数据与业务的结合,可能还需要跟进运营,分析运营结果。
数据工程师,则专注于从每天的公司或用户行为中获取数据,主要做数据获取,数据库的搭建,维护和优化。
数据科学家,则专注于机器学习的算法,因此需要数学好。
二、硬技能学习
2.1 sql语言
sql语言主要用于从数据库中获取数据,公司一般不会让你用爬虫从网络爬取所需要的数据,因此爬虫并不是一个必要技能。
sql语言一定要做到熟练使用,而这个语言的重中之重就是数据查询语言(DQL),从最基础的select,到大数据常用的分区概念对应的partition。
在面试中,面试官通常会给你几张表,让你现场写下取数逻辑,因此写的又快又对,写完了反手就把逻辑给面试官看,战术后仰,岂不帅哉。
其他的sql语言包括数据定义语言(DDL),数据操作语言(DML)和数据控制语言(DCL)和数据分析师的关系不大,做到了解和简单使用就好。
sql语言一定要多练,这样才能做到面试时不慌,子查询和各种表连接一般在面试的时候都会面到。
2.2 excel
excel的学习不难,主要学习各类函数,从最基础的聚合函数sum到表查询函数vlookup都要学习。以及各类图怎么做,怎么用数据透视表等等。
这里说excel学习不难,并不是指excel比python低级,excel要做的好其实非常困难,但不管怎么说,目前公司都在要求比较新的python技术,excel做的再好,不符合职位要求也白搭。
从工作的角度来谈,通过excel对少量的数据做简单处理确实更加方便一些,也经常用excel先做简单的格式转换,排序和可视化。但复杂处理或者大量数据就不是excel力所能及的了。
2.3 python
python是数据分析的大头,当然选择学习r也可以,可是一定不要同时学,用熟一个比用会无数个要重要的多。
对python有一些了解的人应该都听说过numpy,pandas和matplotlib,这三个包是数据分析必会的包,先用熟这三个,之后更进一步可以学习os,seaborn,sklearn等。
2.4 tableau
tableau的基本使用在b站是可以学习到的,但是计算字段和其中的函数的使用仍然需要一定量的练习,并且需要一定的编程基础。
工作中用的最多的图就是柱状图,直方图,条形图,交叉表这几个,偶然见到热力图,桑椹图,甚至散点图和饼图出现都很少。当然这可能与业务需求有关,具体问题具体分析。
如果你会做那些复杂的图自然更好,说明你对tableau的理解较深,侧面表现了你的能力比别人强。
欢迎关注我们的公众号:聚数云海。免费获取数据分析师大厂真题和更多数据分析相关资讯。
2018-10-28 · 国内专业的大数据轻应用自助平台
数据分析师的日常工作
1、确定目标
在开始进行数据分析之前,最重要的一个步骤就是和自己的团队开会,确定本次项目的战略目标。如果你连核心的战略目标都没有,那等到自己真正开始分析的时候就会像无头苍蝇一样,不知道从哪里开始分析。
2、建立问题
光有核心目标还不够,你还要根据核心目标分析出各种有可能存在的问题。就像是我们上学时做阅读理解题目一样,先读题,再带着问题阅读。分析数据也是如此,只不过,这次的出题人是你自己。这样的做法还能让你事半功倍。
3、收集数据
所谓“数据分析”,没有数据肯定是不行的。当你确定了目标与问题,下一步就是根据所制定的目标与问题来收集相关数据。这一步骤也是所有步骤中最基础的一步。
4、设置KPI
数据收集完成后,你需要设置KPI(关键绩效指标)。主要KPI包括:跳出率、平均会话时长、目标转化率以及着陆页转换率等。无论是定性还是定量研究数据,你都要设置KPI。因为KPI可以帮助你跟踪和衡量进度。
5、清理无用的数据
员工从各个来源收集的数据,不一定都是有用的。无用的数据不仅会让数据分析师的分析过程变得繁琐,还会导致结果不准确。这时,我们就需要参考KPI,对无用的数据进行清理。任何与业务目标无关或者和KPI管理策略不符的统计、数据或指标都需要被删除。
6、进行统计分析
统计分析也非常重要,它包括聚类,同类,回归,因子和神经网络。
7、建立数据管理路线图
这一步骤并不是必须进行的。创建数据管理路线图需要花费一定的时间,但是它可以帮助数据分析师更好地处理以及存储数据。
8、整合技术
分析数据的方法有很多种,但是分析能否成功,还是要靠整合好的软件和技术。例如,通过统计方法数据分析和核心数据分析方法集成的技术,你可以避免有效信息的分散,直接获得最有价值的信息,从而节省时间和精力。
9、将数据可视化
可视化数据就是将数据通过图形和图表的形式呈现出来。人类都是视觉动物,将数据可视化可以帮助整个团队理解数据,从而提取出有助于企业发展的各种信息。
10、实施文本分析
我们每天都会创建2.5亿字节的巨大数据,其中很大一部分都是基于文本的。文本分析又称文本挖掘,它是一个获取大量文本数据并以使数据易于管理的方式进行整理的过程。通过这一过程,你能够提取真正与业务相关的数据。
为了加速文本分析过程,你可以使用现代分析工具和技术。现代分析工具和技术能够以高效、目标明确的方式,帮助你收集和整理结论。
11、深入诊断分析
诊断分析也是分析过程中必不可少的一部分,它是一种强大的数据发现形式。通过诊断分析,你能够获得某件事发生的原因以及方式,从而找到解决问题的确切方法。
13、考虑自主技术
研究表明,到2021年,将有80%的新兴技术由AI基金会开发,这意味着自主技术的能力和价值正在不断增长。当前,最流行的两种自主技术是智能警报和神经网络:
(1)智能警报:如果你正在监视供应链KPI,你可以设置一个智能警报,每当出现无效或者低质量数据时,就会自动触发你所设置的智能警报。
(2)神经网络:神经网络是机器学习的一种,它试图了解和学习人脑是如何处理数据信息并预测价值的。神经网络会从每笔数据交易中学习,这意味着随着时间的推移,它的技术会更加成熟。
14.生成报告
在前面,我们一起探讨了各种数据分析技术的应用。当我们分析完毕后,你就需要将这些元素组合在一起,生成报告。通过使用各种BI(商业智能)仪表盘工具,你可以将数据可视化,将这一可视化报告加以整理,让企业内更多的人一起发挥报告的价值。
什么是数据分析师证书?