数据分析需要掌握哪些知识?

 我来答
热心晓朋友
2021-07-22 · TA获得超过287个赞
知道小有建树答主
回答量:1251
采纳率:65%
帮助的人:33.4万
展开全部

Java基础语法

  1. · 分支结构if/switch

  2. · 循环结构for/while/do while

  3. · 方法声明和调用

  4. · 方法重载

  5. · 数组的使用

  6. · 命令行参数、可变参数

IDEA

  1. · IDEA常用设置、常用快捷键

  2. · 自定义模板

  3. · 关联Tomcat

  4. · Web项目案例实操

面向对象编程

  1. · 封装、继承、多态、构造器、包

  2. · 异常处理机制

  3. · 抽象类、接口、内部类

  4. · 常有基础API、集合List/Set/Map

  5. · 泛型、线程的创建和启动

  6. · 深入集合源码分析、常见数据结构解析

  7. · 线程的安全、同步和通信、IO流体系

  8. · 反射、类的加载机制、网络编程

Java8/9/10/11
新特性

  1. · Lambda表达式、方法引用

  2. · 构造器引用、StreamAPI

  3. · jShell(JShell)命令

  4. · 接口的私有方法、Optional加强

  5. · 局部变量的类型推断

  6. · 更简化的编译运行程序等

MySQL

  1. · DML语言、DDL语言、DCL语言

  2. · 分组查询、Join查询、子查询、Union查询、函数

  3. · 流程控制语句、事务的特点、事务的隔离级别等

JDBC

  1. · 使用JDBC完成数据库增删改查操作

  2. · 批处理的操作

  3. · 数据库连接池的原理及应用

  4. · 常见数据库连接池C3P0、DBCP、Druid等

Maven

  1. · Maven环境搭建

  2. · 本地仓库&中央仓库

  3. · 创建Web工程

  4. · 自动部署

  5. · 持续继承

  6. · 持续部署

Linux

  1. · VI/VIM编辑器

  2. · 系统管理操作&远程登录

  3. · 常用命令

  4. · 软件包管理&企业真题

Shell编程

  1. · 自定义变量与特殊变量

  2. · 运算符

  3. · 条件判断

  4. · 流程控制

  5. · 系统函数&自定义函数

  6. · 常用工具命令

  7. · 面试真题

Hadoop

  1. · Hadoop生态介绍

  2. · Hadoop运行模式

  3. · 源码编译

  4. · HDFS文件系统底层详解

  5. · DN&NN工作机制

  6. · HDFS的API操作

  7. · MapReduce框架原理

  8. · 数据压缩

  9. · Yarn工作机制

  10. · MapReduce案例详解

  11. · Hadoop参数调优

  12. · HDFS存储多目录

  13. · 多磁盘数据均衡

  14. · LZO压缩

  15. · Hadoop基准测试

Zookeeper

  1. · Zookeeper数据结果

  2. · 内部原理

  3. · 选举机制

  4. · Stat结构体

  5. · 监听器

  6. · 分布式安装部署

  7. · API操作

  8. · 实战案例

  9. · 面试真题

  10. · 启动停止脚本

HA+新特性

  1. · HDFS-HA集群配置

Hive

  1. · Hive架构原理

  2. · 安装部署

  3. · 远程连接

  4. · 常见命令及基本数据类型

  5. · DML数据操作

  6. · 查询语句

  7. · Join&排序

  8. · 分桶&函数

  9. · 压缩&存储

  10. · 企业级调优

  11. · 实战案例

  12. · 面试真题

Flume

  1. · Flume架构

  2. · Agent内部原理

  3. · 事务

  4. · 安装部署

  5. · 实战案例

  6. · 自定义Source

  7. · 自定义Sink

  8. · Ganglia监控

Kafka

  1. · 消息队列

  2. · Kafka架构

  3. · 集群部署

  4. · 命令行操作

  5. · 工作流程分析

  6. · 分区分配策略

  7. · 数据写入流程

  8. · 存储策略

  9. · 高阶API

  10. · 低级API

  11. · 拦截器

  12. · 监控

  13. · 高可靠性存储

  14. · 数据可靠性和持久性保证

  15. · ISR机制

  16. · Kafka压测

  17. · 机器数量计算

  18. · 分区数计算

  19. · 启动停止脚本

DataX

  1. · 安装

  2. · 原理

  3. · 数据一致性

  4. · 空值处理

  5. · LZO压缩处理

Scala

  1. · Scala基础入门

  2. · 函数式编程

  3. · 数据结构

  4. · 面向对象编程

  5. · 模式匹配

  6. · 高阶函数

  7. · 特质

  8. · 注解&类型参数

  9. · 隐式转换

  10. · 高级类型

  11. · 案例实操

Spark Core

  1. · 安装部署

  2. · RDD概述

  3. · 编程模型

  4. · 持久化&检查点机制

  5. · DAG

  6. · 算子详解

  7. · RDD编程进阶

  8. · 累加器&广播变量

Spark SQL

  1. · SparkSQL

  2. · DataFrame

  3. · DataSet

  4. · 自定义UDF&UDAF函数

Spark Streaming

  1. · SparkStreaming

  2. · 背压机制原理

  3. · Receiver和Direct模式原理

  4. · Window原理及案例实操

  5. · 7x24 不间断运行&性能考量

Spark内核&优化

  1. · 内核源码详解

  2. · 优化详解

Hbase

  1. · Hbase原理及架构

  2. · 数据读写流程

  3. · API使用

  4. · 与Hive和Sqoop集成

  5. · 企业级调优

Presto

  1. · Presto的安装部署

  2. · 使用Presto执行数仓项目的即席查询模块

Ranger2.0

  1. · 权限管理工具Ranger的安装和使用

Azkaban3.0

  1. · 任务调度工具Azkaban3.0的安装部署

  2. · 使用Azkaban进行项目任务调度,实现电话邮件报警

Kylin3.0

  1. · Kylin的安装部署

  2. · Kylin核心思想

  3. · 使用Kylin对接数据源构建模型

Atlas2.0

  1. · 元数据管理工具Atlas的安装部署

Zabbix

  1. · 集群监控工具Zabbix的安装部署

DolphinScheduler

  1. · 任务调度工具DolphinScheduler的安装部署

  2. · 实现数仓项目任务的自动化调度、配置邮件报警

Superset

  1. · 使用SuperSet对数仓项目的计算结果进行可视化展示

Echarts

  1. · 使用Echarts对数仓项目的计算结果进行可视化展示

Redis

  1. · Redis安装部署

  2. · 五大数据类型

  3. · 总体配置

  4. · 持久化

  5. · 事务

  6. · 发布订阅

  7. · 主从复制

Canal

  1. · 使用Canal实时监控MySQL数据变化采集至实时项目

Flink

  1. · 运行时架构

  2. · 数据源Source

  3. · Window API

  4. · Water Mark

  5. · 状态编程

  6. · CEP复杂事件处理

Flink SQL

  1. · Flink SQL和Table API详细解读

Flink 内核

  1. · Flink内核源码讲解

  2. · 经典面试题讲解

Git&GitHub

  1. · 安装配置

  2. · 本地库搭建

  3. · 基本操作

  4. · 工作流

  5. · 集中式

ClickHouse

  1. · ClickHouse的安装部署

  2. · 读写机制

  3. · 数据类型

  4. · 执行引擎

DataV

  1. · 使用DataV对实时项目需求计算结果进行可视化展示

sugar

  1. · 结合Springboot对接百度sugar实现数据可视化大屏展示

Maxwell

  1. · 使用Maxwell实时监控MySQL数据变化采集至实时项目

ElasticSearch

  1. · ElasticSearch索引基本操作、案例实操

Kibana

  1. · 通过Kibana配置可视化分析

Springboot

  1. · 利用Springboot开发可视化接口程序

成都聚数云海
科技发烧友

2021-11-26 · 有一些普通的科技小锦囊
知道小有建树答主
回答量:232
采纳率:80%
帮助的人:4.9万
展开全部
如果要学习数据分析的时候,我们需要学习Excel、数据可视化、数据库知识、Python和R语言、统计知识、分析思维、业务知识,学会了这些知识才能够做好数据分析工作。
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
帐号已注销
2021-07-21 · TA获得超过879个赞
知道小有建树答主
回答量:1.2万
采纳率:15%
帮助的人:608万
展开全部
统计学等知识。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
明德资本生态圈张晓丽
2022-06-28 · 百度认证:北京明德乾坤信息咨询有限公司官方账号
明德资本生态圈张晓丽
向TA提问
展开全部
数据分析需要学习以下几点:

一、统计学。二、编程能力。三、数据库。四、数据仓库。五、数据分析方法。六、数据分析工具。

想要成为数据分析师应该重点学习以下两点:

1.python、SQL、R语言

这些都是最基础的工具,python都是最好的数据入门语言,而R语言倾向于统计分析、绘图等,SQL是数据库。既然是数据分析,平时更多的时间就是与数据分析打交道,数据采集、数据清洗、数据可视化等一系列数据分析工作都需要上面的工具来完成。

2.业务能力

数据分析师存在的意义就是通过数据分析来帮助企业实现业务增长,所以业务能力也是必须。企业的产品、用户、所处的市场环境以及企业的员工等都是必须要掌握的内容,通过这些内容建立帮助企业建立具体的业务指标、辅助企业进行运营决策等。

当然这些都是数据分析师最基本也是各位想转行的小伙伴需要重点学习的内容,以后想要有更好的发展,还需要学习更多的技能,例如企业管理,人工智能等。


关于数据分析师的学习可以到CDA数据分析认证中心看看。全球CDA持证者秉承着先进商业数据分析的新理念,遵循着《CDA职业道德和行为准则》新规范,发挥着自身数据专业能力,推动科技创新进步,助力经济持续发展。
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式