数据挖掘和数据科学有什么区别?
简言之,一个偏理论,一个偏应用。
数据科学(Data Science)可以理解为一个跨多学科领域的,从数据中获取知识的科学方法,技术和系统集合,其目标是从数据中提取出有价值的信息,它结合了诸多领域中的理论和技术。
包括应用数学,统计,模式识别,机器学习,人工智能,深度学习,数据可视化,数据挖掘,数据仓库,以及高性能计算等。
数据科学过程:包括原始数据采集,数据预处理和清洗,数据探索式分析,数据计算建模,数据可视化和报表,数据产品和决策支持等。
就业方向:
分析类岗位
分析类工程师。使用统计模型、数据挖掘、机器学习及其他方法,进行数据清洗、数据分析、构建行业数据分析模型,为客户提供有价值的信息,满足客户需求。
算法工程师。大数据方向,和专业工程师一起从系统应用的角度,利用数据挖掘/统计学习的理论和方法解决实际问题;人工智能方向,根据人工智能产品需求完成技术方案设计及算法设计和核心模块开发,组织解决项目开发过程中的重大技术问题。
研发类岗位
架构工程师。负责Hadoop集群架构设计开发、搭建、管理、运维、调优,从数据采集到数据加工,从数据清洗到数据抽取,从数据统计到数据分析,实现大数据全产业线上的应用分析设计。
开发工程师。基于hadoop、spark等构建数据分析平台,进行设计、开发分布式计算业务,负责机器学习、深度学习领域的开发工作。
运维工程师。负责大数据基础平台的运维,保障平台的稳定可用,参与设计大数据自动化运维、监控、故障处理工具。