数据分析师要学什么(数据分析师是什么专业毕业的)


很多同学都很疑惑,数据分析到底应该学到什么程度,可以去找工作?那么今天全网最精简最全的数据分析自选指南他来了,如果想要成为数据分析师同学赶紧把住,然后学习起来。首先就是统计学,统计学也是我们后面进行很多分析的基础,那么统计学部分主要分为三大模块,首先第一个模块就是描述性统计,那么这一点有助于帮助我们在拿到一个数据的时候可以进行初步的描述分析。

数据分析师要学什么(数据分析师是什么专业毕业的)

在描述性统计当中需要掌握的必须的概念就包括均值、中位数、众数、方差、极大值以及极小值。除此之外,我们还需要了解整体的数据分布,那么在数据分布当中,主要的数据分布就包括正态分布、波动力分布、二项分布、均匀分布、扩松分布以及指数分布。同时,均值和中位数的比较还直接决定了这个数据集分布的偏度以及分布。最后我们还需要去识别数据集当中的缺失值以及异常值。

第二个模块就是假设检验,在假设检验中,我们必须要掌握原假设以及被则假设定义。同时还有检验的几种主流方法,比如T检验以及卡方检验,那么为了解释假设检验的结果,我们所需要掌握的概念就包括P值、置信度以及执行区间。在实际工作中,假设检验的一个主要运用就是AB实验,所以我们就需要掌握和AB实验相关的知识点,那么这个在之前的视频当中也有所提到。

第三个模块就是概率论,在这个模块当中,大家一定要掌握的内容就包括条件概率的计算、抽样方法、大数定律、中心极限定理、区间估计、R方以及方差分析。在学习完统计学之后,下面就进入分析工具的学习,也就是平常我们所说的代码以及编程部分。这一部分当中首先一定要掌握的一个工具就是Excel,它也是每个数据分析师所必备的一个分析工具。

在Excel当中,我们主要需要掌握一些基础的计算函数、数据透视表以及v lookup,然后就是CQCQL是我们在工作当中主要的提速以及数据查询工具。在CQL当中,我们主要需要掌握表的增删、查改表连接子查询以及窗口函数的运用,同时我们还需要知道CQL语句的执行顺序是怎么样的。接下来就是Python,它是我们进行数据清洗以及模型搭建等比较复杂的数据操作所必不可少的一项工具。那么在Python学习当中,我们就一定要掌握在Python当中最基本的数据结构,包括列表、字典、字符串等等,同时我们还需要掌握比较基本的Python语句,比如说if语句、for语句、while语句。最后我们还需要熟练运用Python当中已有的package,就包括non派、pandas SK learn等等。最后还有数据可视化的常用工具,那么在数据可视化部分我们只需要掌握一个工具即可。在这里比较推荐大家学习tablelo,那么在table当中,大家主要需要去学习的就包括仪表盘的制作以及一些基本的计算函数的应用。

在了解完统计学以及能够熟练使用一些分析工具之外,我们就可以进入下一步进阶的内容,也就是和机器学习以及算法模型相关的部分知识。那么在这部分大家主要要掌握的就是模型的原理模型的运用,模型的一些调优以及效果的评估。除了算法岗位之外的数据分析岗位,其实只需要了解我刚才所提到这些内容即可,并不需要去深入的纠结,比如公式的推导等等。那么在机器学习部分主要可以分为有监督学习以及无监督学习,在有监督学习中主要可以分为回归算法与分类算法,而在无监督学习中,我们主要需要掌握的就是序列算法。除此之外,大家还需要了解时间序列模型,这个也是我们在工作当中比较常用的一种预测模型。

那么最后一个大的模块就是业务知识的部分,业务知识对于现在很多的数据分析师岗位来说越来越重要,因为现在很多数据分析都是为业务决策而服务的,在之前的视频当中也给大家分享了很多业务方面的一些小知识点,那么在这个部分主要需要掌握的业务分析方法就包括留存分析,漏斗分析,对比分析,行为路径分析,拆解分析,用户分析分析以及归因分析。