丹凤千字科普:样本方差公式的由来(详细资料介绍)


丹凤千字科普:样本方差公式的由来(详细资料介绍)  

我是ZZ数据分析师,如果你对数据分析感兴趣,就请点一下关注吧!每天我都会为你分享关于数据分析的干货。私信我回复数字“01”,即可获取一份新手入门数据分析大礼包。

一、引言

《概率论》是理工科大学生的必修课程,对于学习统计学的同学们来说,更是无法避开的一门重要课程。与此还有一系列高级课程如《高等数理统计》、《多元统计分析》等。在学习的过程中,大家可能会觉得这门学科晦涩难懂,或者感觉知识点零散难以形成完整的逻辑框架。本文将带领大家一同了解统计学的发展历程,以通俗易懂的方式,梳理统计学的知识体系,让大家不仅知其然,更知其所以然。

特别提示:本文并非科普文章,不会涉及纯理论知识。而是通过作者的思考和梳理,为大家呈现一个符合逻辑的统计学发展历程,旨在为对统计学感兴趣的同学提供一个清晰的学习路线和整体逻辑框架。

二、何为统计?

说到统计这个话题,我们需要明确我们在讨论什么。统计二字,可以拆分为“统”和“计”两个部分。“统”有总括、概括的意思,“计”则代表计算。统计就是对某个事件进行概括性的计算,以得出支持我们结论的统计数据。

那么,概括性的计算都包括哪些内容呢?大多数人可能首先能想到的是均值、方差、最大值、最小值、中位数等。而这些正是我们今天要介绍的统计学基础概念。接下来,我们将从最简单的均值和方差开始,带你进入统计的世界。

三、统计的发展历程

让我们通过一张图片来展示统计学的发展历程,然后逐一进行解释:

1. 很久很久以前,人们就已经掌握了计数技术,主要用于记录食物的数量。然而随着智慧的增长,人们不再满足于简单的计数,开始探索数据背后的规律。其中最简单的计算就是均值,用于衡量一组数据的平均水平。

2. 有了均值作为衡量平均水平的基础,人们自然会关注个体与平均水平的差异。这种差异如何衡量呢?方差应运而生,它基于均值来衡量数据之间的差异程度。

3. 到此为止,我们已经可以通过均值和方差来衡量一组数据。但为了方便讨论,我们需要定义一些基本概念:事件、整体、个体。随着统计学的不断发展,对于某个事件,我们使用类似均值、方差等指标来衡量其某方面的水平。

4. 人们很快发现,之前定义的“整体”只是当前收集到的全部数据,对于某个事件我们无法穷尽所有数据。我们引入了总体和样本的概念。总体是所有可能数据的集合,而样本则是从总体中抽取的一部分。

5. 样本的数据表现并不稳定,但在多次试验的情况下,事件发生的频率趋于稳定。结合极限的概念,我们给总体中事件出现的频率一个定义:概率。为了理解某个事件的规律,我们希望知道其所有可能情况的概率分布。

6. 为了刻画总体的分布特征,我们引入了统计量的概念。样本的统计量用于刻画总体的某些特征,如均值、方差等。由于抽样过程是一个随机过程,样本的统计量也是一个变量。研究变量的分布就引出了抽样分布的概念。

7. 最开始研究的是最简单的样本均值分布。不同分布的总体的样本均值分布是怎样的呢?经过长时间的证明,人们发现它遵循正态分布,这就是中心极限定理的核心内容。

8. 随后,人们发现抽样数量的大小会影响样本均值的抽样分布。小样本下有一个特定的分布称为t分布,而大样本下仍然遵循正态分布。同样地,在研究样本方差时,我们定义了卡方分布和F分布。

9. 通过以上理论的发展,我们已经可以通过样本的统计量来推断总体的参数。除了从理论上推导外,还有一种获取统计量分布的方法是自助法。无论是哪种方法,都可以用于假设检验。

10. 在熟悉了以上理论的基础上,假设检验其实是一种经典的数学思维:先提出假设(原假设),然后根据理论推导事件的预期发展(统计量的抽样分布),再与实际观察值进行比较(计算P值),最后判断假设是否成立。

11. 统计学发展至此,已经广泛应用于日常生活和各个领域。本文所叙述的发展过程,希望能为广大学习统计学的同仁提供一个清晰的学习路径。

四、统计学必知必会

如果大家认可以上的统计学发展过程,那么以下这些知识点就是必须掌握的:

1. 均值、方差、最大值、最小值、中位数等统计值的概念;

2. 事件、总体、样本、个体的概念;

3. 频率、概率、分布等概念以及常用分布(如二项分布、正态分布等)的均值和方差;

4. 大数定律、统计量、抽样分布等概念以及常见的抽样分布(如卡方分布、t分布和F分布);以及中心极限定理的应用;最后假设检验的应用等也是极其重要的基础知识;应用广泛的基本的统计方法和技术如回归分析等也是统计学的重要部分;数据处理和数据清洗也是统计学中不可或缺的一环;最后还有机器学习算法在统计学中的应用也是未来趋势之一;这些都需要我们深入学习和理解并应用到实践中去提升我们的数据处理和分析能力以便更好地解决实际问题!这部分的知识将为后续的统计

  丹凤千字科普:样本方差公式的由来(详细资料介绍)