方差是标准差的平方
昨天我们学习了如何利用图表展示数据分布情况。今天,我们要学习用几个关键的数字来概括和描述一组数据的特征,它们可以帮助我们快速了解数据大概集中在什么位置,以及数据之间的离散程度。
第一个知识点:样本数据的数字特征——平均数(Mean)
平均数是我们最熟悉的统计量。它反映了数据的集中趋势,代表了数据的“平均水平”。具体计算是将所有数据相加后除以数据个数。对于样本数据x₁, x₂, ..., x_n,其平均数为:
x̄ = (x₁ + x₂ + ... + x_n) / n
如果每个数据出现的次数不同,还需要计算加权平均数。优点在于计算简单且能充分利用所有数据。但缺点是易受极端值影响。例如,计算全班同学的平均考试成绩或每天的平均气温。
第二个知识点:样本数据的数字特征——中位数(Median)
中位数是数据从小到大排列后,位于中间位置的数(如果数据个数是奇数)或中间两个数的平均数(如果数据个数是偶数)。它反映了数据的集中趋势,且不受极端值影响。计算方法是先排序数据,然后找到中间位置。优点是不受极端值干扰,适用于偏态分布的数据。缺点是没有充分利用所有数据的信息。例如,调查居民收入时使用中位数可能比平均数更能反映普通水平。
第三个知识点:样本数据的数字特征——众数(Mode)
众数是一组数据现次数最多的数,代表数据中“最流行”或“最普遍”的值。只需统计每个数值出现的次数即可找到众数。注意,众数可能不止一个,也可能不存在。优点是易于理解且不受极端值影响,适用于非数值数据。但缺点是可能不稳定且不唯一。例如,鞋店进货时会根据哪个尺码卖得最好来决定进货比例。
第四个知识点:样本数据的数字特征——方差(Variance)
方差是衡量数据离散程度的指标,表示每个数据与平均数差的平方的平均数。方差越大,数据越分散;方差越小,数据越集中。计算公式为:对于样本数据x₁, x₂, ..., x_n,其方差为:s² = (1/n) Σ(xᵢ - x̄)²。方差能很好地反映数据的波动情况,但计算相对复杂且单位不直观。例如,比较两个班级考试成绩的稳定性。
第五个知识点:样本数据的数字特征——标准差(Standard Deviation)
标准差是方差的算术平方根,同样衡量数据的离散程度,但单位与原始数据相同,更为直观。其计算公式为:s = √s²。标准差的作用与方差相似,但更常用且单位一致,便于描述数据的分布范围。例如,天气预报中的平均气温和标准差。
接下来是一些练习题以巩固这些知识点:
1. 求某同学5次数学测验成绩的平均数。
2. 找出数据组的中位数和众数。
3. 计算数据1, 2, 3, 4, 5的方差。
4. 求数据0, 1, 2的标准差。
5. 比较两组数据的方差或标准差,解释哪组数据更分散并说明原因。