正态分布公式_高中正态分布公式


在统计学的广袤领域中,正态分布无疑是最具代表性和影响力的连续概率分布之一。它不仅在我们的日常生活中扮演着重要角色,也在科学研究中发挥着不可或缺的作用。正态分布的密度函数以其独特的数学美感吸引了无数学者的关注。正态分布是如何推导出来的,仍然是许多人感到困惑的问题。本文将探讨两种主要的推导方法,以便更好地理解这一经典的概率分布。

撰文 | Long Luo

正态分布公式_高中正态分布公式

正态分布公式_高中正态分布公式

图1. 68-95-99.7法则

什么是正态分布?

数据的分布形式可以多种多样,可能会集中在某一个方向,或者完全随机。举例来说,数据可能向左侧偏斜,或者向右侧偏斜,甚至呈现出不规则的随机分布。下图展示了这些不同的数据分布情况:

正态分布公式_高中正态分布公式

图2. 数据偏向左侧分布

正态分布公式_高中正态分布公式

图3. 数据偏向右侧分布

正态分布公式_高中正态分布公式

图4. 数据随机分布

在许多情况下,数据会集中在一个中心值附近,形成一个对称的钟形曲线,这就是正态分布的特征。如下图所示:

正态分布公式_高中正态分布公式

图5. 正态分布示例

正态分布,又称高斯分布,以其数学上的优雅和实际应用中的广泛性著称。这种分布形式是由著名的数学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)在19世纪初首次提出的。正态分布广泛应用于描述自然现象,如人的身高、考试成绩等,因此被称为“Normal Distribution”。实际上,德国曾发行的10马克纸币上曾印有高斯和正态分布曲线,彰显了这一分布的重要性,如下图所示。

图6. 高斯与正态分布曲线

在中学阶段,大家或许已经接触过正态分布的数学公式。该公式的推导方式有很多种,其中最优雅且直观的一种推导方法源自天文学家约翰·赫歇尔(John Herschel)。在1850年,赫歇尔提出了一种推导正态分布的方式,这种方法被称为赫歇尔推导。著名教育视频频道3Blue1Brown的《Why π is in the normal distribution (beyond integral tricks)》详细介绍了这一方法。虽然视频中的介绍有一定的简化,但它为理解正态分布的推导提供了良好的视角。接下来,我们将对这种推导方法进行详细讨论,并进一步介绍更为严谨的数学分析方法。

赫歇尔推导方法

图10. 落点概率密度函数与半径的关系

更严谨的数学分析方法

在前一节中,我们使用了一种相对直观的方式来推导正态分布的概率密度函数。接下来,我们将探讨一种更加严谨的数学分析方法,以更准确地推导正态分布的概率密度函数。