方差标准差计算方法


方差标准差计算方法  

前几天我们探讨了正态分布,今天我们来聊聊另一种重要的分布类型,那就是幂律分布。尽管幂律分布这个名字可能对你来说比较陌生,但有一个与之相关的概念你一定非常熟悉,那就是“二八法则”。这个概念在社会各领域都有广泛的应用。

例如,全社会的财富往往集中在少数人手中,行业内的市场份额也往往被少数几家大公司占据。如果一个公司试图占据全部市场份额,那么它就可能会面临垄断的风险。许多公司的业务也往往依赖于少数重点客户。虽然在科普行业中可能并不遵循二八法则,因为科学精神已经普及到各个领域。但这个法则正是幂律分布最直观的表现。

幂律分布的曲线图非常简单,横坐标代表随机变量的取值,纵坐标代表发生的概率。幂律分布的曲线呈现向下延伸的形态,就像一个长长的尾巴。这告诉我们,在随机变量中,较小的数值出现的概率较大,而较大的数值出现的概率较小。而且,幂律分布的数学特征是“无标度”的,无论观测尺度如何,幂律分布都表现出同样的分布特征。例如,图书销量就大致符合幂律分布,最畅销的书的销量占比,与前几名甚至前十名的销量占比大致相同。

相比于正态分布,幂律分布在数学上更为简单,不需要考虑方差、标准差或波动等复杂概念。这种看似简单的分布却给人类带来了许多困扰。它使得人类社会充满了巨大的不确定性。以订外卖为例,我们时刻需要关注骑手的位置,因为巨大的不确定性让人焦虑不安。这种不确定性主要表现在三个方面:

幂律分布使得平均数的概念失去意义。在正态分布中,大多数数据都集中在平均值附近,所以平均值非常有用。但在幂律分布中,数据的变化幅度非常大,平均值在这里并不具有代表性。以个人收入为例,少数拥有庞大财富的人会将平均值大幅拉高,使得平均数失去参考价值。在统计社会居民收入时,中位数比平均数更有意义,因为大部分人的收入并不高。

幂律分布的不确定性还表现在极端数据的发生上。虽然极端数据出现的概率很低,但这个概率永远也不会是0。这意味着在幂律分布中,总会有一些极端事件出现,如超大规模的自然灾害或金融危机等。我们不能忽略这些极端事件的可能性,而是要时刻做好准备应对。

幂律分布带来的第三个不确定性是无法预测。我们无法预测千亿美元级别的富豪会在何时出现,也无法预测下一次金融风暴或自然灾害何时发生以及它的规模和形式。这种不确定性让我们在面对复杂系统时束手无策。即使是最简单的模型实验,如堆沙堆最终会导致沙崩的现象,我们也无法预测沙崩发生的具体原因和规模。

尽管幂律分布看似是一个魔鬼,让我们在面对它时感到无所适从,但我们也可以从另一个角度看待它。虽然它总是通过自然灾害和社会危机给我们带来惊吓,但它也会给我们带来巨大的惊喜。例如基因突变中的极少数突变会赋予生物巨大的变化。同时我们也知道宇宙虽然整体上可能处于熵增状态但熵减的情况也会发生这就给我们带来了希望时间箭头可能会逆转让我们对未知保持敬畏但也不必过度恐惧因为未知中也隐藏着无限的可能和机遇。

  方差标准差计算方法