协方差计算公式_协方差cov与相关系数


在之前的文章中,我们讨论了相关系数这一概念,今天我们将探讨与其密切相关的另一个概念——协方差。为了更好地理解协方差,让我们先回顾一下基础的统计知识。

1. 均值

它是描述一组数值的中心趋势的统计量。简单来说,一组数值加总后除以数值的总数,即可得到其均值。

2. 方差(标准差、标准方差)

标准差是衡量一组数值自平均值分散程度的观念。数值的分布越离散,标准差就越大;反之,数值越接近平均值,标准差就越小。在统计学中,尤其是处理样本数据时,我们通常使用特定的公式来计算标准差。

3. 协方差

与方差不同,协方差用于衡量多个变量之间的分散程度或关联程度。当我们要分析多个变量之间的关系时,协方差便派上了用场。

为了更好地理解协方差,可以将其与var(X)进行对比。它们之间存在紧密的关系,var(x,y)实际上就是cov(x,y),即方差是协方差的特例。

举个例子:

假设有两个数列X和Y:X=(3, 2, 4, 5, 6),Y=(9, 7, 12, 15, 17)。首先需要计算这两个数列的期望值,再利用特定的公式逐一计算协方差。Excel软件也提供了方便的协方差计算公式。

4. 协方差矩阵

协方差矩阵是在多个变量之间计算协方差的基础上得到的。对于多个变量,我们需要两两计算它们之间的协方差,最后得到一个矩阵。比如有三个变量a、b、c,我们可以计算出cov(a, a)、cov(a, b)、cov(a, c)等元素,组成一个3x3的对称矩阵。这个矩阵实际上很简单,它清晰地展示了各个变量之间的协方差关系。