科技改變生活 · 科技引領未來
協方差表示兩個隨機變量之間的相關程度,可以通過以下公式計算:
$$
Cov(X,Y)=E[(X-E(X))(Y-E(Y))]
$$
其中,$X$和$Y$分別為兩個隨機變量,$E(X)$和$E(Y)$分別為它們的期望值。
具體計算步驟如下:
1. 計算$X$和$Y$的期望值$E(X)$和$E(Y)$;
2. 對于每組取值$(x_i,y_i)$,計算$(x_i-E(X))(y_i-E(Y))$;
3. 將第2步的結果求和,然后除以樣本量$n$即可得到協方差。
需要注意的是,協方差的值的正負與兩個隨機變量之間的相關性有關。當協方差的值為正時,表示兩個隨機變量是正相關的;而當協方差的值為負時,則表示它們是負相關的。
舉例:
Xi 1.1 1.9 3
Yi 5.0 10.4 14.6
E(X) = (1.1+1.9+3)/3=2
E(Y) = (5.0+10.4+14.6)/3=10
E(XY)=(1.1×5.0+1.9×10.4+3×14.6)/3=23.02
Cov(X,Y)=E(XY)-E(X)E(Y)=23.02-2×10=3.02
此外:還可以計算:D(X)=E(X^2)-E^2(X)=(1.1^2+1.9^2+3^2)/3 - 4=4.60-4=0.6 σx=0.77
D(Y)=E(Y^2)-E^2(Y)=(5^2+10.4^2+14.6^2)/3-100=15.44 σy=3.93
X,Y的相關系數:
r(X,Y)=Cov(X,Y)/(σxσy)=3.02/(0.77×3.93) = 0.9979
表明這組數據X,Y之間相關性很好!
首先你的定義要弄懂,協方差永遠是相對于至少兩個以上變量的,比如cov(x,y)。
如果你見過cov(x)只是cov(x,x)的縮寫,cox(x)=cov(x,x)=D(x)
因此沒有"xy乘積的協方差"這個東西,要有的話意思也是cov(xy,xy)即D(xy)。
可以先令Z=X+Y,然后表示成兩個矩陣乘積的形式,這樣就可以求出Z的分布,然后利用和的方差等于方差的和減兩倍的協方差就可以求出協方差了。
協方差公式為cov(X,Y)=E{[X-E(X)].[Y-E(Y)]}
協方差是針對兩個隨機變量X和Y來說的如果E{[X-E(X)].[Y-E(Y)]}存在,則成為X與Y的協方差,記作cov(X,Y)。
其中E()意思是隨機變量的期望
皮爾遜相關也稱為積差相關(或積矩相關)是英國統計學家皮爾遜于20世紀提出的一種計算直線相關的方法。
假設有兩個變量X、Y,那么兩變量間的皮爾遜相關系數可通過以下公式計算:公式一:公式二:公式三:公式四:以上列出的四個公式等價,其中E是數學期望,cov表示協方差,N表示變量取值的個數。robots