FrontPageJHParkmagnolia Covariance
X Y
2 1
3 2
5 4
3 3
7 5
sum 20 15
mean 4 3
n 5 5
covar.jpg
[JPG image (25.56 KB)]

perfect
positive
negative
0
cor1small.jpg
[JPG image (12.09 KB)]

cor0small.jpg
[JPG image (24.56 KB)]

cor-1small.jpg
[JPG image (12.43 KB)]



Covariance: X와 Y가 같이 변하는 정도
VarX: X의 구성원이 변하는 정도
VarY: Y의 구성원이 변하는 정도
CovX,Y: X와 Y가 동시에 변하는 정도
`Var[X]=[sum(X_i-bar(X))^2]/n=[sum(X_i-bar(X))(X_i-bar(X))]/n=s_X^2`
`Var[Y]=[sum(Y_i-bar(Y))^2]/n=[sum(Y_i-bar(Y))(Y_i-bar(Y))]/n=s_Y^2`
`Cov[X,Y]=[sum(X_i-bar(X))(Y_i-bar(Y))]/n=s_(XY)`


X Y ds(X) ds(Y) ds(X)^2 ds(Y)^2
2 1 -2 -2 4 4
3 2 -1 -1 1 1
5 4 1 1 1 1
3 3 -1 0 1 0
7 5 3 2 9 4 . mean 4 3 16 10
n 5 s^2 3.2 2
s 1.79 1.4


또한,

마지막 식이 문제를 일으킴 . . . . 단위가 달라지면 Covariance amount (공변량)이 달라지는가. . . .
`rho_(XY) = sigma_(XY)/sigma_X sigma_Y`

즉, 상관계수 로(rho)는 X,Y 각 변인의 공변량을 각 변인의 표준편차(sigma)로 나누어 준 값을 말한다. 위는 모집단일 경우이고 샘플에 관한 상관계수는
`r_(XY) = s_(XY)/s_X s_Y` . . . . 위의 데이터를 이용하여 r값을 구해보면
`r_(XY) = 2.4 / [1.79 * 1.414] = .949`

X Y ds(X) ds(Y) ds(X)^2 ds(Y)^2 ds(XY)
2 1 -2 -2 4 4 4
3 2 -1 -1 1 1 1
5 4 1 1 1 1 1
3 3 -1 0 1 0 0
7 5 3 2 9 4 6
mean 4 3 sum 16 10 sum 12
n 5 s^2 3.2 2 cov 2.4
s 1.789 1.414
r
= covx,y/sxsy
0.949
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2012-05-08 14:46:11
Processing time 0.0079 sec