| X | Y |
| 2 | 1 |
| 3 | 2 |
| 5 | 4 |
| 3 | 3 |
| 7 | 5 |
sum | 20 | 15 |
mean | 4 | 3 |
n | 5 | 5 |
[JPG image (25.56 KB)]
perfect
positive
negative
0
[JPG image (12.09 KB)]
[JPG image (24.56 KB)]
[JPG image (12.43 KB)]
Covariance: X와 Y가 같이 변하는 정도
Var
X: X의 구성원이 변하는 정도
Var
Y: Y의 구성원이 변하는 정도
Cov
X,Y: X와 Y가 동시에 변하는 정도
`Var[X]=[sum(X_i-bar(X))^2]/n=[sum(X_i-bar(X))(X_i-bar(X))]/n=s_X^2`
`Var[Y]=[sum(Y_i-bar(Y))^2]/n=[sum(Y_i-bar(Y))(Y_i-bar(Y))]/n=s_Y^2`
`Cov[X,Y]=[sum(X_i-bar(X))(Y_i-bar(Y))]/n=s_(XY)`
| X | Y | ds(X) | ds(Y) | ds(X)^2 | ds(Y)^2 |
| 2 | 1 | -2 | -2 | 4 | 4 |
| 3 | 2 | -1 | -1 | 1 | 1 |
| 5 | 4 | 1 | 1 | 1 | 1 |
| 3 | 3 | -1 | 0 | 1 | 0 |
| 7 | 5 | 3 | 2 | 9 | 4 | . | mean | 4 | 3 | | | 16 | 10 |
n | 5 | | | s^2 | 3.2 | 2 |
| | | | s | 1.79 | 1.4 |
마지막 식이 문제를 일으킴 . . . . 단위가 달라지면 Covariance amount (공변량)이 달라지는가. . . .
`rho_(XY) = sigma_(XY)/sigma_X sigma_Y`
즉, 상관계수 로(rho)는 X,Y 각 변인의 공변량을 각 변인의 표준편차(sigma)로 나누어 준 값을 말한다. 위는 모집단일 경우이고 샘플에 관한 상관계수는
`r_(XY) = s_(XY)/s_X s_Y` . . . . 위의 데이터를 이용하여 r값을 구해보면
`r_(XY) = 2.4 / [1.79 * 1.414] = .949`
| X | Y | ds(X) | ds(Y) | ds(X)^2 | ds(Y)^2 | | ds(XY) |
| 2 | 1 | -2 | -2 | 4 | 4 | | 4 |
| 3 | 2 | -1 | -1 | 1 | 1 | | 1 |
| 5 | 4 | 1 | 1 | 1 | 1 | | 1 |
| 3 | 3 | -1 | 0 | 1 | 0 | | 0 |
| 7 | 5 | 3 | 2 | 9 | 4 | | 6 |
mean | 4 | 3 | | sum | 16 | 10 | sum | 12 |
n | 5 | | | s^2 | 3.2 | 2 | cov | 2.4 |
| | | | s | 1.789 | 1.414 | | |
| | | | | | | r
= covx,y/sxsy | 0.949 |