우선, Expected value (기대값)와 Variance (분산)의 연산은 아래와 같이 계산될 수 있다.
X,Y are Independent variables.
이때, 한 샘플의 평균값을

라고 하면, 평균들의 합인

는
이렇게 얻은 샘플들(k 개의)의 평균인

는,
이때,
이다.
그렇다면,

에 관한 기대값과 분산값은:
![\begin{align*}
E[A_k] & = E[\frac{S_k}{k}] \\
& = \frac{1}{k}*E[S_k] \\
& = \frac{1}{k}*k*\mu = \mu
\end{align*}
\begin{align*}
E[A_k] & = E[\frac{S_k}{k}] \\
& = \frac{1}{k}*E[S_k] \\
& = \frac{1}{k}*k*\mu = \mu
\end{align*}](/_cache/latex/3/37/ce69a40645db99b5543d3f72a19e2698.png)
이고,
![\begin{align*}
Var[A_k] & = Var[\frac{S_k}{k}] \\
& = \frac{1}{k^2} Var[S_k] \\
& = \frac{1}{k^2}*k*\sigma^2 \\
& = \frac{\sigma^2}{k} \nonumber
\end{align*}
\begin{align*}
Var[A_k] & = Var[\frac{S_k}{k}] \\
& = \frac{1}{k^2} Var[S_k] \\
& = \frac{1}{k^2}*k*\sigma^2 \\
& = \frac{\sigma^2}{k} \nonumber
\end{align*}](/_cache/latex/7/7f/72c07276f88b0d7c93a38c28716d0ae7.png)
라고 할 수 있다.
한편, 분산값은
라고 할때,
![$ Var[X + Y] $ $ Var[X + Y] $](/_cache/latex/c/c3/053b4d37da525adc41dbd9a1ae2f3af4.png)
를 구하고자 한다면, 우선
이라고 할 때,
그런데
![$ E[XY] = E[X] E[Y], $ $ E[XY] = E[X] E[Y], $](/_cache/latex/a/af/55517045fff6b916aeac670ffd5b945d.png)
,

와

가 서로 독립적 (independent) 이므로
이에 따라 위의
![$ [a] $ $ [a] $](/_cache/latex/1/18/bc7c1963d47608f899ede881746e2aca.png)
에서,
한편,
그리고 Sampling distribution of mean과 관련된 샘플 평균들에 대한 기대값
![$E[\overline{X}]$ $E[\overline{X}]$](/_cache/latex/1/16/62ed1eb86d4cfd41a9cae82d727362bd.png)
과
![$Var[\overline{X}]$ $Var[\overline{X}]$](/_cache/latex/7/70/41a6322d034a295c0a306cfcab60207a.png)
는 각각
같은 논리로 sampling distribution of sample variance를 구한다고 하면, 그리고 이를 구할 때 n을 사용한다고 하면,
위에서
![$ E \left [ \displaystyle \overline{X}^2 \right ] = Var \left [\overline{X} \right ] + \mu = \frac{\sigma^2}{n} + \mu $ $ E \left [ \displaystyle \overline{X}^2 \right ] = Var \left [\overline{X} \right ] + \mu = \frac{\sigma^2}{n} + \mu $](/_cache/latex/9/97/3c59916f6e944a16e3af24c5d37f158b.png)
이므로
4의 식은
즉 sample에서 구하는 variance로 모집단의 variance를 구하는데 오차가 보인다. 이를 모집단의 variance와 근사하게 하기 위해서