FrontPage › EstimatedStandardDeviation
Difference between r1.64 and the current
@@ -72,35 +72,42 @@
\end{align*}}}}
라고 할 수 있다.
라고 할 수 있다.
한편, 분산값은
{{{#!latex
\begin{align*}
Var[X] & = E{(X-\mu)^2} \\
Var[X] & = {E{(X-\mu)^2}} \\
& = E[(X^2 - 2 X \mu + \mu^2)] \\& = E[X^2] - 2 \mu E[X] + E[\mu^2] \\
& = E[X^2] - 2 \mu E[X] + E[\mu^2], \;\; \text{because E[X]=} \mu \text{, \; E[} \mu^2 \text{] = } \mu^2, \\
& = E[X^2] - 2 \mu^2 + \mu^2 \\
& = E[X^2] - \mu^2
& = E[X^2] - \mu^2 \;\;\; \dots \dots \dots \dots \dots [1]
\end{align*}}}}
라고 할때,
$ Var[X + Y] $ 를 구하고자 한다면, 우선
\begin{align}
\displaystyle E[X] = a \\
\displaystyle E[Y] = b
\displaystyle E[X] = \mu_{X} = a \\
\displaystyle E[Y] = \mu_{Y} = b
\end{align}}}}
이라고 할 때,
{{{#!latex
\begin{align*}
Var [X + Y] & = \displaystyle E[(X+Y)^2] - (a+b)^2 \\
& = E[(X^2 + 2XY + Y^2)] - (a^2 - 2ab - b^2) \;\cdots\;\cdots\; \cdots\; [a] \end{align*}
}}}
@@ -121,11 +128,17 @@
& = Var[X] + Var[Y] \end{align*}
}}}
{{|
한편,
{{{#!latex
\begin{align*}
\overline{X} & = \frac { \displaystyle \sum_{i=1}^n (X_i)} {n} \\
s_{\overline{X}} & = \frac {\displaystyle \sum_{i=1}^n (X_i - \overline{X})^2} {n-1}
\end{align*}
}}}
그리고 Sampling distribution of mean과 관련된 샘플 평균들에 대한 기대값 $E[\overline{X}]$ 과 $Var[\overline{X}]$ 는 각각
@@ -136,14 +149,17 @@
& = \mu \;\cdots\;\cdots\;\cdots\;\cdots \;[2] \\Var[\overline{X}] & = Var[\frac{1}{n} \sum_{\tiny{i=1}}^{\tiny{n}} \overline{X_i}] \\
& = \frac{1}{n^2} n \sigma^2 \\
& = \frac{\sigma^2}{n} \;\cdots\;\cdots\;\cdots\;\cdots \;
& = \frac{\sigma^2}{n} \;\cdots\;\cdots\;\cdots\;\cdots \;[3]
\end{align*}}}}
같은 논리로 sampling distribution of samle variance를 구한다고 하면, 그리고 이를 구할 때 n을 사용한다고 하면,
같은 논리로 sampling distribution of sample variance를 구한다고 하면, 그리고 이를 구할 때 n을 사용한다고 하면,
\begin{align*}
E[S^2] & = E \left [ \frac{1}{\large n} \sum_{i=1}^n (X_i- \overline{X})^2 \right ] \\
E[s^2] & = E \left [ \frac{1}{\large n} \sum_{i=1}^n (X_i- \overline{X})^2 \right ] \\
& = \frac{1}{\large n} E \left [ \sum_{i=1}^n (X_i^2 - 2\overline{X}X_i + \overline{X}^2) \right ] \\& = \frac{1}{\large n} E \left [ \sum_{i=1}^n X_i^2 - \sum_{i=1}^n 2\overline{X}X_i + \sum_{i=1}^n \overline{X}^2 \right ] \\
& = \frac{1}{\large n} E \left [ \sum_{i=1}^n X_i^2 - 2n\overline{X}^2 +n\overline{X}^2 \right ] \\
@@ -152,20 +168,26 @@
\end{align*}}}}
\begin{align*}
\sum 2 X_i \overline{X} & = 2 \overline{X} n \overline{X} \\
& = 2n \overline{X}^2 \nonumber
\sum 2 X_i \overline{X} & = 2 \sum X_i \overline{X} \\
& = 2 n \overline{X} * \overline{X} \;\; \text {because} \;\; \overline{X} = \frac {\sum X_i} {n} \;\;\\
& = 2 n \overline{X}^2
\end{align*}}}}
$E \left [ \overline{X}^2 \right ] = Var \left [\overline{X}^2 \right ] + \mu = \frac{\sigma^2}{n} + \mu $ 이므로 [4]의 식은
$ E \left [ \displaystyle \sum_{i=1}^n X_i^2 \right ] = Var[X_i] + \mu = \sigma^2 + \mu$
$ E \left [ \displaystyle \overline{X}^2 \right ] = Var \left [\overline{X} \right ] + \mu = \frac{\sigma^2}{n} + \mu $ 이므로 [4]의 식은
{{{#!latex
\begin{align*}
@@ -176,10 +198,14 @@
\end{align*}}}}
$E[S^2] = \frac{(n-1)\sigma^2}{n} * \frac{n}{n-1} = \sigma^2 $
$ \displaystyle \frac{n}{n-1} $
을 [5]에 곱하면,
$ E[S^2] = \displaystyle \frac{(n-1)\sigma^2}{n} * \frac{n}{n-1} = \sigma^2 $
----
CategoryResearchMethods
- See Also Variance
Estimated value of SD ¶
우선, Expected value (기대값)와 Variance (분산)의 연산은 아래와 같이 계산될 수 있다.
X,Y are Independent variables.
이때, 한 샘플의 평균값을 라고 하면, 평균들의 합인 는
이렇게 얻은 샘플들(k 개의)의 평균인 는,
이때,
이다.
그렇다면, 에 관한 기대값과 분산값은:
이고,
라고 할 수 있다.
한편, 분산값은
라고 할때,
를 구하고자 한다면, 우선
이라고 할 때,
그런데
, 와 가 서로 독립적 (independent) 이므로
이에 따라 위의 에서,
한편,
그리고 Sampling distribution of mean과 관련된 샘플 평균들에 대한 기대값 과 는 각각
같은 논리로 sampling distribution of sample variance를 구한다고 하면, 그리고 이를 구할 때 n을 사용한다고 하면,
위에서
여기서 1에서의 결과를 적용하면,
즉 sample에서 구하는 variance로 모집단의 variance를 구하는데 오차가 보인다. 이를 모집단의 variance와 근사하게 하기 위해서
을 5에 곱하면,