統計のど真ん中。大数の法則と中心極限定理。
確かに奇跡的な美しさを感じる…。
同じ確率分布に従う独立な確率変数\(X_1,X_2,\cdots,X_n\)について、\(n\)が大きければ
\(\bar{X}=\frac{X_1+X_2+\cdots+X_n}{n}\)と置いたときに、\(E(\bar{X})=E(X_n)\)として扱ってよかった。
(\(\bar{X}\)は\(\mu\)に確率収束した。\(n\)が次第に大きくなるにつれて\(V(\bar{X)}\)が0に収束した。)
\begin{eqnarray}
\lim_{n \rightarrow \infty}P(|X_n-\mu|\ge \epsilon) \rightarrow 0
\end{eqnarray}
なんとなく、最頻値を峰として\(n\)の増加に伴って峰が険しくなっていきそうだけど、
実際、\(X_i\)がどんな確率分布に従っていたとしても、
\(S_n=X_1+X_2+\cdots+X_n\)は平均\(n\mu\)、標準偏差\(\sqrt{n}\sigma\)の正規分布に従う(と考えて良い)らしい。
\(\bar{X}\)は平均\(\mu\)、標準偏差\(\frac{\sigma}{\sqrt{n}}\)の正規分布に従う。
これが中心極限定理(Central limit theorem)。
\(n\)が大きくなったとき、ランダムウォーク\(S_n\)は平均\(n\mu\)、標準偏差\(\sqrt{n}\sigma\)の分布が正規分布になる、
というのは以下のようにかけるらしい。
右辺は標準正規分布の確率密度関数の定積分。
左辺は既に正規分布であることを前提にしているような…
\begin{eqnarray}
P\left(a \le \frac{S_n -n\mu}{\sqrt{n}\sigma} \le b\right) \rightarrow \int_a^b \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx
\end{eqnarray}
\(\frac{S_n-n\mu}{\sqrt{n}\sigma}=\frac{n(\frac{1}{n}S_n-\mu)}{\sqrt{n}\sigma}=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\) みたいに変形すると、
以下のようにすることもできる。
正規分布を標準正規分布に変換するために(つまり平均=0、標準偏差=1にするために)、
標準偏差で割る(つまり標準偏差何個分か?)変換。
\begin{eqnarray}
P\left(a \le \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} \le b \right) \rightarrow \int_a^b \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}dx
\end{eqnarray}
統計学入門に奇跡的な証明が書いてあるけど完全に写経になるので終わり。