2項分布に従う母集団の母平均を推測するために有意水準を設定して95%信頼区間を求めてみた。
母平均のあたりがついていない状況だとやりにくい。
ちょっと不思議な計算をしてみる。 仮定に仮定を積み重ねた素人の統計。 成功か失敗かを応答する認証装置があったとする。 1回の試行における成功確率\(p\)は試行によらず一定でありベルヌーイ試行である。 \(n\)回の独立な試行を繰り返したとき、成功数\(k\)を確率変数とする離散確率変数に従う。 二項分布の確率密度関数は以下の通り。 \begin{eqnarray} P(X=k)= {}_n C_k p^k (1-p)^{n-k} \end{eqnarray} 期待値、分散は、 \begin{eqnarray} E(X) &=& np \\ V(X) &=& np(1-
\(\hat{p}\)がどんな値であっても下限は\(\hat{p}\)の関数で抑えられると思ったので、
気になって\(\hat{p}\)を変数のまま残すとどうなるかやってみた。
\begin{eqnarray}
1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \le 0.05 \\
\frac{1.96}{0.05}\sqrt{\hat{p}(1-\hat{p})} \le \sqrt{n} \\
39.2^2 \hat{p}(1-\hat{p}) \le n
\end{eqnarray}
左辺を\(f(\hat{p})\)と置くと \(f(\hat{p})\)は下に凸の2次関数であって、
\(\frac{d}{d\hat{p}}f(\hat{p})=0\)の時に最大となる。というか\(\hat{p}=0.5\)。
\(\hat{p}=0.5\)であるとすると、これはアンケートを取るときのサンプル数を求める式と同じで、
非常に有名な以下の定数が出てくる。
\begin{eqnarray}
1537 * 0.5 (1-0.5) \le n \\
384 \le n
\end{eqnarray}
\(\hat{p}\)がどんな値であっても、サンプル数を400とれば、
有意水準=5%の95%信頼区間を得られる。
だから、アンケートの\(n\)数はだいたい400で、となる。
さらに、有意水準を10%にとれば、\(n\)の下限は100で抑えられる。
なるはやのアンケートなら100、ちゃんとやるには400、というやつがこれ。