2項分布に従う母集団の母平均を推測するために有意水準を設定して95%信頼区間を求めてみた。
母平均のあたりがついていない状況だとやりにくい。
\(\hat{p}\)がどんな値であっても下限は\(\hat{p}\)の関数で抑えられると思ったので、
気になって\(\hat{p}\)を変数のまま残すとどうなるかやってみた。
\begin{eqnarray}
1.96\sqrt{\frac{\hat{p}(1-\hat{p})}{n}} \le 0.05 \\
\frac{1.96}{0.05}\sqrt{\hat{p}(1-\hat{p})} \le \sqrt{n} \\
39.2^2 \hat{p}(1-\hat{p}) \le n
\end{eqnarray}
左辺を\(f(\hat{p})\)と置くと \(f(\hat{p})\)は下に凸の2次関数であって、
\(\frac{d}{d\hat{p}}f(\hat{p})=0\)の時に最大となる。というか\(\hat{p}=0.5\)。
\(\hat{p}=0.5\)であるとすると、これはアンケートを取るときのサンプル数を求める式と同じで、
非常に有名な以下の定数が出てくる。
\begin{eqnarray}
1537 * 0.5 (1-0.5) \le n \\
384 \le n
\end{eqnarray}
\(\hat{p}\)がどんな値であっても、サンプル数を400とれば、
有意水準=5%の95%信頼区間を得られる。
だから、アンケートの\(n\)数はだいたい400で、となる。
さらに、有意水準を10%にとれば、\(n\)の下限は100で抑えられる。
なるはやのアンケートなら100、ちゃんとやるには400、というやつがこれ。