正規分布の特性から、逆に95%の確率で出現を言い当てられる区間を決められることを読んだ。
標準正規分布、一般正規分布の95%予言的中区間についてまとめてみる。
標準正規分布の95%予言的中区間
平均\(\mu=0\)、標準偏差\(\sigma=1\)の標準正規分布において、
1\(\sigma\)区間の相対度数の和は約0.68、2\(\sigma\)区間の相対度数の和は約0.95。
逆にいうと、
標準正規分布から出現する値を”-1から+1の範囲の値”とすると約68%の確率で予言することになる。
また、”-2から+2の範囲の値”とすると、約95%の確率で予言することになる。
(確率を可能性の意味で使っていない)
確率の方を95%ぴったりとすると、範囲は”-1.96から+1.96″となる。
これを95%予言的中区間と言う。
次回に観測する値が95%の確率で-1.96から+1.96の範囲に入ることを予測している。
もともと定義域が無い(\(-\inftyから+\infty\))中で、いきなり-1.96から+1.96という範囲を
持ち出して、そこに入る確率が95%であるというのは強烈。
一般正規分布の95%予言的中区間
標準正規分布\(x\)に対して、以下の変換により一般正規分布を得る。
\begin{eqnarray}
z = \sigma x + \mu
\end{eqnarray}
対象線が\(x=0\)から\(x=\mu\)にシフトし、\(\sigma\)区間が1から\(\sigma\)に遷移する。
95%予言的中区間は\(-(1.96\sigma+\mu)\) から\(+(1.96\sigma+\mu)\)となる。
平均\(\mu\)、標準偏差\(\sigma\)を満たす正規分布であれば、
次回観測するデータは95%の確率で\(-(1.96\sigma+\mu)\) から\(+(1.96\sigma+\mu)\)の範囲である、
という強烈さ。
95%予言的中区間の不等式表現
標準偏差を軸にすると正規分布がかなりわかりやすくなる。
「標準偏差何個分のずれの範囲」を不等式にすると、さらに直接的になる。
xが平均\(\mu\)、標準偏差\(\sigma\)を満たす正規分布である場合、
以下のように変換することで標準正規分布\(z\)を得られる。
(\(z\)の変換の意味は、データが平均値\(\mu\)から標準偏差\(\sigma\)いくつ分ずれているか、を表す)
\begin{eqnarray}
z = \frac{(x-\mu)}{\sigma}
\end{eqnarray}
xが平均\(\mu\)、標準偏差\(\sigma\)を満たす正規分布である場合、
95%予言的中区間は以下の不等式で得られる範囲である。
\begin{eqnarray}
-1.96 \leq \frac{(x-\mu)}{\sigma} \leq +1.96
\end{eqnarray}