確率変数\(X\)を使って表される確率分布の様子を表す指標について。
最も基本的なのが期待値\(E(X)\)であって、次が分散\(V(X)\)。
さらに、期待値\(E(X)\)を中心として左右のどちらに歪んでいるかを表す歪度\(\alpha_3\)、
期待値\(E(X)\)近辺が全体と比較してどの程度尖っているかを表す尖度\(\alpha_4\)がある。
その調子で、確率分布の特徴を表す指標は無数に作ることができる。
モーメント母関数の\(r\)階導関数から得られる各次数のモーメントが期待値、分散、歪度、尖度である、
という究極的にシンプルな話を読んでかなり感動したのだが、
モーメント母関数の\(r\)階導関数からモーメントを導出するのは次回として、
まず、歪度、尖度をそれぞれ別個に書いてあるのを読んでみる。
歪度
確率分布は常に期待値\(E(X)\)を中心に左右対象という訳ではない。
この非対称性の指標の定義があって歪度が使われる。歪度は\(\alpha_3\)という記号を使う。
その定義は以下の通り。
\begin{eqnarray}
\alpha_3 = E(X-\mu )^3 / \sigma^3
\end{eqnarray}
\(\alpha_3 \ge 0\)ならば左の裾が長い。
\(\alpha_3 \le 0\)ならば右の裾が長い、と読む。
また、\(|\alpha_3|\)は左右の歪みの程度を表す。
\(\alpha_3\)を定義通り計算しても値が得られるが、
以下のようにしておくとより楽に得られる。
\begin{eqnarray}
E(X-\mu)^3 &=& E(X^3) – 3\mu E(X^2) + 3\mu^2 E(X) – \mu^3 \\
&=& E(X^3) – 3\mu E(X^2) + 2\mu^3
\end{eqnarray}
なんで\(\alpha_3\)の式が確率分布の歪みを表すのか。
\( \mu = E(X) \)を中心に、\(X-\mu \ge 0\)を満たす確率よりも\(X-\mu \le 0 \)を満たす確率の方が少なければ、
\(X-\mu\)は右に歪んでいるといえる。逆も真。
3次の式\(y=x^3\)は、\(x \ge 0\)であれば正、\(x \le 0 \)であれば負であるという特徴がある。
この特徴を使うと、\( E(X-\mu)^3 \)の正負は、\(X-\mu\)の正負と一致すると言える。
さらに、大きさを規格化するため、\( E(X-\mu)/\sigma \)の正負を考えることとし、\( (X-\mu)^3 / \sigma^3 \)が出てくる。
尖度
分布の頂点がどれだけ尖っているかを表すのが尖度\(\alpha_4\)。
正規分布の尖度を3とし、
\(\alpha_4-3 \gt 0\)であれば正規分布より尖っている。
\(\alpha_4 \lt 0\)であれば正規分布より尖っていない、とする。
これも\(y = x^4 \) の特徴から導かれる。
\(x=0\)近辺の値と、\(x=0\)から離れた値を比べたとき、
前者は\(y = x^4 \) に対して小さな値を出力し、後者は大きな値を出力する。
\(x=0\)から離れると急激に値が大きくなるという特徴がある。
つまり、\(E(X-\mu)^4\)を見たとき、
確率値が\(\mu\)の近辺にあれば値は0に近く、\(\mu\)から離れた値が多ければ急激に値が大きくなる。
大きさを規格化し、\(E(X-\mu)^4/\sigma^4\)を尖度として利用する。
\(\alpha_3\)と同様に、直接計算する方法もあるが、以下のように計算することもできる。
\begin{eqnarray}
E(X-\mu)^4 &=& E(X^4) – 4\mu E(X^3) + 6 \mu E(X^3) -4 \mu^3 E(X) + \mu ^4 \\
&=& E(X^4) – 4\mu E(X^3) + 6 \mu E(X^2) – 3 \mu^4
\end{eqnarray}
モーメント母関数のr階導関数
期待値、分散、歪度、尖度は、モーメント母関数から統一的に導かれる。
これがまたすごいので次のエントリで書いてみる。