「統計・機械学習」 一覧

標本の標準偏差とルートnの法則

平均\(\mu\)、標準偏差\(\sigma\)からなる母集団から標本を取り出したとき、 標本の平均は母集団の平均\(\mu\)に収束する。 では、もう一つの統計量である標準偏差はどうか。 意外と簡単 ...

大数の法則(弱法則)の証明

統計の基本中の基本らしい もう、統計の基本中の基本らしい大数の法則。 ランダムサンプリングした標本から母集団を推測できる話の根幹。 ビッグデータを全量検査しなくても同じかもしれない。 不明な母集団から ...

レアな観測がレアであることの定式化

レアな観測がレアであることの定式化 マルコフの不等式。 任意の確率変数\(X\)と\(a\gt 0\)に対して以下が成りなってしまう。 \begin{eqnarray} P(|X|\ge a) \le ...

95%信頼区間

95%信頼区間に関する本を読んだのでまとめてみる。 仮説検定振り返り まず、仮説検定について振り返る。 母集団が正規分布(平均\(\mu\)、標準偏差\(\sigma\))に従うとき、母集団の数をNと ...

母集団の推測と仮説検定

母集団の推定 背後に正規分布に従う母集団があるとして、そこからあるデータ\(x\)が観測されたとする。 観測されたデータ\(x\)から、母集団を推測しようとする試みについてまとめてみる。 仮説検定 標 ...

予言的中区間

正規分布の特性から、逆に95%の確率で出現を言い当てられる区間を決められることを読んだ。 標準正規分布、一般正規分布の95%予言的中区間についてまとめてみる。 標準正規分布の95%予言的中区間 平均\ ...

標準正規分布と一般正規分布の\(\sigma\)区間

確率密度関数を扱わないで正規分布をうまく説明する本を読んだので、 理解のためにまとめてみる。 標準正規分布 平均が0、標準偏差が1である分布をもつデータセットについて度数分布表を書くとする。 データセ ...

S.D.(Standard Deviation)の定義の導出

データセットのバラツキを縮約する統計量である分散と標準偏差について、 単なる概念ではなくて、直感的な理解の助けになる読み物を読んだのでまとめてみる。 偏差\( \sigma^2 \) とは平均 \( ...

統計検定

2018/02/27   -統計・機械学習

前からだったかもしれないけども、気づいたら統計検定がCBTになっていた。 正確には2級までがCBT。 2級の出題範囲表を眺めてみる。出題範囲は以下の通り。 出題範囲 大学1年か2年でやる一般教養の「統 ...

コサイン類似度 Cosine Simirality

BoW化した文章同士の類似度を求める一番メジャーなやり方。 内積の定義を式変形しただけ。 $$ \begin{eqnarray} cos(\vec{q},\vec{d}) &=& \frac{\vec ...

Copyright© ikuty.com , 2018 AllRights Reserved Powered by AFFINGER4.