-
最尤推定とベイズの定理とMAP推定
最尤推定とMAP推定とベイズの定理は繋がっていたので、 記憶が定かなうちに思いの丈を書き出してみるテスト。俯瞰してみると面白い。 あるデータ達\(x\)が観測されていて、それらは未知のパラメータを持つ …
-
正規分布に従う確率変数の二乗和はカイ二乗分布に従うことを実際にデータを表示して確かめる
以前、”正規分布に従う確率変数の二乗和はカイ二乗分布に従うことの証明”という記事を書いた。 記事タイトルの通り、正規分布に従う確率変数の二乗和はカイ二乗分布に従う。 実際にデー …
-
PHPで統計アプリを作れるか否か
LaravelをAPIサーバにして同期的にsklearnのPCAを実行するアプリを作ってみました。 jQyery/bootstrap/chart.jsがフロント、APIサーバはLaravel+MySQ …
-
球面集中現象を理解するために必要そうなことの理解 – 極座標・直行座標変換,
球面集中現象を理解するために記憶にないことが多すぎるので 理解に必要そうなことを少しずつ復習していきます。 まず極座標の直行座標変換。極座標を使って球の体積を求めてみます。 次の記事で球の体積を求める …
-
sklearnとmatplotlibでsihoutte係数を見てみようとして失敗した話とyellowbrick
sihoutteって何て読むのか…と思うけども”シルエット”だそう。フランス語源。 ポートレート写真を背景白、顔を黒に減色した例の”シルエット̶ …
-
エルボー法とは , サンプルデータへの適用例
k-means法を実行する際に妥当なkを決めたいという欲求があります。 クラスタ集合の凝集度を定量化することでkと凝集度の関係を得られます。 複数のkについてkと凝集度の関係を取得し、 そこから妥当な …
-
階層型クラスタリングとdendrogram / 空間拡散性、単調性の確認
前回適当に作ったデータを使って階層型クラスタリングを試してみる。 階層型クラスタリングの様子をdendrogramというツールを使って可視化できるのと、 クラスタ間距離の違いによってクラスタの作られ方 …
-
6個のデータポイント近隣に発生させたデータ達を6-meansでクラスタ分割できるか
multivariate_normalを使って6個のデータポイント近隣にデータ達を発生させる。 薄くクラスタを見つけられそうだけれど境界は曖昧で大分被っているという状況。 そんなデータ達に6-mean …
-
自力で生成したデータポイントに対して自力でクラスタ分割してみる
クラスタリングについて凄まじくわかりやすい説明を聞いて感動しました。 k-meansを自力で書くことで理解が深まりそうなので、参考にしながらアプトプットしてみます。 前回のエントリで、多次元正規分布に …
-
多次元正規分布に従うデータを生成する
2019/07/10 -NumPy/Pandas, クラスタリング
日々の学びそろそろ適当なデータを見つけてきて手法を試すのとは別に、 自力でデータを作って試してみたいと思い、NumPyを使った生成法を調べてみた。 一口に乱数といっても、正規分布に従う標本の生成のこと。 多次元 …