-
sklearnとmatplotlibでsihoutte係数を見てみようとして失敗した話とyellowbrick
sihoutteって何て読むのか…と思うけども”シルエット”だそう。フランス語源。 ポートレート写真を背景白、顔を黒に減色した例の”シルエット̶ …
-
エルボー法とは , サンプルデータへの適用例
k-means法を実行する際に妥当なkを決めたいという欲求があります。 クラスタ集合の凝集度を定量化することでkと凝集度の関係を得られます。 複数のkについてkと凝集度の関係を取得し、 そこから妥当な …
-
階層型クラスタリングとdendrogram / 空間拡散性、単調性の確認
前回適当に作ったデータを使って階層型クラスタリングを試してみる。 階層型クラスタリングの様子をdendrogramというツールを使って可視化できるのと、 クラスタ間距離の違いによってクラスタの作られ方 …
-
6個のデータポイント近隣に発生させたデータ達を6-meansでクラスタ分割できるか
multivariate_normalを使って6個のデータポイント近隣にデータ達を発生させる。 薄くクラスタを見つけられそうだけれど境界は曖昧で大分被っているという状況。 そんなデータ達に6-mean …
-
自力で生成したデータポイントに対して自力でクラスタ分割してみる
クラスタリングについて凄まじくわかりやすい説明を聞いて感動しました。 k-meansを自力で書くことで理解が深まりそうなので、参考にしながらアプトプットしてみます。 前回のエントリで、多次元正規分布に …
-
多次元正規分布に従うデータを生成する
2019/07/10 -NumPy/Pandas, クラスタリング
日々の学びそろそろ適当なデータを見つけてきて手法を試すのとは別に、 自力でデータを作って試してみたいと思い、NumPyを使った生成法を調べてみた。 一口に乱数といっても、正規分布に従う標本の生成のこと。 多次元 …
-
Ward距離を使った階層型クラスタリング (お試し実行なし)
階層型クラスタリングについてわかりやすい解説を聞いたので頭の中にあるものを書き出してみます。 (せっかく聞いたシャープな解説が台無しになってしまっているかと思いますが…) 本当はもっとアク …
-
k-means法と近似解法 考え方
教師なし学習の問題。クラスタリング。 クラスタの個数を事前に指定するタイプと、自分でクラスタ数を設定できるタイプがあります。 今回、前者のk-means法をアイデアを聞いたので、まとめなおしてみようと …