-
SageMaker用のコードをローカルで動かす – scikit-learnの決定木でアヤメの種類を分類
SageMakerはローカルで使うことができるので、それを試してみた。 この記事を書くにあたって以下の公式の記事を参考にしています。 オンプレミス環境から Amazon SageMaker を利用する …
-
ロジスティック回帰
参考書籍を読んでいく. 今回はロジスティック回帰. 未知のサンプルのクラスの所属確率を見積もることができる, という重要なことが書かれている. また重みの学習は勾配降下法のフレームワークの中で統一され …
-
機械学習の分類問題と損失関数の最小化の話
参考にした書籍でこの順序で誘導されていて理解しやすかったです. パーセプトロンによる一番簡単な教師あり学習を理解する ADALINEにより学習を凸で連続なコスト関数の最小化問題として捉える パーセプト …
-
球面集中現象を理解するために必要そうなことの理解 – 極座標・直行座標変換,
球面集中現象を理解するために記憶にないことが多すぎるので 理解に必要そうなことを少しずつ復習していきます。 まず極座標の直行座標変換。極座標を使って球の体積を求めてみます。 次の記事で球の体積を求める …
-
sklearnとmatplotlibでsihoutte係数を見てみようとして失敗した話とyellowbrick
sihoutteって何て読むのか…と思うけども”シルエット”だそう。フランス語源。 ポートレート写真を背景白、顔を黒に減色した例の”シルエット̶ …
-
エルボー法とは , サンプルデータへの適用例
k-means法を実行する際に妥当なkを決めたいという欲求があります。 クラスタ集合の凝集度を定量化することでkと凝集度の関係を得られます。 複数のkについてkと凝集度の関係を取得し、 そこから妥当な …
-
階層型クラスタリングとdendrogram / 空間拡散性、単調性の確認
前回適当に作ったデータを使って階層型クラスタリングを試してみる。 階層型クラスタリングの様子をdendrogramというツールを使って可視化できるのと、 クラスタ間距離の違いによってクラスタの作られ方 …
-
6個のデータポイント近隣に発生させたデータ達を6-meansでクラスタ分割できるか
multivariate_normalを使って6個のデータポイント近隣にデータ達を発生させる。 薄くクラスタを見つけられそうだけれど境界は曖昧で大分被っているという状況。 そんなデータ達に6-mean …
-
自力で生成したデータポイントに対して自力でクラスタ分割してみる
クラスタリングについて凄まじくわかりやすい説明を聞いて感動しました。 k-meansを自力で書くことで理解が深まりそうなので、参考にしながらアプトプットしてみます。 前回のエントリで、多次元正規分布に …
-
多次元正規分布に従うデータを生成する
2019/07/10 -NumPy/Pandas, クラスタリング
日々の学びそろそろ適当なデータを見つけてきて手法を試すのとは別に、 自力でデータを作って試してみたいと思い、NumPyを使った生成法を調べてみた。 一口に乱数といっても、正規分布に従う標本の生成のこと。 多次元 …