機械学習 | ikuty.com

Ward距離を使った階層型クラスタリング (お試し実行なし)

2019/07/09 -クラスタリング
日々の学び

階層型クラスタリングについてわかりやすい解説を聞いたので頭の中にあるものを書き出してみます。 (せっかく聞いたシャープな解説が台無しになってしまっているかと思いますが…) 本当はもっとアク …

k-means法と近似解法考え方

2019/06/29 -クラスタリング, 機械学習
日々の学び

教師なし学習の問題。クラスタリング。クラスタの個数を事前に指定するタイプと、自分でクラスタ数を設定できるタイプがあります。今回、前者のk-means法をアイデアを聞いたので、まとめなおしてみようと …

sklearnに頼らずRidge回帰を自力で書いてみて正則化項の影響を考えてみるテスト

2019/06/05 -NumPy/Pandas, Python, 回帰
はじめての機械学習, 日々の学び

タイトルの通り。Losso回帰と違って損失関数を偏微分するだけで出来そうなのでやってみる。 Ridge回帰は線形回帰の1種だけれども、損失関数として最小二乗法をそのまま使わず、 \(L_2\)ノルムの …

NP困難な分類問題を代理損失の最小化に帰着させる話

2019/05/27 -分類
はじめての機械学習, 日々の学び

機械学習の分類問題の中心にある決定境界の決定方法についてかなり要領を得た説明を聞いて理解が2段階くらい先に進んだのでまとめてみます。データが与えられただけの状態から決定境界を決める問題はNP困難で …

回帰直線の当てはまりの指標

2019/05/19 -回帰
はじめての機械学習, 日々の学び

前の記事で線形単回帰において訓練データから回帰係数を求める方法を書いてみた。標本平均を使って母平均を推測する話とリンクさせることで、回帰係数の95%信頼区間を求めることができた。回帰係数\(\h …

単回帰曲線における回帰係数の精度（95%信頼区間)

2019/05/15 -回帰
はじめての機械学習, 日々の学び

線形単回帰で推定する回帰係数の精度を評価する方法を読んだのでまとめてみる。当然、真の直線はわからないのだけれども、真の直線があると仮定した上で推定した回帰係数との関係を考えることで、回帰係数の精度 …

損失関数の評価,バイアス-バリアンスと過学習のトレードオフ

2019/04/30 -機械学習
はじめての機械学習, 日々の学び

損失関数をバイアス項、バリアンス項、削減不能誤差の和に分解できることと、損失は削減不能誤差より下回らないこと、バイアス項、バアリアンス項のトレードオフが起こること、を読んだ。過学習っていうのはこう …

損失関数

2019/04/27 -機械学習
はじめての機械学習, 日々の学び

おっさんが入門した軌跡シリーズです。損失関数に関して学んだことをメモしておきます。入力値\(x\)、正解\(t\)からなる訓練データ\(T=(x,t)\)が大量に与えられたときに、 \(f(x,w) …

決定木の分割基準,情報ゲイン,エントロピー

2019/04/24 -情報科学, 機械学習
はじめての機械学習, 日々の学び

集合に対して再帰的に境界を入れていく操作が決定木の作成。では、集合のどこに境界を入れれば良いか。属性をテストすることにより得られる情報量が最も大きくなるように入れる。汎化能力、みたいな言葉を読ん …

交差検証(CrossValidation)

2019/04/23 -機械学習
はじめての機械学習, 日々の学び

同じ出処から取ってきたデータを全て訓練データとして使わずに、訓練データとテストデータに分割して、訓練データで作ったモデルに対するテストデータの精度を返す、みたいなことをやるらしい。交差検証(Cro …

「機械学習」一覧

Ward距離を使った階層型クラスタリング (お試し実行なし)

k-means法と近似解法考え方

sklearnに頼らずRidge回帰を自力で書いてみて正則化項の影響を考えてみるテスト

NP困難な分類問題を代理損失の最小化に帰着させる話

回帰直線の当てはまりの指標

単回帰曲線における回帰係数の精度（95%信頼区間)

損失関数の評価,バイアス-バリアンスと過学習のトレードオフ

損失関数

決定木の分割基準,情報ゲイン,エントロピー

交差検証(CrossValidation)

GoogleによるAirflow DAG実装のベスプラ集を読んでみた – その1

Snowpark Container Services上でWebアプリ(FastAPI/React/TypeScript)を動かしてみた

Azure Queue StorageとAzure Service Busを比較してみた

Azure Functionsの機能まとめ（座学版）

External Network Accessを使ってSnowflakeとFitbitAPIを繋いでみた話

Deep dive into the internals of Snowflake Virtual Warehousesを読んでみた

GCSとのストレージ統合を設定した話

デプロイメントについて調べてみた話（端折り気味）

dbtのドキュメント生成機能について調べてみた話

The dbt Viewpointを読んでみた話

GoogleによるAirflow DAG

Snowpark Container S

「機械学習」 一覧

「機械学習」一覧