2021年2月7日
ちょい体調悪めで、家から一歩も出なかった1日。
機械学習学習日記 - 6日目
2.3.5 の決定木。二分木をどんどん作っていってクラス分類・回帰を行うが、トレーニングデータによって最適化しすぎて複雑になりすぎて過学習しやすい。そのために、(pre|post)-pruning で事前・事後に枝刈りを行う必要が出る。ただ事前枝刈りをしたとしても、過学習になりがちで汎用性能が低くなる傾向がある。
機械学習とは関係ないが、サンプルの木構造のグラフ描画(mglearn.plots.plot_animal_tree()
)で初めて graphviz を使ってのレンダリングでエラーが発生したので、scoop install graphviz
でインストールした後に dot -c
でレイアウトエンジンを登録。エラーが出なくなった。
Scoop などのパッケージマネージャも含め、Windows での開発もだいぶ楽になったなぁ。一昔前はインストーラをどこかから探してきてインストールし、その後コマンドを立たけるように Path を通す(これが面倒)、とかやっていたのが嘘のような簡単さ。