2021年12月20日
朝起きると、足がちょっとヒリヒリ痛い。電気毛布に裸足で直接当たっていた部分なので、低温やけどかもしれず、電気毛布気をつけねば。
もうちょい簡易棚を作るためにダイユーエイトに。カットサービス便利だなぁ。写真はホームセンター前。
今日の読み進めは、データサイエンスのための統計学入門を6.2の決定木を読み終える。treeで分けた区画の不純度(正確性)を測るには、ジニ不純物かエントロピーで算出する。なお決定木で分類ではなく回帰(連続値の予想)のときには、不純度をRMSEで判断する。なお決定木は分類精度としては良くないが、人間が結果を容易に解釈可能なのが利点。
sklearn の実装を見てみてると、DecisionTreeClassifierでは giri or entroypで標準では gini が使われている。またDecisionTreeRegressorでは MSE が使われている。また、決定木は回帰でも分類でもつかえるため、実装的には回帰・分類共に親クラスBaseDecisionTree
で木構造を表現している。
撮影機材RICOH GR III