A Day in the Life

2021年2月9日


機械学習学習日記 - 8日目

2.3.7 カーネル法を用いたサポートベクタマシン(SVM)について。数学的な説明はかなり難しい、とのことで本書では省かれている。線形SVM(=カーネル法でない)に非線形の特徴量を加えることでモデルが強力になるが、どの特徴量を加えるべきかわからず、計算量も大きくなりすぎる。そのため用いる数学的なトリックがカーネルトリックで、データポイント間の距離計算を直接計算することで非常に大きな計算量無く実現できる。

今までの項の説明と同じく、SVMのパラメータの説明と考え方、前処理の一例としてデータの特徴量を0-1のレンジにおさえて処理させる方法等々を解説している。

SVMはデータの特徴量がわずかでも複雑な決定境界を作れ、低次元・高次元でもうまく機能するが、サンプル数が大きくなると計算機リソースの点で難しくなる。データ前処理とパラメータ調整が必要で、なおかつそのモデル検証とその予想理由が難しい。そのため、勾配ブースティング(GBDT)は前処理がほぼ不要なケースも多いこともあり、決定木ベースのモデルが用いられる事が多い。ただ、特徴量が似たデータにおいて(本ではカメラのピクセルを例に上げている)は、SVMを試す価値がある。

この辺まで読みすすめるにつれ、numpy, ndarray の便利さが徐々に解ってきた。数学的な関数実装群はもちろんのこと、Python での syntax での表現、例えば ndarray > 0 で0以上かどうかの真偽値を返したり、直感的な配列同士の計算だったり、メモリ空間を効率的に使うための工夫だったりが垣間見れる。

撮影機材α7C/Voigtlander NOKTON classic 35mm F1.4 II SC VM

関連するかもエントリー

2021年2月20日
近くの観光ヘリ、土日は昼間もしょっちゅう飛んでいる。5分間隔で借りれるらしい。昼、K夫妻と久しぶりにランチ。家族以外と基本リアルで話さないので、いらん事をペラペラと喋りすぎた気がする。もともと非コミュなのに更に進む非コミュ化。ヨドバシでちょくちょくPS5が店頭販売されているようだ...
近くの観光ヘリ、土日は昼間もしょっちゅう飛んでいる。5分間隔で借りれるらしい。昼、K夫妻と久しぶりにランチ。家族以外と基本リアルで話さないの...
大満足な朝食 / 2021年2月19日
朝食は中華街のお粥屋、謝甜記 貮号店へ。前回行った時は平日ランチメニュー(朝でもランチメニューなのだ)を知らず、普通にお粥を頼んだのだけど、今回はAランチとエビ粥ランチを頼む。するとランチというよりは中華大集合な感じのにぎやかな食事に。炒めもの、点心、唐揚げ、粥、デザート、何故か...
朝食は中華街のお粥屋、謝甜記 貮号店へ。前回行った時は平日ランチメニュー(朝でもランチメニューなのだ)を知らず、普通にお粥を頼んだのだけど、...
2021年2月26日
雨が降る予報だったけど一日どんより曇り空。花粉症患者的には雨降ってほしい。SIGMAの新レンズ、28-70mm F2.8 DG DN | Contemporaryが発表される。以前スペック的には似たようなタムロンの28-75mm F/2.8(A036)を使っていたのだけど、画質は...
雨が降る予報だったけど一日どんより曇り空。花粉症患者的には雨降ってほしい。SIGMAの新レンズ、28-70mm F2.8 DG DN | C...