2023年12月19日
昨日に引き続いて盆栽いじり(このサイト弄り)。EfficientNet-B0は2019年のモデルなので、最近の良い感じのモデルのはどんなのがあるんじゃろい、とtimmを覗くとより小さなパラメータで高性能・高速ななモデルがあるわあるわ。4年も経ったしViTも出たしでそりゃそうだよなぁ。Appleが作ったCoreMLでも動くFastViTなんか良さそうであった。
それにしてもtimmではどのモデルも統一的なインターフェイスで操作できるように、モデル実装したりHuggingFaceに適当な形にコンバートしてアップしたりと、メンテしている方々ありがたいな。
というわけで、このサイトの画像を特徴量へと変換するモデルを、laion/CLIP-ViT-B-32-xlm-roberta-base-laion5B-s13B-b90kに置き換える。timmで取り扱えるモデルじゃないし。今まで小型軽量モデルを使っていたのだけど、それなりのパラメータモデル。なぜこのモデルにしたかはそのうち。
ついでに画像特徴量はqdrant cloudへ保存するようにする。フリープランでメモリ1GBも使えちゃう太っ腹。オンメモリにのせる必要ないようなメタデータには4GBも使えるのかー、嬉しいな。ただ将来は閉じられる気がするので、ローカルでも動くようにしたけど。qdrant ちょっと使ってみた感じいいじゃん、こういうので良いのだよなぁ。