CLIPSeg・Sing 2 / 2022年12月22日
溜まりに溜まっていた技術系の未消化フィードを消化。なるほど、12月はアドベントカレンダーがあるのでやたらと記事が多くなるのかー。
一番興味深かった記事は、Zero-shot image segmentation with CLIPSegで、なるほどClipにデコーダ追加してセグメンテーション検出もできるようにしちゃうのね。論文と実装自体は今年の3月にすでにあったようだけど、HFが記事にして遅まきながら知った & Transformers のモデルとして使えるようになると、再利用性が高まるのでホント楽な世の中に。zero-shot でもそれなりに良い結果なのも嬉しい。
このCLIPSegをtransformersにportして実装した@NielsRogge氏はHFのOpen-Sorce teamなのね。氏の github には transformers 上に実装したモデルがズラリ。企業が自分の所で実装したものを transformers で動くようにするモチベーションは広報以外ではあんまりないし、良い実装にもそんなに興味ないと思うので、HF側でやってるのだなぁ。HFありがたい。
映画、Sing 2 が Prime Video に降ってきたので観る。良い映画であった。これ系の映画は日本語吹替版で観るのだけど、キャストを知らず、芸能人キャストっぽいな~と見ていたら、なんと B'z の稲葉さんが歌いだしてびっくりする。すぐ聞いて解る独特の歌声。我が家では Ossan.fm をよく聞いているので、 B'z関連の話になると我が家では「クリスさん!!」と唐突に言い出すので面白い。