2021年4月13日
久しぶりにインスタのリールを開くと、ぼーっと見てしまい一時間ぐらい時間が溶けた。リアルタイムで推薦アルゴリズムが変わる様が面白く、たとえばスケートのリールを最後まで見ると、スケート動画推薦が多くなったり。
機械学習学習日記 - 71日目
Pandas、CPUの利用率を見る限り並列処理をしておらず、1行ごとに副作用がない処理など(いわゆるmapとか)いい感じで並列化してくれよ、と思ってソリューション探すとあるじゃんswifter。Series に対しての処理は500倍ぐらい速くなる。というか並列処理関係なく pandas の処理が遅すぎて問題…。DataFrameでは遅くなくSeriesに対してだけ遅い問題が起きるので、Pandas の実装上なにか問題がありそうな気もする。
そして swifter、import すると pandas に .swifter
というインターフェイスが生えるのだけど、pandas.api.extensions.register_series_accessor みたいなオフィシャルAPIがあるのね。こういう自由なインターフェイス拡張、なんか懐かしい感じだ。