A Day in the Life

2022年7月14日


pandasは何故pandasというのか、とりわけ疑問に思ったこともなかったのだけど、家のその辺にpandasクックブックを置いていたら妻が調べだし、panel data が由来らしい、ということが解った。


今日のpandasクックブック読み進めは5章のbooleanインデックス法まで。インデックス法には関係ない話だが、インデクサに限らず何らかの列にアクセスするときにその列がソートされている場合(is_monotonicがTrue)なら探索がバイナリサーチになるので高速になる、というのは知らなかった。

レスポンスタイムが余り大切ではないデータ分析時にはバイナリサーチせずとも大して時間がかかるわけではないので使う機会は少なそうだけど、何らかの用途で高速化が必要なときには頭の片隅にあると嬉しい知識かもしれない。データ探索がよく行われるデータ構造なら、バイナリサーチ可能かどうかをフラグで持っているというのはたしかになー。

撮影機材α7C/ZEISS Batis 2/40 CF

似ている画像がある記事

ノイズ軽減2021年4月11日

同じ日付の日記

2021年7月14日
夜は機械学習コンペの続き。本当にやるべきことは、データをきちんと見ることやあれこれモデルを試すことなのだけど、それよりも開発環境整備ばかりしてしまう。趣味のことなので嗜好が出るなぁ。
夜は機械学習コンペの続き。本当にやるべきことは、データをきちんと見ることやあれこれモデルを試すことなのだけど、それよりも開発環境整備ばかりし...