2022年7月14日
pandasは何故pandasというのか、とりわけ疑問に思ったこともなかったのだけど、家のその辺にpandasクックブックを置いていたら妻が調べだし、panel data が由来らしい、ということが解った。
今日のpandasクックブック読み進めは5章のbooleanインデックス法まで。インデックス法には関係ない話だが、インデクサに限らず何らかの列にアクセスするときにその列がソートされている場合(is_monotonicがTrue)なら探索がバイナリサーチになるので高速になる、というのは知らなかった。
レスポンスタイムが余り大切ではないデータ分析時にはバイナリサーチせずとも大して時間がかかるわけではないので使う機会は少なそうだけど、何らかの用途で高速化が必要なときには頭の片隅にあると嬉しい知識かもしれない。データ探索がよく行われるデータ構造なら、バイナリサーチ可能かどうかをフラグで持っているというのはたしかになー。