2026年4月27日
身近な会社が詐欺被害に遭った、というセンセーショナルなニュースが目に飛び込む。被害に遭った皆さんに心の安寧が早く訪れますように…。
あったら便利そうかなと、週末作ったものを公開すると、世界中で使われているトークナイザの作者から反応をいただいきありがたい。といっても自分が作ったアプローチが全文検索には不向き(これはVaporettoの手法やライブラリが悪いのではなく、自分が作った用途にはマッチしない)というご指摘で、ちゃんと考えればその通りだし、かなり恥ずかしい間違いな気がしているが、世に出したことで間違いを知れてありがたい限りだなぁ。NLP、独学でやっていて教えてくれる人は周りに全くいないんだけど、出すと各所から反応をもらえ勉強になって嬉しい。
なおなぜ Vaporetto を選んだかというと、Qdrant で組み込み日本語トークナイザ(軽量なものとして採択されたのかな)として使われているのを知ったからで、とすると Qdrant での日本語トークナイズも全文検索用途で使っているので、あまりよくない感じがするね。そもそも現状の実装では漢字のみのクエリが中国語と判定され、日本語ではまともに使えなかったりするのだが。
ベコ氏、数日前に身体中に湿疹ができてしまったのだけど、1-2日で収まって一安心。
森商店の味噌ラーメン🍜。














