2024年11月26日
乙嫁語り15巻を読む。しみじみ良いなぁ。漫画家・森薫と入江亜季展に行きたい欲がさらに高まる(どちらともマイフェイバリット作家!!!)。一月あたりには行きたい。
ふと Amazon のレビューを見ると、LLMによるまとめと、キーワードによる抽出とポジネガ判定が加わっていた。なるほど。これをもし自分が実装するとするとどうやるか。
- 意見まとめ
- LLM 要約タスク
- キーワード抽出
- 雑: LLM による抽出
- キーワードを数千に絞った中から選ぶとすると、マルチラベルモデルを学習させて利用。教師データはLLMによる合成データセット
- キーワードがレビューと関連しそうか
- 雑: LLM による判定
- 教師データ(LLMによる合成データセット)を作り、cross-encoderやColBERT によるスコア判定
- キーワードが、レビューのどこに関連してるか
- 雑: LLM による判定
- スパン抽出タスクモデルの学習・もしくはColBERTを学習させて判定
- ポジネガ判定
- 雑: LLMによる判定
- ポジネガの文章分類タスクを学習させる
あたりかなー。基本LLMでできるじゃん(速度や品質・費用対効果が見合えば)。ちゃんと学習させる場合でもデータセットはLLM通して作れるし、楽な時代になったもんだなぁ。