Upgrade to Pro — share decks privately, control downloads, hide ads and more …

利用シーンを意識した推薦システム 〜SpotifyとAmazonの事例から〜

利用シーンを意識した推薦システム 〜SpotifyとAmazonの事例から〜

IR Reading 2025春での発表資料です。
https://sigirtokyo.github.io/post/2025-05-24-irreading_2025spring/

紹介した論文は以下の2本です。
- Contextualizing Spotify’s Audiobook List Recommendations with Descriptive Shelves (ECIR 2025)
https://doi.org/10.48550/arXiv.2504.13572
- Using Instruction-Tuned LMs for Scalable Use Case-Based Shopping - Where Customers Meet Their Needs (KDD 2025)
https://assets.amazon.science/6c/81/a33d7efe45c7a62ab4c9503a7aa0/using-instruction-tuned-lms-for-scalable-use-case-based-shopping-where-customers-meet-their-needs.pdf

Avatar for kuri8ive

kuri8ive

May 24, 2025
Tweet

More Decks by kuri8ive

Other Decks in Research

Transcript

  1. IR Reading 2025春 2025年5月24日 利用シーンを意識した推薦システム 〜SpotifyとAmazonの事例から〜 Contextualizing Spotify’s Audiobook List

    Recommendations with Descriptive Shelves (ECIR 2025) Using Instruction-Tuned LMs for Scalable Use Case-Based Shopping - Where Customers Meet Their Needs (KDD 2025) 栗本 真太郎(@kuri8ive) ※ 断りのない限り、図表は紹介論文からの引用 or ChatGPTによる生成です
  2. 6/24 タイトル、著者、説明、BISACジャンルを入れ、LLMに以下10種の記述子を出してもらう LLMさんによろしく 分類 例 ジャンル 児童文学 テーマ or トピック

    国際政治 キャラクター 女性主人公 ムード 冒険的 背景 中国の文化大革命 個人的な状況 喪失感への対処 物語の類型 敵から恋人へ ターゲット読者層 児童 目的 日本語を学ぶ 固有名詞 ブリトニー・スピアーズ
  3. 7/24 記述的本棚生成のパイプライン [4] Personalized audiobook recommendations at spotify through graph

    neural networks (TheWebConf'24) two-towerモデル[4]で 本推薦 & LLMによる記述子生成 記述子の重複排除 & ユーザーの嗜好に基づく 記述子ランク付け & 貪欲多様化 本棚タイトルに 合うよう アイテムを並び替え & フィルタリング 上位の本棚を選抜
  4. 8/24 編集者お手製の本棚とA/Bテストで比較 ⚫エンゲージメント指標が改善 ⚫ インプレッションあたりのクリック率 (i2c): +35.25% ⚫ インプレッションあたりの視聴率 (i2s):

    +86.96% ⚫発見指標が改善 ⚫ インプレッション数(ユニークなオーディオブック数): +627.27% ⚫ インタラクト数(ユニークなオーディオブック数): +804.56% 記述的本棚はクリックや視聴、発見の体験まで改善
  5. 14/24 予備実験とアスペクトベース感情トリプレット抽出の結果から、FLAN-T5[10]を選択 (T5をインストラクションチューニングしたモデルで、高いゼロ/フューショット性能) ⚫FLAN-T5-Large (780M parameters) ⚫FLAN-T5-XL (3B parameters) ⚫FLAN-T5-XL

    + LoRA[8] の3種で実験 (1/3)ユースケースと感情抽出(UCSE)に用いる手法 [10] The Flan Collection: Designing Data and Methods for Effective Instruction Tuning. (arXiv’23) [8] LoRA: Low-Rank Adaptation of Large Language Models (arXIv’21)
  6. 19/24 手法 ⚫KMeans ⚫LDA ⚫Claude 2 評価指標 ⚫クラスターの質評価:シルエットスコア ⚫ クラスター内は密集しているほどよく、クラスター同士は離れているほどよい、とする指標

    ⚫ -1〜1 の範囲で、1 に近いほどクラスタリングの品質が高いことを示す ⚫クラスターの名前評価:コサイン類似度 ⚫ 名前とクラスターのエンティティとの類似度で評価 (2/3)主要なユースケース(DU)特定に用いる手法と評価指標
  7. 22/24 約2,500万件の顧客検索セッションを対象に、4週間のA/Bテストで評価 ⚫収益が改善 ⚫ 検索ページで +0.77%、閲覧ページで +0.94% 、製品詳細ページで +0.44% ⚫販売個数が改善

    ⚫ 検索ページで +0.35%、閲覧ページで +0.51% 、製品詳細ページで +0.23% ⚫クリック率が改善 ⚫ 検索ページで +0.15% ユースケースに基づく推薦は収益、販売個数、クリック率を改善
OSZAR »