シーズ技術紹介

【情報通信】 (2016/03/09公開)

バンディット手法を用いた推薦技術

大学院情報科学研究科 情報理工学専攻
中村 篤祥 准教授 

知識を獲得しながら累積利得を最大化するオンライン学習技術


ユーザが好むであろうアイテムのお勧め(知識の利用)のみでなく、ユーザの好み情報が多く得られるであろうアイテムのお勧め(知識の獲得)もバランスよく行い、ユーザの累積満足度を最大化するお勧め手法を研究しています。

研究の内容


現在のインターネット社会において、リコメンデーション技術はうまく働けばサービスを提供する側・受ける側の双方に利益をもたらすものです。

リコメンデーションサービスは1回きりのものではなく、毎回フィードバックを受けながら繰り返し行うものであり、しかもフィードバックはお勧めしたもののみに対して得られるものです。

したがって、フィードバック履歴よりユーザが好むであろうアイテムをお勧め(知識の利用)するのみでなく、フィードバックからユーザの好み情報が多く得られるであろうアイテムもお勧め(知識の獲得)することがその後のお勧め精度を上げるためには重要です。

この知識の利用と獲得のバランスをとってユーザ満足度の最大化を試みるのがバンディット手法です。バンディット手法を用いたお勧め方式の開発を行っています。

応用例


  • リコメンデーション
  • ダイレクトメール送信
  • 広告配信


産業界へのアピールポイント


ある集合から選択を繰り返し、選択したものに対してのみフィードバックが得られる(バンディット)設定の問題で、選択に対する評価の累積値を最大化する手法です。リコメンデーション以外にも使えます。

研究室ホームページ


大学院情報科学研究科 情報理工学専攻
http://prml.main.ist.hokudai.ac.jp/~atsu/



※お問い合わせは 北海道大学 産学・地域協働推進機構ワンストップ窓口まで

北海道大学 TLO通信 創業デスク 北海道大学研究シーズ集 vol.4
食科学プラットフォーム 北海道大学URAステーション 北海道大学 研究者総覧 onちゃん北大事務局