卒業研究のご紹介
2021年版

情報系所属学生

観光地写真を対象としたユーザ嗜好プロファイル拡張機能を備えた観光地推薦方式の実現に関する研究

柴本 恵理子熊本県
大学院情報工学専攻 博士前期課程2021年3月修了
(情報学部情報工学科2019年3月卒業)
熊本県立八代高等学校出身

研究の目的

モバイル端末に搭載されるデジタルカメラ機能の高性能化に伴い、写真を撮影し、他者と共有するという行動が日常的になっている。観光地などを訪れる旅行者は、その時の思い出や経験したことを記録として残したりするために、スマートフォンを用いて撮影する機会が増えている。一方、情報推薦システムは、日常生活の中で新たな知識や経験をみつけるために必要不可欠なものとなっている。それにはユーザの嗜好を満たす適切な情報を推薦するために、ユーザの購買履歴や視聴履歴から情報嗜好を抽出することが重要となっている。このシステムを観光地推薦に適用することにより、ユーザの嗜好に応じて旅行情報を推薦するとともに、ユーザの旅行に対する興味や関心を高めることができる。

研究内容や成果等

■ 提案手法

本研究では、ユーザが撮影した画像集合を嗜好プロファイルと捉え、観光地写真を対象とした写真撮影行動に基づく嗜好抽出手法および嗜好に応じた観光地推薦方式を提案する。提案手法の特徴は、写真撮影行動を分析することによりユーザが撮影した写真に現れる暗黙的な嗜好に対する関心度を算出する点、およびユーザが撮影した画像集合を嗜好プロファイルと捉え、深層学習による画像コンテキスト推定モデルを適用することにより、ユーザの嗜好プロファイルの拡張を行う点にある。
A. 嗜好に応じた観光地推薦方式(図1)
Step-1:ユーザuの撮影写真データIu = {iu1, iu2,…,iuN}を、観光地を特徴づけるn個のカテゴリCx(x=1,2,…,n)に分類する。分類アルゴリズムは、Convolutional Neural Networkなどを用いる。
Step-2:分類スコア、分類枚数、特徴ベクトルを用いた場合の3つの方式で、ユーザベクトルPuを作成する。
(方式1)各カテゴリxにおける分類スコアCSxを用いて、Pu(1)=[CS1, CS2,…, CSn] のように算出する。
(方式 2)各カテゴリxの分類枚数 Nxを用いて、Pu(2)=[N1, N2,…, Nn]のように抽出する。
(方式 3)各カテゴリxの特徴ベクトルVxを用いて、Pu(3)=∑j=1vujのように抽出する。Vujは学習済みの深層学習モデルのz次元の中間層Lの出力を、関数fを用いて算出した特徴ベクトルVuj=[v1, v2, …, vz]である。関数fz次元の中間層Lからの出力結果をz次元ベクトルに変換する写像関数f(Iuj)=Vujである。
Step-3:観光地vの写真データLv={lv1, lv2, lv3,…,lvM}に対して、Step-2の各方法で各観光地vの特徴ベクトルを抽出する。ユーザの嗜好ベクトルPuと観光地の特徴ベクトルlvのコサイン尺度の値sim(Pu, Lv)= Pu,・Lv / |Pu| |Lv|に応じて、観光地のランキングを行う。

図1 提案手法の概要図
B. ユーザ嗜好プロファイルの拡張(図2)
(学習プロセス)Step-1:複数のユーザU={u1, u2, …, um}の写真集合Iupについて、各カテゴリCxに分類する。
Step-2:分類した各写真集合をトランザクションとみなし、アプリオリ・アルゴリズムなどを適用して、カテゴリの組み合わせについて、指定した確信度c、支持度sに応じた相関ルール集合R = {r1, r2, …, rk}を抽出する。
Step-3:Step-2で抽出したルール集合Rについて、各rqの左辺を入力、右辺を正解とした深層学習を行う。ただし、入力は、左辺の各カテゴリCxに属する画像Ixの列である。ここで、深層ニューラルネットワークは、画像 Ixを畳み込みニューラルネット(CNN)でエンコードし、エンコードされた画像特徴の列をLSTM(Long short-term memory)などでデコードする画像コンテキスト推定モデルMとして実現する。
(写真集合拡張プロセス)Step-1:対象ユーザuの写真集合 Iu = {iu1, iu2, …, iuN}をn個のカテゴリCxに分類する。
Step-2:分類したカテゴリの任意の組み合わせを、学習プロセスで生成した画像コンテキスト推定モデルMに入力し、推定結果として画像カテゴリ Cnewを得る。
Step-3:Step-2で得たCnewに属する画像Inewで対象ユーザuの嗜好プロファイルを拡張する。

図2 プロファイル拡張の例

図3 画像コンテキスト推定モデルの概要図

■ 実験

A.嗜好に応じた観光地推薦の評価
VGG16を用いた転移学習により、視覚情報のうち、観光地として特徴づけるために適している。建物や町並みなどの7カテゴリ(各18枚)に分類した写真データ集合を学習させた。観光地としてインドネシア、京都、ローマ、オーストラリア、ケニア、ニューヨーク、タイ、ベトナム、モンテネグロ、モルディブの10個の地域(各96枚)を設定した。さらに、観光地を推薦する対象となる3名のユーザの嗜好に合致する写真(各約300枚)を、建物、山岳・アクティビティ、海岸・グルメのように配分した。
図4に各方式における上位5件中の推薦精度を示す。方式2は、ユーザの写真を適切に分類できていたユーザ3に対して興味のある観光地すべてを上位に推薦でき、適切に分類できなかったユーザ1に対しても興味のある観光地を上位に推薦できたため、他の方式と比較してより適切な推薦が可能と考えられる。方式3はユーザ1の嗜好を満たす観光地をすべて上位に推薦でき、写真の誤分類の影響が最も低いと考えられる。

図4 観光地の推薦精度
B. 写真撮影行動に基づく嗜好抽出の評価
Caltech256データセットを用いて3ユーザ嗜好プロファイルを作成した。ユーザAはヤシの木・スピードボード、ユーザBはヤシの木・スピードボード・仏像、ユーザCはヤシの木・スピードボード・仏像・盆栽のカテゴリの画像データ(各12枚)から構成される。VGG16+LSTMの画像コンテキスト推定モデルを使用し、s1={ヤシの木、スピードボード}→滝のような10個の相関ルールを用いてユーザ嗜好プロファイルを拡張した。ユーザAの嗜好プロファイルに拡張した結果、3枚の画像が追加された。図5に2枚の画像が追加された例を示す。拡張された画像は滝のカテゴリに属する画像であり、ユーザAのユーザ嗜好プロファイルに含まれていないカテゴリの画像でユーザ嗜好プロファイルを拡張することができた。同様に、ユーザBとCの嗜好プロファイルには、それぞれプロファイルに含まれない画像が1枚と3枚追加された。

図5 ユーザAのプロファイル拡張の例

■ むすび

今後の展望として、本研究による観光地写真を対象とした嗜好に応じた観光地推薦方式を適応することで、暗黙的な嗜好抽出に基づいた未知なる観光地の推薦への適用していくことが望まれる。
指導教員からのコメント データベースシステム研究室教授 鷹野 孝典
観光地写真には、テキストだけでは表現できないような、視覚的情報が豊富に含まれている。そのような前提から、本研究ではまずAI技術を使って、観光地写真から得られる景色や物体などの視覚的情報を使ってユーザの嗜好を正確に把握できれば、ユーザが訪れたいと思う観光地を適切に推薦できると考えた。柴本さんのアイディアは、さらに考えを進めて、観光地写真そのものではなく、観光地写真の「視覚的な特徴情報」を対象とすることで、ユーザの嗜好を高速かつ柔軟に分析し、未知の観光地を推薦する新しい手法を考案した点である。今後、音楽付きの観光地動画配信などを組み合わせて、より実用的な観光地推薦サービスへと展開していくことを検討している。
修士研究学生からの一言 柴本 恵理子
数年間にわたり、面白いテーマで研究ができたことは幸運だったと思います。学会での発表を通じて国内外問わず「面白いテーマだね」と言ってもらえる機会が多く、そこから他大学の先生や学内の先生と研究について議論することもあったため非常に良い経験をさせていただきました。また、海外の大学で研究の関連分野の勉強や海外の大学と共同研究も行わせていただきました。言語の障壁はあったものの、海外の教授や学生との議論を通じて自分の視野も広げることができたため、より成長できたのではないかと考えています。日頃の研究活動からも情報共有の仕方やプレゼンテーション能力等、学ぶことが多く充実した学生生活だったと感じています。