卒業研究のご紹介
2019年版

情報系

リカレントニューラルネットワーク(RNN)を使用したTwitter上の「におい」に関するテキストの分析

黒澤 優輝群馬県
大学院情報工学専攻 博士前期課程1年(情報学部情報メディア学科 2019年3月卒業)
群馬県立前橋商業高等学校出身

研究の目的

本研究はディープラーニングの一手法であるリカレントニューラルネットワークを使用し、におい関連の単語が含まれているツイート内容が肯定的か、否定的か、中立的かという観点で分類を行った。におい関連の単語を含んだツイートを使用した理由は、においを「快-不快」に分類することは比較的簡単であるという研究が元になっている。本研究の応用例としては、ある商品名を含むツイートを収集して分類を行うと、商品に対する肯定的・否定的・どちらでもない意見の数を調べることができる。その結果、その商品に対してどのような反応がされているかを低コストかつリアルタイムで調べることができる。

研究内容や成果等

■ 研究内容

Twitter上からにおいに関するツイートを集めて、文を肯定、否定、中立のどれかに正しく判別できるようにRNNで学習を行う。その後、正しく判別できているか評価する。

■ 結果

正答率、誤差の推移を図2、図3、訓練時、テスト時における各項目の正答率を図4、図5に示す。図2、図3の訓練を実線、テストを破線で表示する。図4、図5の縦軸は正解のラベル、横軸は予測した項目である。

図2 正答率の推移

図3 誤差の推移

図4 訓練時の正答率

図5 テスト時の正答率
図2の結果から訓練正答率は96.12%、テスト正答率は71.33%であることが示された。ただ、 図2、図3から過学習が起きていると判断できるため改善の余地がある。図4の結果から訓練では3項目とも学習できているが、図5の結果では、テスト時に中立な文を判定する精度が低いことが示された。中立的な文の判断が難しいことが明らかになったため、中立な文の判定基準を中心に改善する必要がある。

■ おわりに

学習時における肯定的または否定的な文章の分類基準に比べ、中立的な文章の分類基準が雑多であることが、中立な文の判断精度が低くなった原因と考えられる。否定的な文を肯定的、肯定的な文を否定的と判定する確率は低いため、肯定否定2項目分類であれば十分利用できる水準と考えられる。
指導教員からのコメント 教授 坂内 祐一
この研究は、人工知能の技術であるディープラーニングを用いてTwitterのツイートが肯定的か否定的かを自動的に判定するシステムを構築するものです。「におい」は五感のうち嗅覚で感じるものですが、人に情報を伝えるのが難しく、言葉をうまく使って他の人に伝える必要があります。また「におい」を嗅いだ時の人の感情は、好き嫌いの判断が大きく影響することが知られています。本研究では「におい」が含まれているツイートを数百万件から、肯定的なツイート、否定的なツイートをニューラルネットワークの一種であるリカレントニューラルネットワークに学習させました。その結果7割以上の確率でツイートが肯定的または否定的な内容であるかを判定することができました。今後「におい」だけでなく、一般的な内容のツイートにも適用できるようにすれば、Twitterで話題になっている「もの」や「こと」などの評判を素早く把握できることになり、多くの分野で応用可能になると考えています。
卒業研究学生からの一言 黒澤 優輝
本学では画像処理やマルチメディアなどの幅広い分野に触れられるところがよいと感じた。文系科目も履修でき、資格で単位認定が可能であるため、多くの選択肢があり時間を有意義に使うことができた。4年次の卒業研究では自分が学科で学んできた分野とは異なる分野を扱っていたため大変ではあったが、その分、多くのことを知識として得ることができた。また、研究室や図書館などは施設・設備が整っているた黒澤 優輝め、勉学に活用できた。