卒業研究のご紹介
2021年版
情報系所属学生
敵対的生成ネットワーク(GAN)を用いたイラストレーターの個性を反映した似顔絵生成手法
中島 悠輔神奈川県
大学院情報工学専攻 博士前期課程2021年3月修了
(情報学部情報工学科2019年3月卒業)
(情報学部情報工学科2019年3月卒業)
クラーク記念国際高等学校出身
研究の目的
似顔絵はSNS、ブログ、ゲーム、アプリのプロフィールやアバターといった用途でプライバシーの観点や自分のイメージを表現するために顔写真の代わりに多く用いられている。現在、顔画像から似顔絵を生成する研究として、近年AIとして注目されているDeep Learning(深層学習)の一手法であるGAN(Generative Adversarial Network、敵対的生成ニューラルネットワーク)が用いられている。しかしながら、それぞれイラストレーターの個性を考慮した似顔絵を生成するGANは存在していない。そこで、本研究ではGANを用いてイラストレーターの個性を学習させて任意の顔画像に対する似顔絵を学習させたイラストレーターごとのタッチで描かせるような生成手法を検討した。今後は似顔絵だけではなく、様々なメディア(アニメ、漫画、イラスト等)に対し、その人の個性を反映させられるようになると考えている。
研究内容や成果等
■ 論文要旨
似顔絵は人物の外見・特徴をとらえてデフォルメして描いた人物画であり、Webなどで個人のプロファイル画像として広く利用されている。現在、顔画像から似顔絵を生成する研究はDeep Learning(深層学習)の一手法であるGAN(Generative Adversarial Network,敵対的生成ニューラルネットワーク)が用いられている。教師なし学習を用いた変換手法やデフォルメされていない肖像画のデータセットを用いた変換手法が開発されているが、イラストレーターの個性を考慮して反映するような研究は行われていない。
本研究では、画像生成に使われるGANを用いて、Deep Learningによりイラストレーターの個性を学習させて任意の顔画像に対する似顔絵を学習させ、イラストレーターごとのタッチで描かせるような生成手法を検討した。具体的には従来手法の教師なし学習を行うCycleGANを元にL1Lossと呼ばれる生成した似顔絵と教師の似顔絵のピクセル誤差を学習させることにより、教師あり学習としたCyclepixを提案した。さらにはCyclepixを1:n変換に対応するべくマルチドメイン化し、Generatorに顔画像とイラストレーターを指すラベルを入力することにより、顔画像からそれぞれ特定のイラストレーターの似顔絵に変換するConditional Cyclepixとして拡張させた手法の提案を行った。1人のイラストレーターに数万枚もの似顔絵を描いてもらうのは困難であるため、できるだけ少ない枚数である189枚をそれぞれイラストレーター3人に描いてもらい、それらをデータセットとした。
実験結果により1:1変換において、従来手法の教師なし学習であるCycleGANおよび教師あり学習であるpix2pixに比べ、提案手法のCyclepixの方が評価実験により生成精度が良く、イラストレーターが描いた似顔絵に似ているという結果が示された。また、1:n変換においては、マルチドメインの従来手法であるStarGANと1:1変換で提案したCyclepixに比べて提案手法のConditional Cyclepixの方が評価実験によりイラストレーターが描いた似顔絵に似ているという結果が示された。Cyclepixの手法により顔パーツの変換誤りの危険性を低減し、イラストレーターのタッチを忠実に再現することが確認できた。また、マルチドメイン化させたConditional Cyclepixの手法により学習するデータ量が増えたことで過学習を抑制し精度がよくなり、1つのネットワークで複数のタッチの似顔絵を出力できることが確認できた。このことからConditional Cyclepixがイラストレーターの個性を反映した似顔絵生成手法として適していると考えられる。今後はさらにイラストレーターの数を増やしたデータセットを学習した場合でも同じような結果が得られるか、イラストレーターのタッチの違いが大きい場合にマルチドメインのネットワークへどう影響するかを調査していく必要がある。
本研究では、画像生成に使われるGANを用いて、Deep Learningによりイラストレーターの個性を学習させて任意の顔画像に対する似顔絵を学習させ、イラストレーターごとのタッチで描かせるような生成手法を検討した。具体的には従来手法の教師なし学習を行うCycleGANを元にL1Lossと呼ばれる生成した似顔絵と教師の似顔絵のピクセル誤差を学習させることにより、教師あり学習としたCyclepixを提案した。さらにはCyclepixを1:n変換に対応するべくマルチドメイン化し、Generatorに顔画像とイラストレーターを指すラベルを入力することにより、顔画像からそれぞれ特定のイラストレーターの似顔絵に変換するConditional Cyclepixとして拡張させた手法の提案を行った。1人のイラストレーターに数万枚もの似顔絵を描いてもらうのは困難であるため、できるだけ少ない枚数である189枚をそれぞれイラストレーター3人に描いてもらい、それらをデータセットとした。
実験結果により1:1変換において、従来手法の教師なし学習であるCycleGANおよび教師あり学習であるpix2pixに比べ、提案手法のCyclepixの方が評価実験により生成精度が良く、イラストレーターが描いた似顔絵に似ているという結果が示された。また、1:n変換においては、マルチドメインの従来手法であるStarGANと1:1変換で提案したCyclepixに比べて提案手法のConditional Cyclepixの方が評価実験によりイラストレーターが描いた似顔絵に似ているという結果が示された。Cyclepixの手法により顔パーツの変換誤りの危険性を低減し、イラストレーターのタッチを忠実に再現することが確認できた。また、マルチドメイン化させたConditional Cyclepixの手法により学習するデータ量が増えたことで過学習を抑制し精度がよくなり、1つのネットワークで複数のタッチの似顔絵を出力できることが確認できた。このことからConditional Cyclepixがイラストレーターの個性を反映した似顔絵生成手法として適していると考えられる。今後はさらにイラストレーターの数を増やしたデータセットを学習した場合でも同じような結果が得られるか、イラストレーターのタッチの違いが大きい場合にマルチドメインのネットワークへどう影響するかを調査していく必要がある。
■ Cyclepix概要図
■ 似顔絵の生成結果(テスト画像)
■ Conditional Cyclepix概要図
■ 類似度評価実験の結果
■ 似顔絵の類似度評価実験結果
- 指導教員からのコメント ヒューマン・ブレインメディア研究室教授 坂内 祐一
- 最近、SNSやブログで自分の顔写真の代わりに似顔絵を使う人が多くみられます。本物の顔を出さなくとも自分の顔の特徴がよく出ている似顔絵を使えば相手にすぐ気付いてもらうことができます。しかし似顔絵を描くには技術が必要なので簡単に誰にでもできるものではありません。そこでこの研究では、AIのディープラーニングを用いてプロのイラストレーターが描く似顔絵を学習させて、顔写真から自動的に似顔絵を生成することを可能にしました。通常画像を認識するためには、数万枚から数百万枚の画像をディープラーニングで学習させますが、似顔絵を作成する場合には、数百枚の顔画像を学習させるだけでイラストレーターの特徴をとらえた似顔絵が生成できることがわかりました。この研究は情報処理学会の山下記念研究賞に選定された優れた修士論文研究となりました。
- 修士研究学生からの一言 中島 悠輔
- 研究室見学で現在の研究室がAIを研究していたため、自分のやりたいことと一致しており所属し、3年間同じ分野の研究を行うことができてとても良かったと思います。学部4年次では先行研究で提案された手法を用いて検討を行いながら、院生として様々な工夫を行いながら実験を行い最終的に新しい手法を提案することができました。研究室では積極的に対外発表する方針だったため、学会で発表させていただいたことはとても貴重な経験となりました。また、研究室の仲間や後輩と一緒に研究を行った経験は、今後の人生でも活かしていきたいと思います。
- 大学院情報工学専攻 博士前期課程(大学サイト )
- 研究室ナビ(大学サイト)