//
「VQ-VAEとPixelCNNによる一部が隠れた顔画像の補完」山口恒大
Built with

「VQ-VAEとPixelCNNによる一部が隠れた顔画像の補完」山口恒大

本研究は下部分が隠れた顔画像に対し、隠れた部分を補完することを目標とした。そのために、ニューラルネットワークのVQ-VAEで顔画像の符号化を行い、符号化を行なったものに対し生成モデルのPixelCNNで隠れた箇所を生成し復号するという手段を用いた。VQ-VAEは畳み込みオートエンコーダであり、入力の本質的な特徴である特徴量を離散化する。PixelCNNは左上から右下へ順にピクセルが生成されたものとし、注目するピクセル以前から注目するピクセルの値を予測する。実験を行い、顔の特徴を捉えた画像を生成した。そして、品質の改善は望まれるが、顔画像の上部分に基づいた下部分を補完することが出来た。
Gallery