セミナーレポート

行動解析技術の最前線オムロン(株) 技術・知財本部 研究開発センタ AI制御研究室 主査 高橋 智洋

本記事は、国際画像機器展2021にて開催された特別招待講演を記事化したものになります。

>> OplusE 2021年3・4月号(第478号)記事掲載 <<


GANの概要

 GAN(Generative Adversarial Network:敵対的生成ネットワーク)の説明に入る前に,イメージしてもらうためにもGANでできることの例を紹介したいと思います。GANの研究としては,理論面と応用面があります。GANの理論面では計算が安定しないという課題があり,いかに安定させるかが大きなテーマです。一方,応用面では,よく知られているのが画像生成です。最近では,高解像度でかつ本物と見分けのつかない画像生成が実現されてきています。また,ベクトルの各成分に意味をもたせ,生成できる画像をある程度コントロールできるようにするdisentanglementという研究が進んでいます。画像生成系では,馬をシマウマに変えるというような画像のドメイン変換や,文章をインプットして,それにあった画像を生成することもできるようになってきています。さらに,実用的な面では,GANの超解像度への利用やドメイン適応,異常検知などの利用研究も進んでいます。
 では,なぜGANを使うと,例えば高解像な画像が作れるのでしょうか? そのためにもGANの学習のイメージを画像生成の例に沿って紹介します。GANには主に3人の登場人物がいます。1人目は手持ちのデータ群です。特に画像生成の場合では手持ちの画像群がそれに対応します。2人目はGeneratorで,ベクトルを食べて手持ちの画像群に近い画像を出力できるように学習します。3人目はDiscriminatorで,手持ち画像を本物,Generatorが作る画像を偽物と判別できるように学習します。では,もう少し具体的に学習対象であるGeneratorとDiscriminatorはどのように学習するのかというと,GANはGeneratorとDiscriminatorのいたちごっこの学習と言われているので,それを基にイメージを紹介します。まず,Generatorを固定した上でDiscriminatorが手持ちの画像を本物,Generatorが作る画像を偽物と判別できるように学習します。その後に,GeneratorはDiscriminatorを固定した上で,Discriminatorに本物と答えてもらうように学習します。どのようにすれば本物と答えてもらえるようになるかというと,より手持ちの画像データに近い画像が作れれば本物と認めてもらえるようになるでしょう。つまり,GeneratorがDiscriminatorに本物と答えてもらえるような学習は,結果的にGeneratorが作る画像が本物の画像にちょっと近づくことに対応しています。その後,これらDiscriminatorの学習とGeneratorの学習を交互に繰り返していきます。その結果,Generatorが作れるデータは本物のデータに徐々に近づいていく,つまり,Generatorが作るデータが手持ち画像データに寄っていきます。このようにGANは手持ちデータに「寄せていく」ような学習です。手持ちデータが画像群であれば,Generatorが生成できる画像はその画像に寄っていき,最終的に手持ち画像かそれに近い画像が生成できるようになります。

<次ページへ続く>

オムロン(株) 技術・知財本部 研究開発センタ AI制御研究室 主査 高橋 智洋

2013年京都大学大学院博士後期課程修了。博士(理学)。2011~2013年 日本学術振興会特別研究員(DC2)。大学院では理論宇宙物理学を専攻する。修了後,NTTデータ数理システムにて数理最適化に関する業務に従事。主に大規模離散最適化問題に関して,ソフトウェアの開発や個別コンサルティングを行う。数理最適化と並行し機械学習を独学。前職のABEJAでは画像解析をターゲットとした深層学習の調査や実装に従事。現職のオムロンではロボティクスに関する研究を行っている。

アーカイブもっと見る

行動解析技術の最前線
行動解析技術の最前線(3/25) オムロン(株) 技術・知財本部 研究開発センタ AI制御研究室 主査 高橋 智洋
触覚情報をカメラでとらえる
触覚情報をカメラでとらえる(3/25) 立命館大学 理工学部 ロボティクス学科 教授 下ノ村 和弘
行動解析技術の最前線
行動解析技術の最前線(1/25) NEC バイオメトリクス研究所 研究マネージャー 西村 祥治
精密加工と精密位置決め技術の組み合わせによる材料内部の3次元組織観察,ならびに硬さ分布の3次元解析システム
精密加工と精密位置決め技術の組み合わせによる材料内部の3次元組織観察…(1/25) 理化学研究所 光量子工学研究センター 画像情報処理研究チーム チームリーダー 横田 秀夫
関西大学 システム理工学部 機械工学科 教授 古城 直道
画像を利用したインフラ維持管理におけるデータ管理手法
画像を利用したインフラ維持管理におけるデータ管理手法(3/25) 株式会社イクシス 代表取締役 山崎 文敬
生体視覚神経系に学んだロボットビジョン開発
生体視覚神経系に学んだロボットビジョン開発(1/25) 大阪工業大学 情報科学部 奥野 弘嗣

▼ プラチナスポンサー ▼

株式会社リンクス

東芝テリー株式会社

ダウンロード

展示会FAQ

第30回三次元工学シンポジウム

第16回偏光計測研究会