セミナーレポート

少量データ向け深層学習技術NECデータサイエンス研究所 佐藤 敦

本記事は、国際画像機器展2019にて開催された特別招待講演を記事化したものになります。

>> OplusE 2020年1・2月号(第471号)記事掲載 <<


パターン認識と深層学習 特徴抽出と識別の関係

 2012年の大規模画像認識コンテスト(ILSVRC)で,トロント大学チームが深層学習(ディープラーニング)を使い圧勝したのをきっかけに,深層学習がブームになりました。その後,認識精度が飛躍的に向上し,2015年には人間の精度を超えたと言われています。それはまさに,大量の学習データと,膨大な計算リソースによる試行錯誤的なアーキテクチャーの探索にあります。計算リソースに関してはGPUを大量に使えば何とかなりますが,データに関しては簡単に集めることはできず,コストもかかることから,深層学習を活用する際の課題になっています。
 学習データがどれくらい必要かは一概には言えませんが,Yoshua Bengio(モントリオール大学)らによる経験則では,認識対象あたり5000件の正解つきデータを集めれば受け入れ可能な精度が得られ,人間と同等以上の精度を出すには1000万件集めなければならないと言われています。現実にはそんなにたくさん集められません。少ない学習データでの機械学習は,産業上非常に重要になっています。例えば,異常データなど本質的にデータの発生頻度が少ない場合,医療データなど正解づけコストが非常に高い場合,スタートアップを早くしたい場合などでは,少ない学習データでも深層学習を活用したいニーズがあります。
 パターン認識とは,属すべきクラスにパターンを対応づける操作のことで,パターンは信号の空間的・時間的変化,クラスは同等とみなされるパターンの集合概念で,カテゴリとも呼ばれます。パターン認識では,観測されたものを「前処理」し,「特徴抽出」して「識別」する処理過程があります。「前処理」では信号の正規化やノイズの除去,「特徴抽出」では多次元特徴量の抽出,「識別」では類似度計算によるクラス判別を行いますが,高精度を得るにはすべての過程を最適化することが重要です。特徴抽出と識別の関係では,特徴量の分布がクラスごとにまとまっていれば容易に識別できますが,クラス間で分布の重なりが大きいと識別できません。逆に言うと,よい特徴が得られれば,少量のデータを登録するだけでも高精度が得られるのです。

<次ページへ続く>

NECデータサイエンス研究所 佐藤 敦

1989年 東北大学大学院理学研究科博士課程了。理学博士。同年NEC入社,中央研究所にてパターン認識,機械学習の研究開発に従事。郵便区分機向け文字認識の開発,顔認証エンジンNeoFaceの開発にも携わる。1994~1995年 米国ワシントン大学客員研究員,2008年 米国マサチューセッツ工科大学客員研究員。現在,NECデータサイエンス研究所主席研究員。東京大学大学院情報理工学系研究科客員教授,理研AIP-NEC連携センター 副連携センター長を兼務。2010年度情報処理学会喜安記念業績賞,2012年度電子情報通信学会業績賞,2014年度全国発明表彰発明賞など受賞。

アーカイブもっと見る

行動解析技術の最前線
行動解析技術の最前線(3/25) オムロン(株) 技術・知財本部 研究開発センタ AI制御研究室 主査 高橋 智洋
触覚情報をカメラでとらえる
触覚情報をカメラでとらえる(3/25) 立命館大学 理工学部 ロボティクス学科 教授 下ノ村 和弘
行動解析技術の最前線
行動解析技術の最前線(1/25) NEC バイオメトリクス研究所 研究マネージャー 西村 祥治
精密加工と精密位置決め技術の組み合わせによる材料内部の3次元組織観察,ならびに硬さ分布の3次元解析システム
精密加工と精密位置決め技術の組み合わせによる材料内部の3次元組織観察…(1/25) 理化学研究所 光量子工学研究センター 画像情報処理研究チーム チームリーダー 横田 秀夫
関西大学 システム理工学部 機械工学科 教授 古城 直道
画像を利用したインフラ維持管理におけるデータ管理手法
画像を利用したインフラ維持管理におけるデータ管理手法(3/25) 株式会社イクシス 代表取締役 山崎 文敬
生体視覚神経系に学んだロボットビジョン開発
生体視覚神経系に学んだロボットビジョン開発(1/25) 大阪工業大学 情報科学部 奥野 弘嗣

▼ プラチナスポンサー ▼

株式会社リンクス

東芝テリー株式会社

ダウンロード

展示会FAQ

第30回三次元工学シンポジウム

第16回偏光計測研究会