セミナーレポート

少量データ向け深層学習技術NECデータサイエンス研究所 佐藤 敦

本記事は、国際画像機器展2019にて開催された特別招待講演を記事化したものになります。

少量データ学習技術

 従来のパターン認識手法では,「前処理」と「特徴抽出」は専門家が設計し,「識別」だけを機械学習で設計していました。一方,深層学習では,「識別」だけでなく「特徴抽出」も併せて学習できます。深層学習の力を借りてよい特徴を作ることができれば,「識別」ではデータが少なくても高い精度を得ることが可能になります。
 少量データ学習技術の1つめは,上記の考えに基づいた「モデル流用」です。よく知られているのは,プレ・トレーニングです。例えば,花を識別したいときに,花のデータは少ないが動物のデータをたくさんもっているとします。その場合,大量の動物のデータで深層ネットワークを学習した後,識別に相当する部分を削除し,新たな識別部を加えて花のデータを学習させます。流用したネットワークがよい特徴を学習しているなら,花のデータは少なくても高い精度を得ることができます。動物のデータと花のデータを同時に学習させることも可能で,マルチタスク学習と呼ばれます。2つのデータセットで,識別に有効な特徴が似ていることが,モデル流用では重要なポイントになります。
 また,映像監視などの例では,撮影場所などのドメインの違いによって精度が低下する問題があります。つまり,保有データで学習しても,現地データでは精度が出ないことがよくあります。この場合,現地で再学習することで精度を改善することが行われますが,カメラごとに現地データを大量に収集して再学習させるのは高コストになります。少量データ学習技術の2つめは,そのような場合に用いられる「データ流用」です。ドメイン適応とも呼ばれ,保有データを現地データに合うように変換してから学習することで,現地データが少なくても高い精度を得ることができます。
 少量データ学習技術の3つめは「データ生成」です。CGのように精緻な物理モデルがあれば学習データを大量に作れますが,このような物理シミュレーションは高コストなことが課題です。画像の切り貼りなどのデータ合成や,画像の回転や大きさを変えるなどのデータ拡張もありますが,精度改善に有効な「認識が難しいデータ」を必ずしも作れないことが課題です。最近注目されている敵対的生成ネットワーク(GAN)では,本物と偽物とを見分ける識別部と,それを騙す偽物を作るデータ生成部を競わせて,本物そっくりの偽物を作ることができます。しかし,真似すべき本物のデータが少ないと,質の高い偽物を作れないのが課題と言えるでしょう。

<次ページへ続く>

NECデータサイエンス研究所 佐藤 敦

1989年 東北大学大学院理学研究科博士課程了。理学博士。同年NEC入社,中央研究所にてパターン認識,機械学習の研究開発に従事。郵便区分機向け文字認識の開発,顔認証エンジンNeoFaceの開発にも携わる。1994~1995年 米国ワシントン大学客員研究員,2008年 米国マサチューセッツ工科大学客員研究員。現在,NECデータサイエンス研究所主席研究員。東京大学大学院情報理工学系研究科客員教授,理研AIP-NEC連携センター 副連携センター長を兼務。2010年度情報処理学会喜安記念業績賞,2012年度電子情報通信学会業績賞,2014年度全国発明表彰発明賞など受賞。

アーカイブもっと見る

医療画像へのAI応用とその未来
医療画像へのAI応用とその未来...(5/25) 大阪公立大学 健康科学イノベーションセンター スマートライフサイエンスラボ 特任准教授 植田 大樹
インフラ構造物点検におけるイメージング技術の活用
インフラ構造物点検におけるイメージング技術の活用...(3/25) キヤノン(株) イメージソリューション事業本部 IIS事業推進センター 主幹 穴吹 まほろ
生体認証技術を活用したデジタルトランスフォーメーションの最新事例~NEC I: Delightで実現する新たな体験~
生体認証技術を活用したデジタルトランスフォーメーションの最新事例~N...(1/25) 日本電気(株) エンタープライズビジネスユニット デジタルインテグレーション本部 勝浦 啓太
画像を見つめて50年
画像を見つめて50年...(1/25) カーネギーメロン大学 ワイタカー記念全学教授 金出 武雄

▼ プラチナスポンサー ▼

株式会社リンクス

東芝テリー株式会社

▼ メディアパートナー ▼

エキスポ・ゲートブリッジ

CIOE2024

APE2025

ダウンロード

展示会FAQ

IAJ-A3共同開催 画像技術セミナー

第33回三次元工学シンポジウム

第21回偏光計測研究会