第1回　画像AI研究の「こうありたい」テクノクラート像－現場に深く根差した佐藤雄隆博士－A more than the expected Technocrat of Image AI Researches―Dr. Yutaka Sato―

UPDATE：2022.01.25 (2年前) | 記事カテゴリー：エール ―若き画像研究の旗手へ―

2．研究への視線－事例とメッセージ－

　研究は新規性を重んじる。それも，できることなら発想も原理もどこかの誰かの土俵に乗っかってちまちました新規性を探すのではなく，新しいスキームを出したい。しかし，このような意気込みを感じさせてもらえる研究者に出会う経験はそんなに多くない。ところが，佐藤さんと佐藤さんのグループからは，インパクトをもって発信され，外来種でない刺激が画像研究界にもたらされている。その事例とそれを裏づける秘密について考えてみたいのである。

（1）研究課題をあぶり出す研究は，極上の研究である！
　既存の土俵で勝つ研究もよい研究であるが，土俵をつくる研究こそ極上の研究である。佐藤さん（のグループ）の研究からは，いつもそんな声が聞こえてくる。
　例えば，1990年初頭の高次局所自己相関特徴抽出法（HLAC）や「CHLAC」（立体高次局所自己相関特徴法）は，独自の数理理論に裏打ちされて，その研究テーマの成果だけでなく，底流する問題意識までもが皆に届く問いとなったような気がする。DL技術で盛り上がっている画像認識の研究には，学術的深みに一歩踏み込んだ議論が待たれている。そんな気分の画像AI研究ノービスにとって非常に印象深かった，佐藤さん（のグループ）の講演をある時お聞きしたことがあった。これらは，下記のご研究であった。

・賀雲，片岡裕雄，白壁奏馬，佐藤雄隆: “ 人を見ない人物行動認識”，ビジョン技術の実利用ワークショップ
　（ViEW2016）講演論文集（2016）（平成28 年精密工学会画像応用技術専門委員会若手奨励賞受賞）
・Y. He, S. Shirakabe, Y. Satoh, H. Kataoka: “Human Action Recognition without Human”, ECCV 2016
　Workshop（Oral,Brave New Idea）（2016）

　飛び込み選手やテニス選手を動画から認識してトラッキングする研究では，近時ではDL技術の独壇場になっている。技術のエッセンスは，学習ネットワークモデルないしそのハイパーパラメータを課題内容に則して決められるか？画像データセットないしそのアノテーションの品質を課題内容に則して担保できるか？である。佐藤さん（のグループ）は，この基本問題にこれらの研究によって面白い問いかけをされた。

テニス選手トラッキングの学習機械は，背景だけを見せても学ぶ！
写真2　DLで「図」を学ぶか？「地」を学ぶか？

ECCV 2016 Workshop ポスター（Oral, Brave New Idea）
写真3　テニス選手トラッキングの学習機械は，背景だけを見せても学ぶ！

　学習用画像データの見せ方に潜在する，写真2のような視覚心理学でいう「図と地」の問いかけにまっすぐに対峙した研究であったと筆者は受け止めた。佐藤さんは，写真3のようなネットワークモデルを構想して，人物領域「図」を隠して教示せずその代わりに背景領域「地」を見せても，人物トラッキングを成功できると示した。これは細部に目をつむるとほぼ自明にも見えていながら，万人に届く入力層の設計問題とアノテーション問題の核心を突いていたのであった。認知科学，視覚心理学，視覚生理，情報科学にも及ぶデータサイエンスの深みに届く問題提起であった。例えば，DLのハイパーパラメータ，提示画像のサイズと図と地のバランスが最重要である。このコンセプトを証明する，優れたPoC的研究であったように思う。

（2）「トレンドリサーチはリサーチ」宣言へのエール
　DL研究は激動中である。日々の時時刻刻のトレンドリサーチが欠かせない。DL研究ではことのほか，自身の研究のマップづくりもポジショニングもその成功のほぼ100％を約束してくれている感じさえする。
　この意味で，佐藤さんと氏のグループはすごい。DL研究の若手研究者の突出した才能と熱量をグループの力に変容する，そんなマジックを見事に成功させている。「トレンドリサーチはリサーチ」と佐藤さんが言い切ったのであったと想像してよいであろう。ご存知であろうがその試みとその成果（http://xpaperchallenge.org/）は顕著である。
　そして，このような徹底したトレンド研究の中から生まれて皆をアッと言わしめた，下記の画像データ増量法も学会でバズった。パターン生成空間と潜在空間の代数的全単射関係がとりわけこの研究では興味深く感じている。

・松崎優太，岡安寿繁，中村明生，佐藤雄隆，片岡裕雄：“フラクタル幾何学を用いたデータセットの拡張および
　特性評価”，MIRU2018 (2018)（2019 年度産総研論文賞）
・自然法則に基づく深層学習，NVIDIA 講演会（秋のHPC Weeks），2021年10月18日
・ACCV 2020 BEST PAPER HONORABLE MENTION AWARD受賞

（3）3 つ目は，引き続きおねだり的エール
　果たして，本質的課題を暴ける研究が（も）研究だ，新しい問題を見つける研究が（も）研究だ，そのうえで見つかった問題解決技術研究も研究だ，･･･などと改めて我に返って思いめぐらすと実に面白くワクワクする。いわゆる学術論文は一元的に括らないほうがよっぽどよいことに気付くではないか。「サーベイ」論文とか「クリティック」論文とか「評論」とか「基礎」とか「基盤」とか「技術」論文とか「応用」とか「チュートリアル」とか「対論」論文とか…，学術論文の個性の多様性を自覚的に輝かせるべきであろう。
　ところで，それらの展望を拓くためには，どこで誰がどのように取り上げたらいいのであろうか？そこで，日本国のテクノクラート，それも予定調和を好まないカッティングエッジの佐藤さんにこそ，このような学術的学会的リテラシに重層的な見通しをつけるべく試論し展望していただけないものでしょうか？
　さらに妄想を膨らませる。画像AI研究の本性はなにものなのであろうか？かのH. ベルクソンのいう物質科学（Matter Science）と記憶科学（Memory Science，情報科学）で整理すると，圧倒的に後者にあろう。AI，ビッグデータ，データサイエンス，画像認識，機械学習，深層学習，数理統計，確率統計などの時代のキーワードは優れて後者の現象を取り扱う。画像AI技術という格好の舞台を借りて，記憶科学の科学技術論とカリキュラム構想を，佐藤さん的に展開していただきたい，と念願してやみません。

＜次ページへ続く＞