画像センシングの最前線

ロボットビジョン藤吉弘亘

1. ロボットビジョンとは

 ロボットとは,「1. 外界のデータを取り込み(感覚),2. その意味を理解し(認識),3. 何をするべきかを判断し(決定),4. 結果として人に役に立つように外界に働きかける(行動)システム」として定義され[1],ロボットビジョンは,1.「外界のデータを取り込み,2.その意味を理解する」処理に当たる.ロボットビジョンは外界に働きかけるシステムのためのビジョンに限定したものであり,コンピュータビジョン(計算機視覚)の一部として包含される位置づけとなる。
ロボットビジョンのタスクは,“環境を知る”・”物を知る”・”人を知る”の三つに大別できる。 “環境を知るタスク”では,ロボットが置かれている周辺環境の三次元構造をセンシングし,環境地図を復元・理解する必要がある。自己の観測を統合して環境地図を作るには自己位置を知る必要があり,環境マッピングと自己位置推定は表裏一体の関係にあることから, この問題はSimultaneous Localization and Mapping (SLAM)として扱われている。物を知るタスクでは,周辺環境にある対象物を認識・検出し,物体をピッキングする場合には,さらに三次元空間における物体の位置・姿勢を正確に求める必要がある。人を知るタスクでは,人体や顔を検出し,人の動きを予測することで,人とロボット間の対話や協調行動を実現している。ここでは顔の表情や手足の動きを基にしたジェスチャー解析を通じて人の行動や意図を認識することも重要である。

このようにロボットビジョンにおけるタスクは多岐に渡り,ロボット分野の研究者だけでなくコンピュータビジョン分野からの研究者も多く取り組んでいる。ロボット関連の国際会議 IROS2015(http://www. iros2015.org)では,投稿論文の頻出キーワードのトップがコンピュータビジョンであり,ロボット分野におけるビジョン技術の重要性が高まっていることを示唆している。

ここでは,物流におけるピッキングタスクのためのロボットビジョン技術として,Amazon Picking Challengeでの取り組みについて紹介する。また,チャレンジレベルから実用化レベルに移行するための課題と,今後の展望としてクラウドロボティクスの一例として,ロボットのためのクラウド型データベース&認識エンジンについて紹介する。

[1]ロボット学創成, 岩波書店, 2004

<次ページへ続く>

藤吉弘亘

中部大学 工学部 ロボット理工学科 機械知覚&ロボティクス研究グループ

アーカイブもっと見る

社会の安全安心を支える画像認識技術
社会の安全安心を支える画像認識技術(9/26) NECデータサイエンス研究所 佐藤 敦
三次元計測
三次元計測(5/9) 梅崎 太造/服部 公央亮/鷲見 典克
三次元計測の原理と光の性質
三次元計測の原理と光の性質(10/21) 広島市立大学 日浦 慎作