セミナーレポート

車載カメラで危険を検知し,安全運転を可能にする(株)豊田中央研究所 町田 貴史

本記事は、画像センシング展2012にて開催された特別招待講演を記事化したものになります。

GPU利用でCPU単独の40倍の高速で,歩行者を検出

 豊田中央研究所では,GPUによる処理を利用した,ITSにおける歩行者検出技術の開発に取り組んでいます。歩行者検出技術とは,ドライバーにとって危険な歩行者をその向きによって判定するもので,歩行者の行動を形状として捉える特徴量で判断します。
 近年,パターン認識の分野で広く使われているのがHOG(Histograms of Oriented Gradients)特徴で,小領域におけるエッジ勾配ごとの頻度(ヒストグラム)をならべ,一定領域における,おおまかな物体形状を記述します。それに対して,私たちが開発したのが特徴量間の関係に着目したFIND(Feature Interaction Descriptor)特徴で,対象の輪郭形状をより精緻に表現,HOG特徴より高い識別性能があります(図2)。

図2 特徴量間の関係に着目したFIND特徴で,対象の輪郭形状をより精緻に表現することができる

 私たちは,粗いHOGで歩行者候補を抽出し,HOGで歩行者候補を絞り込み,FINDで歩行者を検出・姿勢を推定するという3段のカスケード方式で,段階的に細かく見ていき,歩行者を検出します。また,歩行者の向きや距離により,見え方に大きな違いが生じるため,多様な学習サンプルで構築された単一の識別器では,安定的な検出が困難です。そこで,向き別と距離別に演算する複数の識別器を導入,歩行者・被歩行者の識別と同時に,向きを判定します。これによって,複数識別器を使わない場合と比べて,検出性能を大きく向上させることに成功しました。
 3段カスケード方式では,1段目(HOG)の特徴次元数が384,2段目(HOG)が1056,3段目(FIND)が42,768と,次元数が多くなります。その結果,VGAで1フレームあたり280億回の四則計算が必要になり,最新のCPUでも1秒ほどかかってしまい,実用になりません。そこで,GPUを利用することにし,1つ目の候補枠の並列化はCPU,2つ目の候補枠走査の並列化と3つ目の候補枠内の識別演算の並列化はGPUで行う,3階層の並列化で処理することにしました。これによって,合計約650万スレッドを生成した並列演算が可能になり,CPUにIntel Corei7 3.2GHz,GPUにnVidia Geforce 580 GTXを使い,1CPUでの単独処理と比べて,約40倍の高速化を実現しました。
 現状のGPUでは消費電力が多く,車に搭載することはできませんが,nVidia社では車載用GPUの開発を進めており,2014年には2-3Wの消費電力で,Core2Quadを超えるチップがリリースされる予定です。その段階になれば,車載化が可能になると,GPUの進化に大きな期待を寄せています。

株式会社豊田中央研究所 町田 貴史

1998年大阪大学基礎工学部情報工学科卒業。2002年奈良先端科学技術大学院大学・情報科学研究科博士後期課程単位取得退学。同年大阪大学サイバーメディアセン ター助手。2006年(株)豊田中央研究所入社。博士(工学)。コンピュータービジョン,コンピューターグラフィックスの研究に従事。情報処理学会,IEEE各会員。

アーカイブもっと見る

オムロンのコア技術“Sensing&Control+THINK”の集大成 卓球ロボットFORPHEUS-「人と機械の融和」の実現に向けて-
オムロンのコア技術“Sensing&Control+THINK”の集…(9/25) オムロン(株) 技術・知財本部 センシング研究開発センタ 研究員 中山 雅宗
省演算・省電力AI:SOINNの活用事例
省演算・省電力AI:SOINNの活用事例(9/25) SOINN(株) 代表取締役CEO 長谷川 修
NTTグループが描く未来農業
NTTグループが描く未来農業(7/25) 日本電信電話㈱(NTT) 研究企画部門 プロデュース担当部長 久住 嘉和
QoL向上のためのメディア認識・理解技術
QoL向上のためのメディア認識・理解技術(7/25) 東京大学 大学院情報理工学系研究科 電子情報学専攻 山崎 俊彦
商用化が目前に迫る完全自動運転における画像センシング技術の重要性
商用化が目前に迫る完全自動運転における画像センシング技術の重要性(11/26) インテル(株) 事業開発・政策推進ダイレクタ 兼 名古屋大学客員准教授 野辺 継男

ダウンロード

展示会FAQ