セミナーレポート

人の直感的な動きで,コンピューターを動かす時代が始まっている日本マイクロソフト(株) 千葉 慎二

本記事は、画像センシング展2012にて開催された特別招待講演を記事化したものになります。

新たに,上半身の骨格追跡機能もサポート

 Kinectセンサーの機能は,(1)カラー情報の取得(2)深度情報の取得(3)プレーヤーのセグメント情報の取得(4)骨格追跡(5)スピーチ認識(6)オーディオエコー除去(7)話者の音源方向特定(8)傾斜モーター,の8つです。本体中央部のカメラでカラー映像を取得し,深度情報は2Dで表現し,距離は50cmほどの間隔で,異なる色の層で表示します。実際の距離は1mm単位の情報がやってきますが,デモでは視覚的に分かりやすく見せるため50cmの間隔で色を変えて表示しました。セグメント情報では対象となる人の姿だけが抜かれて映し出され,これに色を重ねることで,抜き絵を作ることができます。
 1990年代に人気があったテレビ番組『進め!電波少年』は,司会者やゲストが顔だけ出して,後は抜き絵にして評判になりました。その撮影はグリーンスクリーンといって,背景を同一色にして,その前で出演者が背景と同じ色にした服を着て出て,クロマキー合成というやり方で,抜き絵を作っていました。けれども,Kinectセンサーを使えば,そうした手間をかけることなく,簡単に抜き絵を作ることができます。
 また骨格追跡は,のど元,両肩,両手,腰中心など全身の20カ所の関節座標をリアルタイムで取得できます。さらに,2012年5月にリリースされたソフトウエア開発キット新バージョン「Kinect for Windows SDK1.5」では上半身だけの骨格追跡をサポートしました。併せて,フェースSDKも追加され,目や鼻,口など顔の動きをトラッキングすることができます。今回はこの機能を使い,コントローラーなしに,パワーポイントのスライドを右手で右から左にページをめくることができるデモ用アプリを試作しました。スピーチ認識は現在,英語,フランス語,スペイン語,イタリア語,日本語が認識できますが,今後認識できる言語を増やしていく予定です。この機能を使うと,声でパワーポイントをめくることができます。今回はデモ用に「PowerPoint」「Next」「Back」という言葉をテキストで入力・登録してみました。「パワーポイント ネクスト」と言えば,スライドが進みますし,「パワーポイント バック」といえば,戻すことができます。
 そして,音源方向特定の機能では音がどこから出ているかを特定することができます。これと骨格追跡機能を合わせて使うことで,話している人の方向にビームを向け,より精度の高い情報を得ることができます。例えば,子どもが一生懸命ゲームをしている時に,お母さんが来て後ろから「ゲームをやめなさい」といっても,その声を無視して,ゲームを続けることができるのです。

<次ページへ続く>

日本マイクロソフト(株) 千葉 慎二

アーカイブもっと見る

知能ロボットのための画像センシング技術の基礎と研究事例
知能ロボットのための画像センシング技術の基礎と研究事例...(11/25) 中京大学 工学部 教授・ヒューマンロボティクス研究 センター長 橋本 学
人と人の共感・連携を促しチームパフォーマンスを高める “Sensing & Control+Think”技術 -オムロンが描く「人と機械の融和」の一形態について-
人と人の共感・連携を促しチームパフォーマンスを高める “Sensin...(9/25) オムロン(株) 技術・知財本部 ロボティクスR&Dセンタ 水山 遼
自動運転のためのセンサーフュージョン技術
自動運転のためのセンサーフュージョン技術...(7/25) 芝浦工業大学 システム理工学部 機械制御システム学科 教授 伊東 敏夫
コンピュテーショナルイメージング概説
コンピュテーショナルイメージング概説...(7/25) 東京大学 大学院 情報理工学系研究科 准教授 堀﨑 遼一
ニューノーマルにおけるロボットビジョン研究
ニューノーマルにおけるロボットビジョン研究...(11/25) 産業技術総合研究所 インダストリアルCPS研究センター 堂前 幸康

▼ メディアパートナー ▼

Smart Factory + Automation World 2024
CIOE2024

ダウンロード

展示会FAQ