インテリジェントルーム

複雑な家電操作システムの設定

  コマンド空間の階層化
机上に固定した限られたコマンド空間に多くの家電操作コマンドを関連付けるために,コマンド空間を階層化する.階層は任意の数だけ追加可能である.階層は,階層変更を関連付けたコマンド空間を選択した際,及び,特定の家電操作を行った際に変更される.また,階層が変更されたことは音声案内により確認が可能である.
  コマンドの合成
1 つのコマンド空間に複数の操作をまとめて関連付けることで,少ない操作で複雑な家電操作を可能とする.
-関連論文-
    鹿野 巧, 川村 拓也, 梅田 和昇, "インテリジェントルームにおける複雑な家電操作の実現," 第35回日本ロボット学会学術講演会予稿集, 1I2-06, September 2017.

ジェスチャを用いた直観的な家電操作

  画像処理を用いた手振りなどのジェスチャの認識技術の実現により,ジェスチャで各種家電製品を制御することを可能にするインテリジェントルームを構築しています.天井に設置した複数台のパンチルトズームカメラの画像から操作者のジェスチャを認識し,テレビのチャンネル操作,ボリューム操作などが行えます.操作者は,リモコン,センサグローブやマイクなどを用いず,室内の任意の場所で,手・指による自然なジェスチャのみで機器の操作が可能です.
  現在は,手振りのみを用いてすべての機器操作を行うシステムの構築を行っています.操作者に固定された空間を仮想的に配置し,その空間で手振りを行うことで,その空間に埋め込まれた操作を行うというシステムです.このシステムに必要は人の3次元的な位置・姿勢の取得には,視体積交差法を利用しています.
img01
  インテリジェントルーム概要図
  インテリジェントルームデモムービー
→demo movie(ダウンロードリンク ファイル形式:.wmv サイズ:13MB )


-関連論文-

FFTを用いた手振り検出

  我々のインテリジェントルームにおいてコアとなる技術が,手振りの検出技術です.手振りは,人と人とのコミュニケーションにおいても呼びかけや注意の喚起に日常的に用いられているため,操作者にとって自然な動作であると言えます.我々は,FFT(高速フーリエ変換)を用いたシンプルなアルゴリズムで手振りをロバストに検出可能な手法を構築しています.手法の概要は次のとおりです.
  まず画像を低解像度化します.次に,低解像度化された画像の各画素の濃淡値に対して,FFTを適用します.手振りが行われている領域では,低解像度画像の濃淡値が正弦波に近い形で振動するので,パワースペクトルを評価することにより,手振りが行われているかどうか判別できます.
img01
  FFTを用いた手振り検出
  FFTを用いた手振り検出デモムービー
→demo(ダウンロードリンク ファイル形式:.mp4 サイズ:3.3MB )

-関連論文-
    浅野秀胤,永易 武,織茂達也,寺林賢司,太田 睦,梅田和昇:“フーリエ変換を用いた指振り検出と機器操作への応用”,精密工学会誌,Vol.79, No.6, pp.565-570, 2013.6.

他にも,インテリジェントルームの構築のための要素技術として,以下の研究を行ってきました.

周期運動検出に基づくジェスチャ認識

  本研究室では,単純な周期的動作である手振り動作に着目し,動作者の位置を機械に伝えることを目的とした画像からの手振り動作認識手法を構築しました.しかしながら,この手法は手を左右に振るなどの繰り返し動作の有無を認識するのみで,伝達可能なジェスチャは1種類のみです.
  本研究では,この手法を拡張し,複数の単純な意思伝達を可能にする周期ジェスチャ認識手法を提案しています.具体的にはまず,低解像度化した濃淡画像の各画素に対して時間軸方向のFFTを行うことにより得られる振幅スペクトルを用いて周期運動領域を検出します.次に,周期運動領域から手の動作領域を抽出し,その領域内の位相スペクトルを用いて周期ジェスチャの種類を識別します.
  提案手法は,直感的かつ非接触での動作を可能にし,濃淡画像を用いることで,照明環境や肌色の個人差に対してロバストに周期ジェスチャを認識できます.さらに,あらかじめ肌色情報を用いて手領域を抽出するといった画像処理は必要なく,簡潔な処理を実現できます.したがって,システムの小型化,ハードウェア化が期待でき,汎用性のあるインタフェースが実現できると考えられます.
img01
  周期ジェスチャの例

-関連論文-

口唇動作認識

  近年,家電機器の機能が高度化しています.それに伴って操作の複雑化や煩わしさが問題として挙げられます.その問題を解決するため,要求する機能を話すだけで家電機器の操作を可能にすることを目標とした研究です.
  このシステムは操作者の顔と同じ高さに設置したカメラにより取得した映像から操作者の唇領域を見つけ出し,その領域の画素値の変化や唇のアスペクト比の変化で口の動きを判別します.
  この研究の利点は口の動きで操作するため音声認識では認識することが難しい雑音がある環境でも使えることです.
img01 img01
  唇位置の認識   口唇動作認識
  口唇動作デモムービー
→demo( .wmv 12MB )
-関連論文-