3次元姿勢推定

3次元空間における人体姿勢の推定(3次元姿勢推定/3D Pose Estimation)は、不審人物の行動検知や、ロボットやアニメーションの動作への活用など、様々な分野への応用が期待されており、ここ数年で目まぐるしい発展を遂げています。
しかし依然として、2次元の姿勢推定よりもはるかに難易度が高い技術領域でもあります。
カラー画像から高精度に3次元姿勢を推定するために、一般的には複数のセンサを用いたモーションキャプチャや、ボディスーツなどの高価な設備が必要となります。
そのような中Global Walkersでは、導入しやすい3次元姿勢推定技術「GW-Pose」を開発しています。

3次元姿勢推定AIモデル「GW-POSE」

GW-PoseはDepthカメラから得られるカラー画像と距離情報を活用する事で、3次元空間における人の関節位置を高い精度で計測します。また、動画像からリアルタイムで3次元姿勢推定を行うことも可能です。
Depthカメラが計測できる距離内であれば、従来の設備を利用した3次元姿勢推定が不得手としていた「場所を問わない利用」が可能です。例えば、工場内やスポーツイベント会場、オフィス環境などにおいてもご利用いただけます。
また、Global WalkersではGW-Poseの性能評価を目的とした開発者キットを提供しています。
開発者キットではGW-Poseの基本的な機能をお試しいただけるほか、追加学習によるカスタマイズにも対応可能です。

3次元姿勢推定技術(GW-Pose)の特徴

正確性

正確性

Intel RealsenseなどのDepthカメラから得られる距離情報を用いることで、RGB値のみを用いたAIモデルに比べてはるかに正確な姿勢推定を実現しています。

低負荷

低負荷

一般的なノートパソコン(NVIDIAのGPUを搭載したもの)においても10~100フレーム/秒程度の推論処理が行えます。NVIDIA Jetsonなどの小型コンピュータでもリアルタイム処理が可能です。

拡張性

拡張性

X86やARMプロセッサにも互換性があります。Depthカメラについても、Intel Realsense 以外のToFカメラなどを活用することも可能です。

リアルタイム出力

リアルタイム出力

18個の身体部位の3次元座標を、最大100フレーム/秒で出力することができます。
18個の身体部位以外の3次元座標を計測したい場合は、カスタマイズも可能です。

複数人の同時察知

複数人の同時察知

複数人が映っている場合であっても、一人のみが映っている場合と同等の速度や精度で、複数人の3次元姿勢を同時にリアルタイムで推論することが可能です。

導入コスト

導入コスト

必要なデバイスは1台のコンピュータと、1台のDepthカメラのみです。
シンプルかつコンパクトなシステム構成であるため、ロボットやドローンへの搭載も可能です。

3次元姿勢推定技術(GW-Pose) デモ動画

全身の検出結果(Indoor)

全身の検出結果(Outdoor)

座った状態の検出結果

3方向の視点からの検出結果

導入事例

マルコシシーガル AI活用 

株式会社マルコシ・シーガル様

概要

店舗内で顧客が手に取った商品の特定を行い、購買に至るコンバージョンの計測の実施。

技術

GW-PoseとSLAM(Simultaneous Localization and Mapping)技術を掛け合わせることで、顧客の陳列した商品への接触頻度を基に
ヒートマップを作成することで、POS情報のみでは判定が難しい顧客行動のトラッキングの実現。

期待する効果

トラッキング情報を基に、どの位置の商品がよく手に取られるのか、あるいは購買に繋がるのかといったデータを取得することによる
マーケティング分析への応用。