コロナに負けず、できることを少しずつ。

[受講報告] GTC Workshop Japan 2011 プラチナスポンサーセッション・日本ネスト株式会社 Hall A2

NO IMAGE

 所感は書きません。すべてワタシの受講メモを as is 公開です。

セッション資料:http://www.nv-jp-event.jp/pdf/P3-NeST.pdf

===
[受講報告] GTC Workshop Japan 2011 プラチナスポンサーセッション・日本ネスト株式会社 Hall A2

■講演者名:Rajeev Kumaraswamy(ラジーブ クマラスワミ)
Principal Research Engineer、NeST Software Pvt.India

■講演タイトル:ビジュアルコンピューティングにおける最近の傾向と考察
〜Visual Computing Review〜

■講演要旨:ビジュアルコンピューティングはコンピュータビジョン、高次元データ処理、コンピュータグラフィックスの集合体を意味します。この分野への関心はNVIDIAによる開発環境CUDAが世に出たことにより、ますます増えています。ビジュアルコンピューティングのアプリケーションは、いち早くからロボット工学、マシンビジョン、監視、リアルタイムによる医療画像処理、拡張現実や遠隔探査、と言ったものに活用されています。
ビジュアルコンピューティングシステムを上手に活用するための要素は沢山あります。効果的かつ低レベルの画像処理に加え、パターン認識や3次元のポイント処理、ビジュアライゼーションといった強力なコンピュータビジョン機能などはその一つです。本講演ではビジュアルコンピューティング分野の最近の状況を広範囲に調査したものを報告しながら、皆様が抱えている共通の問題と解決策を考察していきます。私たちNeSTはアルゴリズムより新たな価値を創り、これらコンピュータの課題点を明らかにすることを試みます。

Visual computing is a confluence of computer vision, high dimensional data processing and computer graphics. The interest in this field has grown significantly since the introduction of CUDA development environment by NVIDIA. Visual computing applications are coming up fast in robotics, machine vision, surveillance, real-time medical imaging, augmented reality and remote sensing, to name just a few.
There are many ingredients that make up a successful visual computing system; efficient low level image processing, powerful computer vision functions such as pattern recognition, 3D point processing and visualization. This talk aims to provide a comprehensive survey of recent progress in visual computing domain. We discuss the common problems in this area and efficient solutions. We will attempt to identify the computational bottlenecks and the algorithmic choices that can make a difference. The hope that the presentation will help all those interested in developing innovative solutions in this area.

セッション資料:http://www.nv-jp-event.jp/pdf/P3-NeST.pdf

====
ラジーブさんはインドから来られて、ネストはコンピュータのエンジニアサービスを提供していらっしゃる。
ビジュアル・コンピュティングを担当している。

===
さて、ビジュアルコンピューティングについて説明するのは容易ではありません。
、実社会にビジュアル、ビジョンというのは視覚が大事です。

現実世界でデータを獲得する。立体であったり加速度計など多くの巨大のデータをもとに

データ処理や分析をする

データのモデル化を行う。処理や統計分析を投入する。

実世界の連続したもの、物理モデルを入力します。
現実的からの情報が多ければ、データの結果の臨場感を増すことができます。

===

この実世界からみてみると、

意味論(物理的モデルをよく理解するため)が中心となります

===
Data Acquisition

3Dモデルで顔認識、飛行時間カメラ(Xbox)、レーダー、ライダーなど
===
3D data Generation Example

マルチビューデータを集め

3D Point Cloud

点からメッシュ化トライアングレーションする

人間であれば点ではなく面としてサーフェイス等のグラッフィクモデルを人間を利用して考える

アニメーション ← モーションキャプチャから加速度情報を与える

パラメタを与え

3D へ

===
立体視

左右どこが相関しているか、計算する

===
GPUでステレオマッチングを行う

ブロックマッチングはカンタンであるが、他にも計算処理を行う、データ保管、変換、すべて3Dで登録する。

===
イメージ・レジストレーション

トランスフォーマ
類似性発見
最適化

いろいろな組み合わせ

===
一つの事例をとってみる。

3Dポイント処理、数百万の点がある。

2Dは1つのピクセルは近隣のピクセルをデータイメージすることは、インデックスを変えると X−Y,X+Yで近隣することができるが、ほとんどのプロセスはそのトライや派生値を見ることが出来るが3Dはデータアレイが問題になる。ですから、これでは難しい。
そこでデータを構造化、ツリー化し、そのローカル性を注視する。

ツリー構造の実装をうまくやる。しかしこれはOSSで提供されていないが努力はされている。

===
ツリー構造のGPU実装について

KD-Tree 実装が人気ある。

===
サードパーティの実装

セグメント化→ CCL ラベリング(コンポーネント)→機能拡張→分類化

人間によってセグメント化を行い
CCL で近接しているのか違うのか
ヒストグラムによって抽出していく(オブジェクトが丸いかどうか)
そして得られたものを分類化し、それが人間のアタマかどうかを見ていく

===
GPUにおけるセグメンテーション

スピードについては10倍程度

===
フィーチャー抽出は難しい。

ジェネリック・フィーチャーを獲得する方法は最近出てきているが、
まだ最適化が必要かどうか、当初のメトリックスがGPUで使えるかどうか、
フーリエ記述、変換(とあんすふぉーま)、などなど

===
パターン分類化

SVM パターン分析、ANN 神経回路、決定枝

===
バークリーがベクターマシンで実装した、近日発表あるでせう
(金融のバークリーかな?、リスク計算?)

===
GPUでANN

問題はトレーニング。近似値を見つける

===
CCL

連結成分のラベル付がボトルネックとなる。
ソリューション提供が出来ていないのは CCL がうまくいかない。
4つの近接=3コンポーネンツ ・・・ どこが連結されているのか、1つの球体で見て、どう展開するか?

1つのピクセルがあり、他のピクセルと連携しているか、
そしてテストし、その新しいペアがどうつながるのか、テストしていく

===
GPU実装するアルゴリズム

1パス、2パス、マルチパスを採用するものを考えること

===
CCL アルゴリズム は注釈として紹介した。
鈴木氏の論文

===
動画の中から魚を認識する方法

沢山の中から認識する、それも動画で。

若い魚もあれば、年老いた魚もある。

そこでまずは魚を認識するため、前処理(ライティングなど)も必要。

背景除去

適用スレッディング

Blob フィルタリング

(書くの面倒なので、最初の方にかいた資料リンクで P.24 見てください)

===
問題を抱えたお客様へポーティングサービスを提供している。
GPUを実装したカタチでの。

近日、NeST フォーカス。今後プライシングについても発表していく。

顔認識の事例など。

CCL を構築できれば高速化につながる。

===
ビジネス・バーティカル

ヘルスケア、自動車産業、などなど

===
ワークフロー (分析結果は MATLAB で機能性試験を行う、これは無料提供)

ただし、ここでは並列処理は行わない、その並列処理を行うためのビヘイビアモデルで
検証しGPUのチームへハンドオーバーしていく

===
基本的な分析は無償、並列化は有償となる

以上

CUDAカテゴリの最新記事