X
Subscribe for notification

[受講報告] NVIDIA GTC Workshop Japan 2011 午前

いまミッドタウンの DEAN & DELUCA でイチゴジュースを飲みながら午前中のエキサイトで且つ将来ビジョンをパワフルに描ける基調講演の受講報告を纏めています。が、膨大なので自分の受講メモをそのまま貼り付けます。

===

★☆★☆★☆★  GPUコンピューティングイベント   ★☆★☆★☆★
★☆★☆★☆★  NVIDIA GTC Workshop Japan 2011  ★☆★☆★☆★

NVIDIA GTC Workshop Japan 2011に登録された方に Tesla C2070を特別価格で提供!
※特別価格 179,800円(税別)
・7月22日までにTesla販売代理店にご発注を頂いた場合

※特別価格 199,800円(税別)
・7月23日〜9月30日までにTesla販売代理店にご発注を頂いた場合

※但し特別価格販売には以下の条件が適用されます。
・ご発注後1ヶ月以内の納品
・販売は日本国内に限定
・特別価格の適用は登録者1名につき2枚まで

※本イベント登録者に送られる受講証をTesla販売代理店にご提示により上記特別価格を適用致します。

※特別価格の適用についてのお問い合わせは下記のTesla販売代理店にお願いします。
・エルザジャパン、G-DEP、ユニットコム、日本SGI、サードウェーブ

nVIDIA GTC Workshoop第1回目 日本で。
クリス マラコウスキー、リサーチ担当は G3, G4, G5 調査している。
アーキテクチャー、開発、テクニカルハブ、オペレーション担当してきたが数年間はやっていない。
今年からリサーチ担当としてフルタイムで復職。

nVIDIA創設経緯、沿革推移、将来の方向性を話したい。

twitter からライブ配信しているニュースサイトを知り、そして機内でストリーミングを見ていた
「なでしこジャパン」

ーーー
GPU Technlology Conference 2009年に開始、アメリカから中国、日本、タイワン、
シンガポール、イスラエルに展開、750以上の論文及びポスターセッション、世界40か国以上の
地域から述べ5,000名以上が参加、エバンジェリストとそして参加。

---

GPU
3億個の CUDA 対応のGPUの数
100万かい CUDA ツールキットのダウンロード数
15万人 アクティブな CUDA開発者数
世界でCUDAを教えている大学の数
CUDA CoE の数 13

世界中で教育オペレーションが行われている。 center by excelence として東工大。
---

nVIDIA 創設の経緯

共同創設者といつもデニーズで創設の話をしていた。
デニーズを朝食、コーヒーをのみながら4〜5h ビジネスプラン、採用スキームなどの事業計画を練っていた。
ショップを2つのベッドルームを借りた、自宅から車で30分の距離。
社名をいろいろドライブ中に考えた。

マルチメディア・ビデオなどをやっているが、将来はどうなるかわからない。
当初、nVision を考えた汎用的に使えるように、そして登記調査をしたが
法律事務所で調べたら環境にやさしいトイレットペーパで使われていた。
次に、nVIDIA をクールだと思いこれにし、ブランディングしてくれる会社からの指導を受けた。
資金調達の前に銀行の近くに安い場所を借りたが、ところが銀行強盗が発生するような治安が悪い場所で
あったが最初の開発場所。
最初はグラフィックチップス NV-1 を開発したが市場には受け入れられなかった。
浮動小数点 3D グラフィックスをPCへ持ち込むのが考えであったが、
SEGA サターンで使ったようなメモリが少なくても動作する処理を作った、80万トランジスタ規模
そして、バー茶ファイター、パンツァードラグーンであったが、コンシューマ製品で手ごたえを得た

RIVA ファミリー TNT, RIVA 2d/3D アクセラレータを開発した。
VGA コントローラ、DOOM というゲームに使われた。

1993年に設立、WIndows 95 にも携わった、RIVA,
1999年 PC Magazine のカバーに登場した。プロセッサが多様化した問題解決するものである。
PC World で PC Magazine は世界でトップ5の媒体で、エディタで高評価されれば大きな前進であった。
64bit DRAM は当時 $200 であった。今は同じコストで多大なる進化している。
画期的な開発であった。ポリゴンもいきいきしていない、角ばっているし影もなかった。

GeForce 3 Ti 500, Fixed Function であったのがグラフィックスのパイプラインの性能差
(input, output などの
開発自由性がなかった)を解決した。
光沢感、メタルの錆具合の表現することに成功し、Xbox 採用に至った。
プログラミングできること、プラットフォームの技術として新しいテクノロジ。

2004年に新しいゲームに採用された。臨場感がある描画を実現。
APIC ゲーム、 DX11 ゲームに採用

ーーー
ハーフストライクのような漫画のような原始的なゲームに採用され、進化された。
当時はこれが凄いと思われた。サブサーフェイスも劇的であった。

---

NVIDIA GPU 30億トランジスタで構成。
95年から15年経過し、80万のトランジスタから30億トランジスタへ

ストリーミング、マルイチプロセッサへ、

プロセッサアーキテクチャ CUDA
演算 FORCE POWER はゲームの計算処理から生まれたものである。
他の業界に適用できるように開発された。

コンぴゅてぃーんぐはサイエンスの第3の柱
創薬 分子動力学、地震画像処理 リバースタイム マイグレーション、自動車設計 計算流体力学・・・

---
創薬においてか鍵となるのは、一つの分子が他の分子と類似性があるかどうかを見つけること。OpenEyeの
ソフトウェアはTesla を使って以前は数日かかっていたものが数時間で。
---
動いている心臓の手術は危険であり、2%の外科医にしか執刀できない、フランスのLIRMMの研究者は
心臓の動きを予測しロボットで執刀する。
---

エクサスクエールへ、その先へ

日本は国策として HPC 取り組んでいる。 P Flops の世界へ。

電力をかけてするのか?

---

TIME Feb. 21, 2011 に NVIDIA Tesla GPC & PC

IBM のチェスマシンを我々はコンピュータ処理で打ち負かした
2045 年にはん現の脳を超える人工知能を実現するでしょう。

===
電力問題。

消費電力が最大の課題に。
米国のエネルギー省の電力モデルだけでも、待機電力だけでも年間数億ドルになってしまう。
電力会社は数年間の電力契約してくれるならスパコンを差し上げましょうというくらいブラックジョークもある。

ヘテロジニアスなど、ペタスケールにおいて GPUスパコンが最高の電力性能を実現。
---
GPUロードマップ

Fermi フェルミを出荷 2009年
Kepler ケプラ 2011年出荷
Maxwell 2013年出荷予定

ワットあたりの倍精度演算性能 GFLOPS は相当進化するものとみている。Tesla 1.5, Fermi 2,
 Kepler 5.8, Maxwell 15

===
エクサスケールに必要な電力

Power MegaWatts

Fermi 50万世帯の電力相当 600MW
Kelper 200MW
Maxwell 100MW 未満。
エクサスケールターゲット 10MW 目指す。

そこへ向かうための開発、電力効率、電子移動を計算。
===
1000倍以上のコンピューティングの必要性

2006年は2ナノ秒のシミュレーションに8カ月必要であった。 2.7M atoms, Risbone

===
プロセス工学におけるマルチスケールシミュレーション

現在は分子レベルのシミュレーションできるレベルにまである。
システム間のイントラクションまでシミュレーションする必要がある。
===
商用飛行機デザインのためのエクサスケール
できるだけ自然エネルギにやさしい商用飛行機を設計、演算能力を最大にするコンピュータにGPUが
使用されている。
翼の設計、測定した結果を戻してチューニングの繰り返しをしていると人材、コストもかかる。
それをコンピュータで行い、結果検証すると、アルゴリズムがハッキリ見えてくる。ボーイング 787 の経済性は
GPUの恩恵である。
===
コンピューティングに基づく創薬

これまでは人間が科学パラメタを調整、スクリーニングする、臨床試験を長期にコストして承認を得ていた。
↓
仮想スクリーニング(候補を90%絞ることができる)
↓
LEAD最適化→FDA承認。

===
オーダーメイド医療

その人の個人個人にあった特別の診断を行う、より健康になって病院にいく、副作用を低くするのが
将来に明るいと思う。
===

東工大教授 松岡聡先生「医療や安全、エネルギーに関する先端的な様々な事柄はエクサスケール
コンピューティングによって実現されます。そしてそれは、社会にとって、また我々一人ひとりにとって大きな
メリットになると確信しています。」天候気候、温暖化、セキュリティ、災害などに問題解決の計算能力は
100倍以上になるでしょう、顧客、国にもメリットをもたらすでしょう。今後500倍のパワーが出てくる、
いまの問題を解決することによって出てくることを理解して活かしてほしい、社会のために成果を
もたらせてほしい、今から考えてほしい。

今日は10の論文発表、17のポスターセッションがある。東工大を中心に、人脈構築などの
一日になる。帰る時には良かったなと思える場になる。

===
世界のGPUテクノロジカンファレンス、次回は北京(今年末)、来年5月サンノゼ、
ベンダ含めてGPU環境を提供していきたい。

地域イベントよりも大きな規模になるので、是非参加してほしい、多様化なコンテンツをWebサイト
にあるので利用活用ください。

===
OPERATION KIZUNA 275万ドル寄付。東日本大震災にココロを痛めた。なんとか力になれないか。
寄付を集めた。
子供たちに経済的、精神的なサポートを提供する。

難しいのは正しい形でいただいた寄付をすること、正しい使い方をすることを考えることが難しい。
非営利団体でもいいですが、社員が基金を作って、よりより子供の生活が送れるプログラムを考えていきたい。
セラピー、スポーツなどを考えているがもっと最適化して、もっと正しいアイディアを募集しています。
ご紹介ください。是非ごれんらください。
=================
日本代表、米国VP
スティーブ ファーニー・ハウ

みんな白髪で髭をして黒い服を着ているのか、それはノーです。
クリスがキックオフしたこと、将来紹介したことに感謝したい。

コンピュータの進化、処理能力が高まる事は可能性が拡がる事。
私達の生活の質を高める、いいことだ。

日本の観点からカンファレンスを考えたい。
===
GPUが加速するパラレルコンピューティング

製造業、バイオインファマティクス、マシンビジョン、金融、医療画像処理、気候シミュレーション

海の日、なでしこジャパン、などなど日本は祝うことが多い
HPC分野は京システムは6月に世界一位、日本ならず世界最速。
昨年 TSUBAME がパワー効率が高いシステムであった。いまは riken が入ったので5位になったが。
しかし日本の実行力はすばらしい、日本のリーダシップは素晴らしい事例である。

今日のカンファレンスでGPUアプリケーションについて使用事例、高速高品質の管理していくなど
製品、製造企業に対してGPUでもってより安全性の高い製品のリリース時間を縮めるでしょう。
日本は自動車産業に製造アルゴリズムが成長するでしょう。

===
GTC Workshop Japan スポンサー
日本においてソリューションプロバイダのエコシステムが充実している。
企業から多くのプレゼン、論文紹介があります。

===
GPUコンピューティング研究会
リサ—チのコミュにてぃがある。
東工大 学術国際情報センター青木教授 GSIC

今回東工大がテクニカルセッションを担当している。
GOUコン研究会について、活動内容
・TSUBAME を用いた CUDA 講習会
・セミナー
・国際ワークしょ
・年1回のシンポジウム

東工大の教員学生だけでなく、他大学、研究機関、民間企業の方も参加(入会)可能、基本的に無料
会員数730名、8月3日に TSUBAME を用いた CUDA 講習会します。
相当の数の方がこの研究会に入会している。

http://gpu-computing.gsic.titech.ac.jp/

===
テクニカルセッション
口頭発表10件、ポスター発表17件

実行委員会を構成し、本日の発表からそれぞれ1編を最優秀賞として表彰し
代表者をサンノゼ GTC2012 へ招待。

昨日まで中国にいたが、京コンピュータは影響しているが中国人のGPU熱は大規模で
興味を持っている方がいらっしゃる。

2008年に TSUBAME 1.2 に TESLA を600枚搭載してやってきたが
こんなにも予測しない現在のような市場、参加者の規模になった。
今後さらに増えていくのが、日本の科学技術が進化してくでしょう

===
ライブストリーミング
GPUエンコードによるライブストリーミング
協賛 IIJ,MSKK

GPUケーススタディ、これほどイイやりかたはないでしょう。

===
nVIDIA JAPAN マーケティングマネジャ 林憲一さん
ライブストリーミングの説明。

CUDA対応 Expression Encoder + IIS Smooth Streaming

Expressin Encoder 4 は CUDA に対応しておr、Tesla C2070 は通常の5倍のコンピュータ性能。
今回 hp Z800 Workstation で構成しており、5倍の性能を1/5の価格、即ち25倍のコストパフォーマンス
IIJから配信。今回はIIJ協力でアンドロイドでも視聴可能。

8月末までアーカイブ配信する。

===
Tesla M2090  512CUDA コア搭載
665 GFlops, 178GB/s メモリバンド幅

LInpack, AMBER が、M2070 と比べて20〜30%パフォーマンスUP

===
CUDA 4.0 今年5/25 リリースした。

今回、GPU Direct 2.0 並列プログラミングを容易にする。
Unified Virtual Addressing 並列アプリのポーティングを容易にする
Thrust  スラスト C++ での並列プログラミングを容易にする
Parallel Nsight 2.0  VS2010 でCUDA プログラミングを容易にする

どなたでも無料に自由で利用できる。これによって最新のGPU性能を引き出すプログラミングを最小
の労力で実現可能。

===
日本での取り組み

GPUコンピューティング ソリューションファインダー

GPU コンピューティングに対応した
ハードウェア、アプリ、サーびす、イベント、ハードウェア情報、CUDA 最新情報をカンタンに検索できる
ポータルサイト、6末時点で52社。183ソリューション。

===
 Call to Action

hp 社事例 午前

午後からはパラレルセッション

====
ダイアモンドセッション
日本hp 中井大士さん

まず hp と nVIDIA の関係
クワドロシリーズ、いまはテスラシリーズまで展開している。
デスクサイドのみならずデータセンタのものまで。

1999年に HP Workstion Project から戦略的パートナーリングを開始
初の GPU組み込みサーバを開発。カスタマイズ型 M1060 を使用。
→ヒートシンクは独自

初のマルチ GPU 搭載、SL390s を開発

2010 東工大 TSUBAME 2.0 導入。運用スパコンとして No.1 の電力効率を実現。
10機種以上にわある nVIDIA GPU Tested モデル。

===
 HP Labs が CUDA Research Center に認定

BI, データ解析をテーマにしている。K平均法アルゴリズムへのGPU適用により大容量データにおいても
10倍以上の高速化を実現。

GPU加速型大規模アナリティクス

===

広範囲にわたるHPのGPUコンピューティングプラットフォーム

ワークステーション、ラックマウント、ブレードサーバ、マルチノード・サーバ

なぜ幅広いプラットフォームに展開しているのかは、適用範囲が広がった。

===

進む本格活用と、活用分野の拡がり。

本格活用 TSUBAME 2.0 運用スパコンでNo.1の電力システム(低消費電力)
SL390 , 1000台構成

Georgia Tech, Keeneland プロジェクト。金融分析(学術事例)

ビジネスの幅、事例が拡がっている。

CAE 製造業シミュレーション、解析
Pricing プライス計算、リスク計算
→用途拡大

これらはもともと演算能力が必要だと言われて過去からやってきた分野なので、ここにGPUを適用
するのは自然の流れである。

・応用として
ライフサイエンス・メディカル、エンターテイメント
活用分野のさらなる広がり

===
社会貢献
・某政府機関
デジタルフォレンジック(暗号化したデータ、消去したデータ) 犯罪捜査のため
あるスポーツ不祥事(相撲)のケータイデータの消去データの分析

HP Workstation Z800 と TEsla C2050 x 2 を大規模導入

この人はクロを証明したいのではなく、この人はシロだと言える目的も(海外)

===
BIM  Buiding Information MOdeling
ペーパーレススタジオ ジャパン

3次元での建築モデルの可視化、各種設計情報と連携可能な新設計手法
いろんな環境情報を付加することで建築手法について問題点が出るのかも予測分析する。

仮説住宅の設計モデリング、1mの積雪に耐えうる設計を行った。
復興支援として Z800 WS + Tesla C2050 を提供し、Autodesk アプリを運用する。

===
株式会社 AZE

医療画像処理、解析システム

多角的な解析、評価を可能に患者にわかりやすい医療にも貢献

従来比の20倍。

最先端の高速で鮮明。患者へわかりやすい説明へ。

単に速い高速だけではなく、いままでできなかったことができるようになった

===
次世代コンテンツ  某ネットサービス事業者

サーバーサイドレンダリング

ユーザ端末のスペックに依存しない高度な3Dグラフィックスの表示

多様化するモバイル端末へのCGアニメーション、ゲーム、地図といった高度なグラフィックスコンテンツの
展開を実現。

いろんな要求にクライアント側にあったが、今後はクライアントへ計算結果を返しましょう。

3D高精細のマップをスマフォンで計算したレンダリング画像を各端末へ配信している。

===
NVIDIA + HP さらに先への取組

仮想化環境への応用:Graphic Accelerated VDI

・Remore FX  Hyper-V 上の仮想マシンにホスト側のGPUを仮想シェアリング
→GPUのコンソリ、統合化

・CAD/CAE, CG など
グラッフィクス機能を必要とする端末の仮想統合、リモートクライアント化を実現
・NVIDIA,Microsoft, HP にて共同検証

WS460c 4060c ?

===
hp GPU Starter Kit w/nVIDIA 現在US のみリリース

8 SL390s G7 2U nodes,
18 intel Xeon Processor $99
24 Tesla M2070s

これ以外にファブリックスイッチも提供している。

===
HP Z800+C2050 大特価キャンペーン

限定50台  294,000円〜

2枚目増設 144,900円〜

E5647 , RAM 2GB  × 3, SATA 250GB HDD, 80PLUS SILVER電源

// 引き続き午後のセッションも受講しますが、電源難民です。

以上

斉藤之雄 (Yukio Saito): Global Information and Communication Technology OTAKU / Sports volunteer / Social Services / Master of Technology in Innovation for Design and Engineering, AIIT / BA, Social Welfare, NFU / twitter@yukio_saitoh

This website uses cookies.