[IT]　NVIDIA CUDA Toolkit v4.1 RC2 案内を訳してみた。

投稿者斉藤之雄 (Yukio Saito) 2011年12月16日

[IT]　NVIDIA CUDA Toolkit v4.1 RC2 案内を訳してみた。

自分用にしておくより、関心を持つ方に共有できたら素敵だなと思い公開します。登録開発者の方も、そうでない方も最新の情報はキャッチアップしておきたいですよね。カッコ内は私の所感です。（開発経験ない方はそのまま読み飛ばしてください）

[amazon_enhanced asin=”4862461336″ container=”” container_class=”” price=”All” background_color=”FFFFFF” link_color=”000000″ text_color=”0000FF” /] [amazon_enhanced asin=”4906608000″ container=”” container_class=”” price=”All” background_color=”FFFFFF” link_color=”000000″ text_color=”0000FF” /] [amazon_enhanced asin=”484432814X” container=”” container_class=”” price=”All” background_color=”FFFFFF” link_color=”000000″ text_color=”0000FF” /] [amazon_enhanced asin=”B003114OTS” container=”” container_class=”” price=”All” background_color=”FFFFFF” link_color=”000000″ text_color=”0000FF” /]

＝＝＝

原文：http://developer.nvidia.com/cuda-toolkit-41

このリリースは新しいLLVMベースのCUDAコンパイラ、1,000以上の新しい画像処理機能、および自動化されたパフォーマンス分析と統合されたエキスパートガイドラインで再設計されたビジュアルプロファイラが含まれています。（Low Level Virtual Machine / 言語非依存環境なので、本当に素晴らしい設計思想です）

我々は、CUDA登録開発者のフィードバックフォームを通じて、このリリースであなたの経験（良し悪し）を聞くのを楽しみにしている。　→　CUDA Registered Developer Program .

リリースハイライト

新しいコンパイラを試しませう！

新しいLLVMベースのコンパイラは、多くのアプリケーションで10%の高速化を提供します

GPUアクセラレーションライブラリを使用して新しく＆改良された”ドロップイン”アクセラレーション

NVIDIA Performance Primitivesライブラリ (NPP) で1,000以上の画像処理機能
最大6コアのCPU上でMKLより10倍以上高速化した新しいcuSPARSE三角対象ソルバー
MRG32k3aとメルセンヌツイスタ乱数（MTGP11213）RNGアルゴリズムのためのcuRANDを新サポート
現在CUDA標準のMathライブラリでサポートされているベッセル関数
ELLハイブリッド形式を使ってより高速な疎行列とベクトルの乗算を2倍以上高速化
より詳しい情報は素晴らしい　GPU-Accelerated Libraries　をご覧ください

強化＆再設計された開発者向けツール

自動化されたパフォーマンス分析およびエキスパートガイダンスで再設計されたビジュアルプロファイラ
デバイスコードでルチコンテキストデバッグと assert() のためのCUDA_GDBをサポート
CUDA-memcheckは、現在のデバイスのコードに割り当てられたメモリ境界のアクセスを検出
Parallel Nsight 2.1 CUDA warpは、CUDA全体warpの変数と式を縦断し視覚化
Parallel Nsight 2.1 CUDAプロファイラは、現在のカーネルメモリの活動、実行ストールとインストラクションのスループットを解析
GPUの開発者のためのより詳しいデバッギングとパフォーマン解析デバッグツールの詳細はこちら CUDA Tools and Ecosystem Summary Page

高度なプログラミング機能

デバイスコードから3Dサーフェス（３次元面）とキューブマップへのアクセス
システムメモリの強化されたコピー無し固定化（これまでメモリコピーにはピン留めするようなイメージがあったと思います、それが不要になったというか）と、cudaHostRegister(）配置とサイズ制限がなくなった
プロセス間のピアツーピア通信
nvidia-SMIに、システムリブートせずにGPUをリセットするためのサポート（これ便利だね）

新しい＆改良されたSDKのコードサンプル

simpleP2Pサンプルは現在、どのようなFermi （アーキテクチャ）GPUとのピアツーピア通信をサポートする。
新しいgrabcutNPPサンプルは、グラフ分割の反復処理を用いたインタラクティブな前景抽出を描画する。
オプティカルフロー（視覚表現）のためのホーンシャンク(Horn-Schunck)メソッドを実装する新しいサンプルは、ボリュームフィルタリングを演算し、キューブマップテクスチャを読み込む。

＝＝＝

イケて無い訳ですが、CUDA 4.0 開発経験なさってる方や、現在 CUDA 3.2 や 4.0 を学習なさってる方であればキャッチアップできようにしました。

以上

関連

投稿者斉藤之雄 (Yukio Saito)

Global Information and Communication Technology OTAKU / Sports volunteer / Social Services / Master of Technology in Innovation for Design and Engineering, AIIT / BA, Social Welfare, NFU / twitter@yukio_saitoh

Written by 斉藤之雄
・世界最大の ICT ディストリビュータでシニアプリセールスコンサルタント（マルチクラウドで Data and AI 領域に強みあり）
・東京オリンピックフィールドキャスト (MED/FR)
・東京パラリンピックマラソンコースサポートリーダー
・社会福祉士（免許登録済み）
・東京都登録公認障がい者スポーツ指導員
・東京都中野区スポーツ推進委員（非常勤公務員）
・AWS認定ソリューションアーキテクトアソシエイト (2021-2024)

■Microsoft MCP 取得歴
・AZ-700(Mar/2022)★★
・MS-720 (Feb/2022)★★
・AZ-204 (Feb/2022)★★
・DA-100 (Dec/2021)★★
・Azure DevOps Engineer Expert (Dec/2021) ★★★
・AZ-400 (Dec/2021)★★★
・AZ-600 (Dec/2021)★★
・PL-200 (Oct/2021)★★
・AZ-140 (Oct/2021)★★
・SC-300 (Oct/2021)★★
・AZ-104 (Sep/2021)★★
・Azure Solutions Architect Expert (Sep/2021) ★★★
・AZ-304 (Sep/2021) ★★★
・MB-920 (Sep/2021) ★
・AZ-303 (Aug/2021) ★★★
・MS-900 (Aug/2021) ★
・SC-900 (Jul/2021) ★
・PL-900 (Jul/2021) ★
・AI-102 (Jul/2021) ★★
・DP-900 (Jun/2021) ★
・MB-901 (Jun/2021) ★
・AI-900 (May/2021) ★
・AZ-900 (Apr/2021) ★
—
■所属学会
・日本ロボット学会
・人工知能学会
・計測自動制御学会
・日本生産性本部（個人賛助会員）
—
■将来実現したいこと（Social Action）
・障害者（手帳保有に関係なく）の就労支援
・気づき難い大人の学習障害者に対する就労支援
・日本語を母国語としない方への就労支援
・成長あり共生社会
—
自宅メインマシン IdeaPad Gaming 3 シリーズ

—

[IT]　NVIDIA CUDA Toolkit v4.1 RC2 案内を訳してみた。

[IT]　NVIDIA CUDA Toolkit v4.1 RC2 案内を訳してみた。

リリースハイライト

関連

投稿者斉藤之雄 (Yukio Saito)

関連投稿

見逃しています

[受講メモ] NVIDIA GTC 2024

[資格取得] IBM Cloud for Professional Architect v6 (合格体験談）

[ICT] Lenovo IdeaPad Gaming 370 RAM 64GB 環境

[Stable-Diffusion-webui] NVIDIA GPU を持たない安価 NotePC (Windows 11)で簡単に動かす方法

[IT] NVIDIA CUDA Toolkit v4.1 RC2 案内を訳してみた。

リリースハイライ​​ト

関連

投稿者 斉藤之雄 (Yukio Saito)

関連投稿

見逃しています

[IT]　NVIDIA CUDA Toolkit v4.1 RC2 案内を訳してみた。

リリースハイライト

投稿者斉藤之雄 (Yukio Saito)