CUDA C プロフェッショナル プログラミング
5,500円(本体 5,000円+税10%)
- 品種名
- 書籍
- 発売日
- 2015/9/24
- ページ数
- 584
- サイズ
- B5変形判
- 著者
- John Cheng 著/Max Grossman 著/Ty McKercher 著/株式会社クイープ 訳/森野 慎也 監訳
- ISBN
- 9784844338918
CUDA Cの手法を本格的に学ぶ!
CUDA Cプログラミングを実践するための技術解説書。CUDAは、CPUとGPU(グラフィックス処理ユニット)が協調して並列処理を行うプログラムの開発・実行環境。本書では、CUDAプログラミングモデルから始め、カーネルレベルとグリッドレベルの並列化手法を解説しています。さらには、GPUスループットの計測、CUDAアプリケーションへの効率的な移植、マルチGPUプログラミングなども説明。CUDA Cプログラミングを本格的に理解して、プログラムの実行速度を最適化するための格好の一冊です。(本書は『Professional CUDA C Programming』の翻訳書)
「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。
学校・法人一括購入に関するお問い合わせはこちらへ。
詳細
著者プロフィール
John Cheng(ジョン・チェン)
ヘテロジニアス・コンピューティング・プラットフォーム上でのハイパフォーマンス・コンピューティングにおいて豊富な業界経験を持つ研究者。計算知能の専門家として10年以上金融業界で働き、遺伝的アルゴリズムにデータマイニングや統計学習を掛け合わせた先進的なソリューションを提供していた。現在は、エネルギー産業に関わっている。東京工業大学で計算知能分野の博士号を取得。
Max Grossman(マックス・グロスマン)
医療画像システムや機械学習、地球物理学でCUDAの適用経験があるGPUコンピューティングの専門家。
Ty McKercher(タイ・マッカーチャー)
2008年からNVIDIA社に勤務し、GPUアクセラレーション技術のユーザーサポートを行っている。
翻訳者プロフィール
株式会社クイープ
1995年、米国サンフランシスコに設立。コンピュータシステムの開発、ローカライズ、コンサルティングを手がけている。2001年に日本法人を設立。主な訳書に、『Scala関数型デザイン&プログラミング—Scalazコントリビューターによる関数型徹底ガイド』『IT技術者なら知っておきたいストレージの原則と技術』、『Smashing Android UI』などがある(いずれもインプレス発行)。http://www.quipu.co.jp
監訳者プロフィール
森野慎也(もりの しんや)
2013年よりNVIDIAでCUDA担当のシニアソリューションアーキテクトとして勤務。NVIDIA入社前から、CUDAに関する講演・トレーニングに携わる。NVIDIAでもCUDAにおける教育活動、開発支援など、CUDAを広く利用していただくための活動に従事。本書では、監訳のほか、4、5、6、7、10章の日本語版コラムの執筆を担当。
成瀬彰(なるせ あきら)
2013年よりNVIDIAでシニアデベロッパーテクノロジーエンジニアとして勤務。CUDAやOpenACCによるGPUコンピューティングの専門家。HPC分野をはじめとする、さまざまな分野のアプリケーションのGPU向け最適化を担当している。本書では、監訳のほか、1、2章の日本語版コラムの執筆を担当。
目次
第1章 CUDA によるヘテロジニアス並列コンピューティング
第2章 CUDAプログラミングモデル
第3章 CUDAの実行モデル
第4章 グローバルメモリ
第5章 シェアードメモリとコンスタントメモリ
第6章 ストリームと並列処理
第7章 命令レベルのプリミティブの調整
第8章 CUDAのGPUアクセラレーションライブラリとOpenACC
第9章 マルチGPUプログラミング
第10章 実装上の注意点
関連書籍
ダウンロード
-
原著のサンプルコードのリンクは、下記URLのページ内の「DOWNLOADS」欄に表示されています。
各章の練習問題に対する解答は、上記の原著ページから入手できるSolutions.zipにまとめられています。また、日本語版の制作時に検証した結果として、以下のリンクよりサンプルコードをダウンロードすることができます。原著のサンプルコードとともにご参照ください。●日本語版のサンプルでは、ソースファイルを変更した場合、元(原著)のコードファイルには.orgという拡張子を付けています。●原著とは異なるヘッダーファイルを使って動作を確認した場合があり、その際に使用したヘッダーファイルとしてcommon_vc.hが含まれています。
お詫びと訂正
誤記のためにご迷惑をおかけし、誠に申し訳ございません。
- 0ページ xiページ。ソースコード等の入手先URLについて( サイトの変更のため)
- [誤]
http://book.impress.co.jp/books/1115101001_4 - [正]
http://book.impress.co.jp/books/1115101001 -
備考:
現在ブラウザに表示されているWebページの「ダウンロード」についてご覧ください。
- [誤]
- 12ページ 「表 1-1:Fermi と Kepler」の「FERMI(TESLA.C2050)」の「メモリ」
- [誤]
6GB - [正]
3GB
- [誤]
- 12ページ 1.2.1項の「[日本語版コラム]GPUアーキテクチャの進化」の表。「Fermi(TESLA C2050)」の「メモリ容量」
- [誤]
6GB - [正]
3GB
- [誤]
- 224ページ 表4-13のキャプション(4.5節タイトルの直前)
- [誤]
表4-13:L1キャッシュを無効にした状態でのカーネルの実質的な帯域幅 - [正]
表4-13:L1キャッシュを有効にした状態でのカーネルの実質的な帯域幅
- [誤]
- 314ページ 図6-1の下の本文6行目
- [誤]
図6-1では、1つ目ストリームでの - [正]
図6-1では、1つ目のストリームでの -
備考:
※ 電子書籍のリフローレイアウトでは修正済み。
- [誤]
- 337ページ 上から2つ目のコード(網掛け部分)下にある本文1行目の末尾
- [誤]
ディパッチ - [正]
ディスパッチ -
備考:
※ 電子書籍のリフローレイアウトでは修正済み。
- [誤]
- 412ページ 412ページ最初のコマンド(8.6.1項末尾、下から数えて4つ目のコマンド)
- [誤]
$ env LD_PRELOAD=libnvlas.so ./app - [正]
$ env LD_PRELOAD=libnvblas.so ./app
- [誤]
- 503ページ ページの上から2つ目のコードブロック(「■レジスタスピル」の本文「次に、以下の比率を計算します。」直下のコードブロック)。このコードブロックの4行目。
- [誤]
1_local_store_hit - [正]
l1_local_store_hit
- [誤]
- 526ページ ページ末尾のリストの下から7行目(コマンド)
- [誤]
$ ./crypt encypt data data2 key - [正]
$ ./crypt encrypt data data2 key -
備考:
※ 電子書籍のリフローレイアウトでは修正済み。
- [誤]
お問い合わせ
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。