CUDA C プロフェッショナルプログラミング

トップページ
プログラミング
設計・開発技法
CUDA C プロフェッショナルプログラミング

CUDA C プロフェッショナルプログラミング

5,500円（本体 5,000円＋税10%）

品種名: 書籍
発売日: 2015/9/24
ページ数: 584
サイズ: B5変形判
著者: John Cheng　著/Max Grossman　著/Ty McKercher　著/株式会社クイープ　訳/森野慎也　監訳
ISBN: 9784844338918

試し読み
ダウンロード

CUDA Cの手法を本格的に学ぶ！

CUDA Cプログラミングを実践するための技術解説書。CUDAは、CPUとGPU（グラフィックス処理ユニット）が協調して並列処理を行うプログラムの開発・実行環境。本書では、CUDAプログラミングモデルから始め、カーネルレベルとグリッドレベルの並列化手法を解説しています。さらには、GPUスループットの計測、CUDAアプリケーションへの効率的な移植、マルチGPUプログラミングなども説明。CUDA Cプログラミングを本格的に理解して、プログラムの実行速度を最適化するための格好の一冊です。（本書は『Professional CUDA C Programming』の翻訳書）

目次を見る

紙の本を買う

「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。

アンケートに答える

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

お問い合わせフォーム

お詫びと訂正

学校・法人一括購入に関するお問い合わせはこちらへ。

一括購入窓口

詳細

著者プロフィール

John Cheng（ジョン・チェン）

ヘテロジニアス・コンピューティング・プラットフォーム上でのハイパフォーマンス・コンピューティングにおいて豊富な業界経験を持つ研究者。計算知能の専門家として10年以上金融業界で働き、遺伝的アルゴリズムにデータマイニングや統計学習を掛け合わせた先進的なソリューションを提供していた。現在は、エネルギー産業に関わっている。東京工業大学で計算知能分野の博士号を取得。

Max Grossman（マックス・グロスマン）

医療画像システムや機械学習、地球物理学でCUDAの適用経験があるGPUコンピューティングの専門家。

Ty McKercher（タイ・マッカーチャー）

2008年からNVIDIA社に勤務し、GPUアクセラレーション技術のユーザーサポートを行っている。

翻訳者プロフィール

株式会社クイープ

1995年、米国サンフランシスコに設立。コンピュータシステムの開発、ローカライズ、コンサルティングを手がけている。2001年に日本法人を設立。主な訳書に、『Scala関数型デザイン&プログラミング—Scalazコントリビューターによる関数型徹底ガイド』『IT技術者なら知っておきたいストレージの原則と技術』、『Smashing Android UI』などがある（いずれもインプレス発行）。http://www.quipu.co.jp

監訳者プロフィール

森野慎也（もりのしんや）

2013年よりNVIDIAでCUDA担当のシニアソリューションアーキテクトとして勤務。NVIDIA入社前から、CUDAに関する講演・トレーニングに携わる。NVIDIAでもCUDAにおける教育活動、開発支援など、CUDAを広く利用していただくための活動に従事。本書では、監訳のほか、4、5、6、7、10章の日本語版コラムの執筆を担当。

成瀬彰（なるせあきら）

2013年よりNVIDIAでシニアデベロッパーテクノロジーエンジニアとして勤務。CUDAやOpenACCによるGPUコンピューティングの専門家。HPC分野をはじめとする、さまざまな分野のアプリケーションのGPU向け最適化を担当している。本書では、監訳のほか、1、2章の日本語版コラムの執筆を担当。

第1章　CUDA によるヘテロジニアス並列コンピューティング
第2章　CUDAプログラミングモデル
第3章　CUDAの実行モデル
第4章　グローバルメモリ
第5章　シェアードメモリとコンスタントメモリ
第6章　ストリームと並列処理
第7章　命令レベルのプリミティブの調整
第8章　CUDAのGPUアクセラレーションライブラリとOpenACC
第9章　マルチGPUプログラミング
第10章　実装上の注意点

ダウンロード

原著のサンプルコードのリンクは、下記URLのページ内の「DOWNLOADS」欄に表示されています。

>> 原著のサンプルダウンロードページ

各章の練習問題に対する解答は、上記の原著ページから入手できるSolutions.zipにまとめられています。

また、日本語版の制作時に検証した結果として、以下のリンクよりサンプルコードをダウンロードすることができます。原著のサンプルコードとともにご参照ください。

●日本語版のサンプルでは、ソースファイルを変更した場合、元（原著）のコードファイルには.orgという拡張子を付けています。

●原著とは異なるヘッダーファイルを使って動作を確認した場合があり、その際に使用したヘッダーファイルとしてcommon_vc.hが含まれています。
- CUDA_C_J_Samples.zip

お詫びと訂正

誤記のためにご迷惑をおかけし、誠に申し訳ございません。

0ページ xiページ。ソースコード等の入手先URLについて（サイトの変更のため）
- [誤]
  http://book.impress.co.jp/books/1115101001_4
- [正]
  http://book.impress.co.jp/books/1115101001
- 備考：
  現在ブラウザに表示されているWebページの「ダウンロード」についてご覧ください。
12ページ「表 1-1：Fermi と Kepler」の「FERMI（TESLA.C2050）」の「メモリ」
- [誤]
  6GB
- [正]
  3GB
12ページ 1.2.1項の「［日本語版コラム］GPUアーキテクチャの進化」の表。「Fermi（TESLA C2050）」の「メモリ容量」
- [誤]
  6GB
- [正]
  3GB
224ページ表4-13のキャプション（4.5節タイトルの直前）
- [誤]
  表4-13：L1キャッシュを無効にした状態でのカーネルの実質的な帯域幅
- [正]
  表4-13：L1キャッシュを有効にした状態でのカーネルの実質的な帯域幅
314ページ図6-1の下の本文6行目
- [誤]
  図6-1では、1つ目ストリームでの
- [正]
  図6-1では、1つ目のストリームでの
- 備考：
  ※ 電子書籍のリフローレイアウトでは修正済み。
337ページ上から2つ目のコード（網掛け部分）下にある本文1行目の末尾
- [誤]
  ディパッチ
- [正]
  ディスパッチ
- 備考：
  ※ 電子書籍のリフローレイアウトでは修正済み。
412ページ 412ページ最初のコマンド（8.6.1項末尾、下から数えて4つ目のコマンド）
- [誤]
  $ env LD_PRELOAD=libnvlas.so ./app
- [正]
  $ env LD_PRELOAD=libnvblas.so ./app
503ページページの上から2つ目のコードブロック（「■レジスタスピル」の本文「次に、以下の比率を計算します。」直下のコードブロック）。このコードブロックの4行目。
- [誤]
  1_local_store_hit
- [正]
  l1_local_store_hit
526ページページ末尾のリストの下から7行目（コマンド）
- [誤]
  $ ./crypt encypt data data2 key
- [正]
  $ ./crypt encrypt data data2 key
- 備考：
  ※ 電子書籍のリフローレイアウトでは修正済み。

お問い合わせ

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

お問い合わせフォーム