CUDA C プロフェッショナル プログラミング

CUDA C プロフェッショナル プログラミング

¥5,000+税

品種名
書籍
発売日
2015/9/24
ページ数
584
サイズ
B5変形判
著者
John Cheng 著/Max Grossman 著/Ty McKercher 著/株式会社クイープ 訳/森野 慎也 監訳
ISBN
9784844338918

CUDA Cの手法を本格的に学ぶ!

CUDA Cプログラミングを実践するための技術解説書。CUDAは、CPUとGPU(グラフィックス処理ユニット)が協調して並列処理を行うプログラムの開発・実行環境。本書では、CUDAプログラミングモデルから始め、カーネルレベルとグリッドレベルの並列化手法を解説しています。さらには、GPUスループットの計測、CUDAアプリケーションへの効率的な移植、マルチGPUプログラミングなども説明。CUDA Cプログラミングを本格的に理解して、プログラムの実行速度を最適化するための格好の一冊です。(本書は『Professional CUDA C Programming』の翻訳書)

「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。

アンケートに答える

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

学校・法人一括購入に関するお問い合わせはこちらへ。

一括購入窓口

詳細

著者プロフィール

John Cheng(ジョン・チェン)

ヘテロジニアス・コンピューティング・プラットフォーム上でのハイパフォーマンス・コンピューティングにおいて豊富な業界経験を持つ研究者。計算知能の専門家として10年以上金融業界で働き、遺伝的アルゴリズムにデータマイニングや統計学習を掛け合わせた先進的なソリューションを提供していた。現在は、エネルギー産業に関わっている。東京工業大学で計算知能分野の博士号を取得。

Max Grossman(マックス・グロスマン)

医療画像システムや機械学習、地球物理学でCUDAの適用経験があるGPUコンピューティングの専門家。

Ty McKercher(タイ・マッカーチャー)

2008年からNVIDIA社に勤務し、GPUアクセラレーション技術のユーザーサポートを行っている。

翻訳者プロフィール

株式会社クイープ

1995年、米国サンフランシスコに設立。コンピュータシステムの開発、ローカライズ、コンサルティングを手がけている。2001年に日本法人を設立。主な訳書に、『Scala関数型デザイン&プログラミング—Scalazコントリビューターによる関数型徹底ガイド』『IT技術者なら知っておきたいストレージの原則と技術』、『Smashing Android UI』などがある(いずれもインプレス発行)。http://www.quipu.co.jp

監訳者プロフィール

森野慎也(もりの しんや)

2013年よりNVIDIAでCUDA担当のシニアソリューションアーキテクトとして勤務。NVIDIA入社前から、CUDAに関する講演・トレーニングに携わる。NVIDIAでもCUDAにおける教育活動、開発支援など、CUDAを広く利用していただくための活動に従事。本書では、監訳のほか、4、5、6、7、10章の日本語版コラムの執筆を担当。

成瀬彰(なるせ あきら)

2013年よりNVIDIAでシニアデベロッパーテクノロジーエンジニアとして勤務。CUDAやOpenACCによるGPUコンピューティングの専門家。HPC分野をはじめとする、さまざまな分野のアプリケーションのGPU向け最適化を担当している。本書では、監訳のほか、1、2章の日本語版コラムの執筆を担当。

目次

第1章 CUDA によるヘテロジニアス並列コンピューティング
第2章 CUDAプログラミングモデル
第3章 CUDAの実行モデル
第4章 グローバルメモリ
第5章 シェアードメモリとコンスタントメモリ
第6章 ストリームと並列処理
第7章 命令レベルのプリミティブの調整
第8章 CUDAのGPUアクセラレーションライブラリとOpenACC
第9章 マルチGPUプログラミング
第10章 実装上の注意点

関連書籍

好評発売中

Docker実践ガイド第2版

IT現場で役立つ、Dockerの導入、運用ノウハウを凝縮

好評発売中

いちばんやさしいGit&GitHubの教本 人気講師が教えるバージョン管理&共有入門

好評発売中

サルでもわかるGit入門

Git入門の決定版「サルGit」がついに書籍化!

好評発売中

GitLab実践ガイド

GitLabで構築するDevOpsワークフロー

ダウンロード

  • 原著のサンプルコードは、下記ファイルのリンクよりダウンロードできます。

     
     
    各章の練習問題に対する解答は、上記の原著ページから入手できるSolutions.zipにまとめられています。
     
    また、日本語版の制作時に検証した結果として、以下のリンクよりサンプルコードをダウンロードすることができます。原著のサンプルコードとともにご参照ください。
     
    ●日本語版のサンプルでは、ソースファイルを変更した場合、元(原著)のコードファイルには.orgという拡張子を付けています。
     
    ●原著とは異なるヘッダーファイルを使って動作を確認した場合があり、その際に使用したヘッダーファイルとしてcommon_vc.hが含まれています。 
     
     

お詫びと訂正

誤記のためにご迷惑をおかけし、誠に申し訳ございません。

  • 12ページ 「表 1-1:Fermi と Kepler」の「FERMI(TESLA.C2050)」の「メモリ」
    • [誤]
      6GB
    • [正]
      3GB
  • 12ページ 1.2.1項の「[日本語版コラム]GPUアーキテクチャの進化」の表。「Fermi(TESLA C2050)」の「メモリ容量」
    • [誤]
      6GB
    • [正]
      3GB
  • 224ページ 表4-13のキャプション(4.5節タイトルの直前)
    • [誤]
      表4-13:L1キャッシュを無効にした状態でのカーネルの実質的な帯域幅
    • [正]
      表4-13:L1キャッシュを有効にした状態でのカーネルの実質的な帯域幅
  • 314ページ 図6-1の下の本文6行目
    • [誤]
      図6-1では、1つ目ストリームでの
    • [正]
      図6-1では、1つ目のストリームでの
    • 備考:

       ※ 電子書籍のリフローレイアウトでは修正済み。

  • 337ページ 上から2つ目のコード(網掛け部分)下にある本文1行目の末尾
    • [誤]
      ディパッチ
    • [正]
      ディスパッチ
    • 備考:

      ※ 電子書籍のリフローレイアウトでは修正済み。

  • 412ページ 412ページ最初のコマンド(8.6.1項末尾、下から数えて4つ目のコマンド)
    • [誤]
      $ env LD_PRELOAD=libnvlas.so ./app
    • [正]
      $ env LD_PRELOAD=libnvblas.so ./app
  • 503ページ ページの上から2つ目のコードブロック(「■レジスタスピル」の本文「次に、以下の比率を計算します。」直下のコードブロック)。このコードブロックの4行目。
    • [誤]
      1_local_store_hit
    • [正]
      l1_local_store_hit
  • 526ページ ページ末尾のリストの下から7行目(コマンド)
    • [誤]
      $ ./crypt encypt data data2 key
    • [正]
      $ ./crypt encrypt data data2 key
    • 備考:

       ※ 電子書籍のリフローレイアウトでは修正済み。

お問い合わせ

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

お問い合わせフォーム