Amazon Elastic MapReduceテクニカルガイド -クラウド型Hadoopで実現する大規模分散処理-
3,960円(本体 3,600円+税10%)
- 品種名
- 書籍
- 発売日
- 2012/2/23
- ページ数
- 304P
- サイズ
- B5変型判
- 著者
- 李 昌桓
- ISBN
- 9784844331490
ビッグデータの解析をオンデマンドで実行! AWSクラウドで手軽にはじめる分散処理
オープンソースの大規模分散処理フレームワークとして注目されているHadoopを、オンプレミスではなくクラウドサービスを通じて実現するAmazon Elastic MapReduce(Amazon EMR)に関する専門書籍。Amazon EC2やS3との組み合わせによって無限の可能性を持つ、Amazon EMRを極めるための一冊です。
「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。
学校・法人一括購入に関するお問い合わせはこちらへ。
詳細
■ページイメージ
■著者プロフィール
■著者プロフィール
李 昌桓(CHANGHWAN LEE) 1990年、韓国、泰昌鉄鋼株式会社入社、生産管理システム開発などを手がける。1998年来日、情報系システム開発のシステムエンジニア、大手通信キャリアでのデータウェアハウス構築、株式会社USENのシステム運用管理者など、情報システムの設計、開発、運用にわたるマルチスキルエンジニアとして活躍。現在は、クリエーションライン株式会社でアマゾンクラウドの研究および普及活動にあたっているほか、JAWS-UG(AWS User Group - Japan)のコアメンバー、一般社団法人クラウド利用促進機構(CUPA)のテクニカルアドバイザーとして活動している。 http://cloudbb.jp/ @awk256 |
目次
はじめに
Chapter 1 Amazon EMRの基礎
1.1. HadoopとMadReduce
1.2. Elastic MapReduceの概要
1.3. Elastic MapReduceの特徴
1.4. Elastic MapReduceのインフラ構成
1.5. ジョブフロー設計
Chapter 2 Amazon EMRの事前準備
2.1. AWSアカウント取得
2.2. Elastic MapReduceへのサインアップ
2.3. アクセス証明書の取得
2.4. Amazon EC2
2.5. Amazon S3
2.6. IAM(Identity and Access Management)
2.7. Amazon VPCの構築
2.8. AWSコンソール使用
2.9. Rubyコマンドラインインタフェース(CLI)
2.10. Elastic MapReduceのAMIバージョン
Chapter 3 Hiveデータウェアハウス:入門
3.1. Hvieジョブフローの概要
3.2. Hiveジョブフローの開始と終了
3.3. Hiveコンソールの使用
3.4. DDLの操作
3.5. DMLの操作
3.6. 特殊なデータ型の扱い
Chapter 4 Hiveデータウェアハウス:実践
4.1. ウォームアップ
4.2. パーティションテーブルの使用
4.3. クラスタテーブルの使用
4.4. SerDe
4.5. カスタムMapReduce
4.6. ステップ処理
Chapter 5 Pig/Streaming/その他
5.1. Pig
5.2. Hadoopストリーミング
5.3. Custom JAR/Cascading
5.4. ジョブフローでのスクリプト起動
5.5. Hive JDBC Driver
Chapter 6 Amazon EMRの運用
6.1. 事前準備
6.2. 稼動のモニタリング
6.3. ログとトラブルシューティング
6.4. 障害とリストア
6.5. その他の設定
Chapter 7 Amazon EMRの最適化
7.1. ブートストラップアクション
7.2. Hadoop環境構成のチューニング
7.3. Hive環境構成のチューニング
7.4. 動的なジョブフローのリサイズ
7.5. ジョブフローのメンテナンス
7.6. 自前のAPIツールの作成
7.7. 終わりに
参考資料
Chapter 1 Amazon EMRの基礎
1.1. HadoopとMadReduce
1.2. Elastic MapReduceの概要
1.3. Elastic MapReduceの特徴
1.4. Elastic MapReduceのインフラ構成
1.5. ジョブフロー設計
Chapter 2 Amazon EMRの事前準備
2.1. AWSアカウント取得
2.2. Elastic MapReduceへのサインアップ
2.3. アクセス証明書の取得
2.4. Amazon EC2
2.5. Amazon S3
2.6. IAM(Identity and Access Management)
2.7. Amazon VPCの構築
2.8. AWSコンソール使用
2.9. Rubyコマンドラインインタフェース(CLI)
2.10. Elastic MapReduceのAMIバージョン
Chapter 3 Hiveデータウェアハウス:入門
3.1. Hvieジョブフローの概要
3.2. Hiveジョブフローの開始と終了
3.3. Hiveコンソールの使用
3.4. DDLの操作
3.5. DMLの操作
3.6. 特殊なデータ型の扱い
Chapter 4 Hiveデータウェアハウス:実践
4.1. ウォームアップ
4.2. パーティションテーブルの使用
4.3. クラスタテーブルの使用
4.4. SerDe
4.5. カスタムMapReduce
4.6. ステップ処理
Chapter 5 Pig/Streaming/その他
5.1. Pig
5.2. Hadoopストリーミング
5.3. Custom JAR/Cascading
5.4. ジョブフローでのスクリプト起動
5.5. Hive JDBC Driver
Chapter 6 Amazon EMRの運用
6.1. 事前準備
6.2. 稼動のモニタリング
6.3. ログとトラブルシューティング
6.4. 障害とリストア
6.5. その他の設定
Chapter 7 Amazon EMRの最適化
7.1. ブートストラップアクション
7.2. Hadoop環境構成のチューニング
7.3. Hive環境構成のチューニング
7.4. 動的なジョブフローのリサイズ
7.5. ジョブフローのメンテナンス
7.6. 自前のAPIツールの作成
7.7. 終わりに
参考資料
関連書籍
ダウンロード
本製品の読者さまを対象としたダウンロード情報はありません。
お詫びと訂正
現在のところ、本製品に正誤情報はありません。
お問い合わせ
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。