Machine Learning実践の極意 機械学習システム構築の勘所をつかむ!
3,740円(本体 3,400円+税10%)
- 品種名
- 書籍
- 発売日
- 2017/11/17
- ページ数
- 328
- サイズ
- B5変形判
- 著者
- Mark Fetherolf 著/株式会社クイープ 訳/Henrik Brink 著/Joseph W. Richards 著
先鋭が直伝!MLワークフローのノウハウ
本書の中心テーマは、理論や数式、コーディングではありません。機械学習(ML)ワークフローにおける作業の基礎と応用について解説します。本書の前半では、ビジネス上の機械学習の利点や課題のほか、データの収集/整備、モデルの構築/評価/最適化など、各作業の基本的な考え方を説明。後半は、実データによるケーススタディや予測スループットの改善、大容量データへの対応など、応用力の強化を目的に解説します。機械学習ワークフローの全容を見通したい方、改めて理解しておきたい方などにお勧めの一冊です。
- 紙の本を買う
-
「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。
学校・法人一括購入に関するお問い合わせはこちらへ。
著者紹介
■著者プロフィール
◎Henrik Brink(ヘンリク・ブリンク)
ビジネスとアカデミックの両方で機械学習の実装経験を幅広く積んだデータサイエンティスト兼ソフトウェア開発者。
◎Joseph W. Richards(ジョセフ・ウイリアム・リチャーズ)
応用統計学と予測分析を専門としているシニアデータサイエンティスト。
HenrikとJosephは、機械学習ソリューションを提供するwise.ioの開発リーダー兼共同創設者。
◎Mark Fetherolf(マーク・フェセロルフ)
データマネジメントと予測分析を手掛けるNuminary Data Scienceの創設者兼プレジデント。
以前は、統計学者および分析データベース開発者として、化学エンジニアリング、ケーブルテレビ、オンライン広告アプリなどさまざまな分野の企業に勤務。
■翻訳者
◎株式会社クイープ
1995年、米国サンフランシスコに設立。コンピュータシステムの開発、ローカライズ、コンサルティングを手がけている。2001年に日本法人を設立。
主な訳書に『TensorFlow機械学習クックブック Pythonベースの活用レシピ60+』『Python機械学習プログラミング 達人データサイエンティストによる理論と実践』『Scala関数型デザイン&プログラミング―Scalazコントリビューターによる関数型徹底ガイド』『CUDA Cプロフェッショナルプログラミング』などがある(いずれもインプレス発行)。
http://www.quipu.co.jp/
目次
◆PartI 機械学習ワークフローの基礎
◇第1章 機械学習とは何か―長所と課題、データ収集から運用までのステップ、性能の改善
機械学習の仕組みを理解する
データに基づく意思決定
機械学習ワークフロー:データから展開まで
高度な手法を使ってモデルの性能を改善する
まとめ
本章のキーワード
◇第2章 現実世界のデータ―データの取得/整備、可視化
機械学習に取り組むための準備:データの収集
機械学習モデルを構築するためのデータの前処理
データビジュアライゼーションの使用
まとめ
本章のキーワード
◇第3章 モデルの構築と予測
基本的な機械学習モデルの構築
分類:カテゴリを予測する
回帰:数値を予測する
まとめ
本章のキーワード
◇第4章 モデルの評価と最適化
モデルの汎化:新しいデータでの予測性能の評価
分類モデルの評価
回帰モデルの評価
チューニングパラメータによるモデルの最適化
まとめ
本章のキーワード
◇第5章 特徴エンジニアリングの基礎
特徴エンジニアリングはなぜ有効なのか
特徴エンジニアリングの基本的なプロセス
特徴選択
まとめ
本章のキーワード
◆PartII 機械学習ワークフローの応用
◇第6章 NYCタクシーデータのケーススタディ
New York City Taxi Trips/Faresデータ
モデルの構築
まとめ
本章のキーワード
◇第7章 高度な特徴エンジニアリング
高度なテキスト特徴量
画像特徴量
時系列特徴量
まとめ
本章のキーワード
◇第8章 高度な自然言語処理の例―映画レビューの感情分析
データとユースケースを調べる
基本的なNLP特徴量の抽出と最初のモデルの構築
高度なアルゴリズムとモデルを展開するときの注意点
まとめ
本章のキーワード
◇第9章 機械学習ワークフローのスケーリング
スケールアップする前に
機械学習モデル構築のスケーリング
予測値のスケーリング
まとめ
本章のキーワード
◇第10章 デジタルディスプレイ広告のケーススタディ
ディスプレイ広告
デジタル広告データ
特徴エンジニアリングとモデル構築戦略
データのサイズと形状
特異値分解(SVD)
リソースの推測と最適化
モデルの構築
実際の環境に導入するときの注意点
まとめ
本章のキーワード
本書のまとめ
◇付録 一般的な機械学習アルゴリズム一覧
関連書籍
ダウンロード
本製品の読者さまを対象としたダウンロード情報はありません。
お詫びと訂正
現在のところ、本製品に正誤情報はありません。
お問い合わせ
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。