Rではじめる機械学習 データサイズを抑えて軽量な環境で攻略法を探る
3,960円(本体 3,600円+税10%)
- 品種名
- 書籍
- 発売日
- 2017/9/8
- ページ数
- 344
- サイズ
- B5変形判
- 著者
- 長橋 賢吾 著
- ISBN
- 9784295002055
手軽なR環境で機械学習を試そう!
機械学習の考え方とRの活用をわかりやすく解説!―Rは統計解析のためのプログラミング言語・開発環境であり、機械学習で利用できるライブラリが数多く提供されています。先進IT企業では、あるモデルでうまく動作するかを判断するため、Rでプロトタイプを作成・確認するというケースもあります。本書ではまず、機械学習の考え方や、その基礎となる統計をわかりやすく説明。それを踏まえて、代表的な機械学習の理論を押さえながら、Rのさまざまな活用法を解説します。本書を読んで、Rによる機械学習の試行や検証を始めてみましょう。
「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。
学校・法人一括購入に関するお問い合わせはこちらへ。
詳細
著者プロフィール
慶應義塾大学環境情報学部卒業。同大学院政策・メディア研究科修了、2005年東京大学大学院情報理工学研究科修了。博士(情報理工学)。
英国ケンブリッジ大学コンピュータ研究所訪問研究員を経て、2006年日興シティグループ証券(現シティグループ証券)にてITサービス・ソフトウェア担当の証券アナリストとして勤務したのち、2009年3月にフューチャーブリッジパートナーズ株式会社を設立。
経営の視点から、企業戦略の策定、経営管理、IR支援、M&A、資金調達、データ活用を実施する。
2014年12月より株式会社インプレスと共同で「データサイエンス基礎講座」を開催。広い視点でわかりやすい講習指導をモットーとし、どの回も満席の好評を得る。
共著に「使って学ぶIPv6」(アスキー、2002年4月)、著書に「これならわかるネットワーク―インターネットはなぜつながるのか?(ブルーバックス)」(講談社、2008年5月)、「図解入門 ビジネス最新ネット企業の新技術と戦略がよ~くわかる本」(秀和システム、2011年9月)、「ビッグデータ戦略」(秀和システム、2012年3月)、「図解スマートフォンビジネスモデル」(秀和システム、2012年9月)。「システム開発は絶滅危惧業種になってしまうのか? アジャイル的50の生き残り術」(秀和システム、2014年5月)、「図解入門ビジネス FinTechの基本と仕組みがよ~くわかる本」(秀和システム、2016年12月)などがある。
目次
◆第1章 Rと機械学習の基礎
1-1 機械学習とは何か?
1-2 Rとは何か?
1-3 Rのインストールと利用前の設定
1-4 Rの基本的な利用方法
1-5 Rを使った統計量とデータの把握
コラム 統計本を読む3つのコツ
◆第2章 回帰分析で目的変数の値や発生確率を予測
2-1 単回帰分析
2-2 重回帰分析
2-3 ロジスティック回帰分析
2-4 ポアソン回帰
コラム 回帰分析の実際のビジネスへの応用
◆第3章 クラスタリング分析の3つの手法でデータを分類
3-1 クラスタリングの3つの手法
3-2 階層化クラスタリング
3-3 非階層化クラスタリングとk平均法
3-4 モデルベースクラスタリング
コラム クラスタリングの応用
◆第4章 主成分分析・因子分析で属性を削減し因子を特定
4-1 主成分分析とは?
4-2 因子分析
コラム 主成分分析とフランス印象派
◆第5章 アソシエーション分析で関連性がある物事を見極める
5-1 アソシエーション分析に使われるアソシエーション・ルールとは
5-2 arulesによるアソシエーション分析
コラム アソシエーション分析の応用
◆第6章 サポートベクターマシンでクラス分類
6-1 線引きによるクラス分類
6-2 カーネル法
6-3 サポートベクターマシンによる機械学習
コラム 1クラスサポートベクターマシン
◆第7章 アンサンブル学習と正則化―モデルの組み合わせと過学習の解決
7-1 過学習とは?
7-2 正則化
7-3 アンサンブル学習
コラム ランダムフォレストのひと手間─254
◆第8章 ベイズ推定とMCMC―事後確率や状態確率を求める
8-1 ベイズ推定と主観確率
8-2 MCMCの導入
8-3 Stanを利用したベイズ推定
コラム ネットと相性が良いベイズ推定─284
◆第9章 ニューラルネットワークとディープラーニング
9-1 ニューラルネットとは?
9-2 ディープラーニングとニューラルネットワークの手法
コラム 畳み込みニューラルネットワーク
関連書籍
ダウンロード
-
サンプルのコードやデータは、下記URLにて公開しています。
動作確認は、Windows 8.1にインストールしたR 3.4.0で行っています。
お詫びと訂正
誤記のためにご迷惑をおかけし、誠に申し訳ございません。
- 26ページ 1-5-4項の3段落目の最後の文
- [誤]
その確率分布は、平均を頂点として、標準偏差±1σの範囲に95%の範囲内(95%の信頼区間)で収まります。 - [正]
その確率分布は、平均を頂点として、標準偏差±2σの範囲に95%の範囲内(95%の信頼区間)で収まります。
- [誤]
- 46ページ 2-1-2項のcor.test関数の実行例。上から3つ目のコメントの一部を削除
- [誤]
# 2x2のグラフを出力 最後に”;”をつける - [正]
# 2x2のグラフを出力
- [誤]
- 192ページ 6.2.2節のコード。コードの中ほど。
- [誤]
sigma1 = (2*1.5)^2
sigma2 =(2*5)^2 - [正]
sigma1 = 2*(1.5^2)
sigma2 = 2*(5^2)
- [誤]
- 232ページ 本文1行目
- [誤]
縦軸はエラー率ならびに木の数であり、横軸はcp(ジニ不純度)です。 - [正]
縦軸はエラー率であり、上の横軸は木の数で、下の横軸はcp(ジニ不純度)です。
- [誤]
お問い合わせ
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。