スッキリわかるPythonによる機械学習入門
3,300円(本体 3,000円+税10%)
- 品種名
- 書籍
- 発売日
- 2020/10/16
- ページ数
- 664
- サイズ
- A5判
- 著者
- 須藤秋良 著/株式会社フレアリンク 監修
- ISBN
- 9784295009948
機械学習の実践力が必ず身に付く
機械学習の世界は、学ぶべき分野が多岐に及びます。本書は、広大な学習範囲に対して、真正面から取り組み、しかしスムーズかつスッキリと学びきることができる入門書です。データ分析の「全体の流れ」を繰り返し追いかけることで、機械学習の全体像と本質が自然に染み込む仕掛けとなっています。しかも単に繰り返すのではなく、段階的に高度な内容に挑戦し、最終的には応用術も身に付けられます。シリーズで好評の「エラー解決・虎の巻」も収録! 本書で機械学習の楽しさ、奥深さをじっくり学び、新しい未来への道を拓いてみませんか。
- 電子版を買う
-
「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。
学校・法人一括購入に関するお問い合わせはこちらへ。
詳細
[読者限定特典 シークレットスタンプ風イラスト画像の入手方法]
スッキリわかる入門シリーズ最新刊の各書籍ページで、中程にある「アンケートに答える」をクリックして、CLUB Impressにログイン後(未登録の場合は要会員登録)、読者登録画面ページで[読者アンケートに答える](赤いボタン)をクリックし、アンケートを進めて行きますと、回答内容確認後に特典のダウンロードページが表示されます。
※ダウンロードできるイラストは7冊共通の画像になります
※画像の著作権とご利用の際の注意点
- このイラスト画像の著作権は、作者である高田ゲンキ並びに株式会社インプレスに帰属します。
- このイラスト画像は、非商用に限り無料で利用できます。ただし、次の禁止事項を守ってご利用ください。
- 禁止事項:改変や販売、再配布、公序良俗に反する利用はすべて禁止とさせていただきます。
メディア掲載情報
2021/06/18:コムウェアプラス『デジタル人材のためのブックレビュー』にて紹介されました。
著者紹介
■著者
須藤秋良(すとう・あきよし)
株式会社フレアリンクCDSO(chief data science officer)。教育業界のデータ解析や医学研究の統計解析コンサルティングなどを行い、最近ではDjango やRailsを利用した機械学習Webアプリの開発といったエンジニア業務も務める。また、これら業務の知見を活かし、データサイエンス系セミナーの研修講師も務め、これまで担当した研修受講者は総数3000名を超える。著書は『スッキリわかるPython入門』。
■監修・執筆協力
中山清喬(なかやま・きよたか)
株式会社フレアリンク代表取締役。IBM内の先進技術部隊に所属しシステム構築現場を数多く支援。退職後も研究開発・技術適用支援・教育研修・執筆講演・コンサルティング等を通じ、「技術を味方につける経営」を支援。現役プログラマ。講義スタイルは「ふんわりスパルタ」。著書は『スッキリわかるJava入門』ほか多数。
飯田理恵子(いいだ・りえこ)
経営学部 情報管理学科卒。長年、大手金融グループの基幹系システムの開発と保守にSEとして携わる。現在は株式会社フレアリンクにて、ソフトウェア開発、コンテンツ制作、経営企画などを通して技術の伝達を支援中。著書は『スッキリわかるSQL入門』。
目次
第0章 Python基本文法の復習
●第Ⅰ部 ようこそ機械学習の世界へ
第1章 AIと機械学習
第2章 機械学習に必要な基礎統計学
第3章 機械学習によるデータ分析の流れ
第4章 機械学習の体験
●第Ⅱ部 教師あり学習の理解を深めよう
第5章 分類1:アヤメの判別
第6章 回帰1:映画の興行収入の予測
第7章 分類2:客船沈没事故での生存予測
第8章 回帰2:住宅の平均価格の予測
第9章 教師あり学習の総合演習
●第Ⅲ部 中級者への最初の1歩を踏み出そう
第10章 より実践的な前処理
第11章 さまざまな教師あり学習:回帰
第12章 さまざまな教師あり学習:分類
第13章 さまざまな予測性能評価
第14章 教師なし学習1:次元の削減
第15章 教師なし学習2:クラスタリング
第16章 まだまだ広がる機械学習の世界
付録A sukkiri.jpについて
付録B エラー解決・虎の巻
付録C Pandas虎の巻
付録D 機械学習の数学(基礎編)
付録E 最小2乗法の数学理論に挑戦
関連書籍
ダウンロード
-
著者サイト「スッキリjp」にて、本書で利用する「ツールの導入方法・使用方法」や、「掲載コード / CSVファイルのダウンロード」などの情報を掲載しています。
本書とあわせてご活用ください。
https://sukkiri.jp/books/sukkiri_ml
お詫びと訂正
誤記のためにご迷惑をおかけし、誠に申し訳ございません。
- 0ページ 【特記2】
- [誤]
※誤記ではありません - [正]
著者サイト「スッキリjp」で提供しているダウンロードデータに、15章で利用する「Wholesale.csv」を追加しました(2020年11月9日。ZIPファイル名:code-sml_2.zip)。URLは、上にある「ダウンロード」コーナーをご確認ください。
- [誤]
- 0ページ 【特記1】
- [誤]
※誤記ではありません。 - [正]
本書は、本書28ページに記載の通り、Pandasのバージョンを1.0.3として解説しています。
異なるバージョンでの利用につきましては、ネット検索等で該当バージョンの情報をお調べいただき、本文読み替えを行ってください。
- [誤]
- 17ページ 練習5-1 表の「機能」内
- [誤]
2)1の例外として、100で割り入れる年はうるう年ではない。 - [正]
2)1の例外として、100で割り切れる年はうるう年ではない。
- [誤]
- 115ページ コード4-18 5行目
- [誤]
model.predict(new) - [正]
model.predict(new_data) - 【 第2刷にて修正 】
- [誤]
- 120ページ 構文囲み
- [誤]
モデル.score(特徴量のデータ, 正解のデータ) - [正]
モデル変数.score(特徴量のデータ, 正解のデータ) - 【 第6刷にて修正 】
- [誤]
- 124ページ 「モデルの保存と読み込み」のopen関数の引数が保存と読み込みで逆
- [誤]
保存 →'rb' , 読み込み → 'wb' - [正]
保存 →'wb' , 読み込み → 'rb' - 【 第2刷にて修正 】
- [誤]
- 162ページ 「モデルの学習と正解率計算の落とし穴」の節番号
- [誤]
5-3-3 - [正]
5-3-4 - 【 第2刷にて修正 】
- [誤]
- 171ページ 図5-15 右 [tree_.featureの結果]の要素
- [誤]
3, -2, 2, -2, -2 - [正]
3, -2, 3, -2, -2 - 【 第2刷にて修正 】
- [誤]
- 184ページ 練習5-14 の解答 コード1行目
- [誤]
newdata = [[1.56, 0.23, -1.1, 2.8]] - [正]
newdata = [[1.56, 0.23, -1.1, -2.8]] - 【 第6刷にて修正 】
- [誤]
- 208ページ コード6-20 1行目
- [誤]
# 0行目以上2行目以下、 - [正]
# 0行目以上3行目以下、 - 【 第4刷にて修正 】
- [誤]
- 245ページ コード7-5の4行目の右辺
- [誤]
df['Embarked'].fillna(df['Embarked'].mode()) - [正]
df['Embarked'].fillna(df['Embarked'].mode()[0]) - 【 第2刷にて修正 】
- [誤]
- 255ページ コード7-12の2行目と3行目の変数名
- [誤]
2 print(df ['Age'].mean()) # 平均値の計算
3 print(df ['Age'].median()) # 中央値の計算 - [正]
2 print(df2['Age'].mean()) # 平均値の計算
3 print(df2['Age'].median()) # 中央値の計算 - 【 第2刷にて修正 】
- [誤]
- 260ページ コード7-17 5行目 7行目 11行目 13行目 17行目 19行目(計12箇所)
- [誤]
df['~'] - [正]
df2['~'] - 【 第4刷にて修正 】
- [誤]
- 267ページ コード7-23
- [誤]
pg.get_dummies(df['Sex']) - [正]
pd.get_dummies(df2['Sex'])
- 【 第6刷にて修正 】
- [誤]
- 277ページ 上から2つ目の吹き出し
- [誤]
Fare列(運賃)やPclass列(チケットクラス)も結構影響が大きいですね。 - [正]
Pclass列(チケットクラス)も結構影響が大きいですが、これってどうしてですかね?
- [誤]
- 279ページ 表の列名
- [誤]
Class
Dept_id
Sex
Score - [正]
class
dept_id
sex
score - 【 第6刷にて修正 】
- [誤]
- 279ページ 練習7-3 1行目
- [誤]
Class列 - [正]
class列 - 【 第6刷にて修正 】
- [誤]
- 280ページ 練習7-5 1・5・6行目
- [誤]
Dept_id列 - [正]
dept_id列 - 【 第6刷にて修正 】
- [誤]
- 300ページ コード8-12実行結果 6行(PRICE)、2列目(LSTAT)の値
- [誤]
0.325289 - [正]
-0.325289 - 【 第6刷にて修正 】
- [誤]
- 313ページ 3つの囲みのうち、一番上の囲み「データの標準化」内1行目と下の注意書き
- [誤]
変数1=Standardscaler()
:
※事前にfrom sklearn.preprocessing import Standardscalerでインポートしておく。 - [正]
変数1=StandardScaler()
:
※事前にfrom sklearn.preprocessing import StandardScalerでインポートしておく。
(※ScalerのSを大文字にする) - 【 第5刷にて修正 】
- [誤]
- 317ページ 工藤セリフ
- [誤]
目標はチューニング前の - [正]
目標はチューニング後の - 【 第6刷にて修正 】
- [誤]
- 321ページ 図8-11 3行目の「RM列の2乗」列
- [誤]
9(9の2乗) - [正]
9(3の2乗) - 【 第2刷にて修正 】
- [誤]
- 336ページ コード8-43 7行目
- [誤]
data = [1.0, -0.7] - [正]
data = [[1.0, -0.7]]
- [誤]
- 340ページ 本文1行目
- [誤]
スッキリ銀行の顧客データ「bank_new.csv」 - [正]
スッキリ銀行の顧客データ「Bank.csv」 - 【 第2刷にて修正 】
- [誤]
- 358ページ コード10-7 1、2行目の間に2行追加
- [誤]
1 df2 = df.merge(weather, how = 'inner', on = 'weather_id')
2 df2.head(2) - [正]
1 df2=df.merge(weather,how="inner",on="weather_id")
2 # 内部結合後は、行が順不同の可能性があるので並び替えを行う
3 df2 = df2.sort_values(by="dteday")
4 df2.head(2) - 【 第6刷にて修正 】
- [誤]
- 363ページ 本文下から3行目
- [誤]
正解データのcasual列や、 - [正]
正解データのcnt列や、 - 【 第4刷にて修正 】
- [誤]
- 366ページ コード10-15 2行目
- [誤]
2 df3['atemp'].loc[220:240].plot(kind='line') - [正]
2 df3['atemp'].loc[695:705].plot(kind='line') - 【 第6刷にて修正 】
- [誤]
- 366ページ コード10-15 【実行結果】のグラフ
- [誤]
下記のグラフに差し替え - [正]
-
- 【 第6刷にて修正 】
- [誤]
- 368ページ コード10-16の3行目の右辺
- [誤]
df['atemp'].interpolate() - [正]
df3['atemp'].interpolate() - 【 第2刷にて修正 】
- [誤]
- 368ページ コード10-16 5行目
- [誤]
5 df3.loc[225:235, "atemp"].plot(kind = 'line') - [正]
5 df3.loc[695:705, "atemp"].plot() - 【 第6刷にて修正 】
- [誤]
- 368ページ コード10-16 【実行結果】のグラフ
- [誤]
下記のグラフに差し替え - [正]
-
- 【 第6刷にて修正 】
- [誤]
- 377ページ コード10-19「自転車データでマハラノビス距離を計算」内、10行目のコメント
- [誤]
全データ(440件)のマハラノビス距離の計算 - [正]
全データ(730件)のマハラノビス距離の計算 - 【 第5刷にて修正 】
- [誤]
- 412ページ 工藤さん下本文4行目
- [誤]
未知データ「Eさん、150,50」のデータを当てはめた場合、 - [正]
未知データ「Eさん、身長172cm、体重50kg」のデータを当てはめた場合、 - 【 第3刷にて修正 】
- [誤]
- 417ページ 練習11-2の解答
- [誤]
正解:1、2、3 - [正]
正解:2、3 - 【 第2刷にて修正 】
- [誤]
- 422ページ 図12-2 ロボットのフキダシ2行目
- [誤]
(生き残る確率) = 1.0 - 0.6(male列) - 0.3(Pclass列) だから、 - [正]
(生き残る確率) = 1.0 - 0.6(male列) - 0.1(Pclass列) だから、 - 【 第5刷にて修正 】
- [誤]
- 450ページ アダブースト上から6行目
- [誤]
base_model=決定木などのモデル - [正]
base_estimator=決定木などのモデル
- [誤]
- 515ページ コード14-15 実行結果
- [誤]
(97, 15) - [正]
(100, 15) - 【 第3刷にて修正 】
- [誤]
- 560ページ 練習15-5の解答 3行目
- [誤]
mcd = MinCovDet() - [正]
mcd = MinCovDet(random_state=0) - 【 第3刷にて修正 】
- [誤]
- 606ページ C.3.6項のコード 3-6行目
- [誤]
工藤:[90, 70],
浅木:[70, 80],
松田:[70, 80],
瀬川:[85, np.nan] - [正]
'工藤':[90, 70],
'浅木':[70, 80],
'松田':[70, 80],
'瀬川':[85, np.nan] - 【 第3刷にて修正 】
- [誤]
- 607ページ C.3.7項のコード
- [誤]
df2.dropna(axis = 1) # df2の欠損値のある列の削除 - [正]
df2.dropna(axis = 0) # df2の欠損値のある行の削除 - 【 第3刷にて修正 】
- [誤]
- 633ページ ページ上の数式
- [誤]
縦ベクトルの要素:3, 4 - [正]
縦ベクトルの要素:2, 3 - 【 第4刷にて修正 】
- [誤]
お問い合わせ
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。