いちばんやさしいPython機械学習の教本 人気講師が教える業務で役立つ実践ノウハウ
2,860円(本体 2,600円+税10%)
- 品種名
- 書籍
- 発売日
- 2019/6/21
- ページ数
- 304
- サイズ
- B5変形判
- 著者
- 鈴木 たかのり 著/降籏 洋行 著/株式会社ビープラウド 著/平井 孝幸 著
- ISBN
- 9784295006411
実践的な基礎が学習しやすい!!
注目を集めるPython(パイソン)を使った機械学習の、実践的な基礎が学べる解説書です。小さいサンプルプログラム(bot)に機能を追加しながらデータ収集から前処理、学習、予測、評価まで周辺技術も含めた機械学習の全体像が学べます。本書のサンプルプログラムは、すべて本書のサポートページからダウンロードできます。
- 電子版を買う
-
「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。
学校・法人一括購入に関するお問い合わせはこちらへ。
目次
Chapter 1 機械学習について知ろう
Chapter 2 環境を準備しよう
Chapter 3 スクレイピングでデータ収集をしよう
Chapter 4 日本語の文章生成をしよう
Chapter 5 手書き文字認識をしよう
Chapter 6 データの前処理を学ぼう
Chapter 7 回帰分析をしよう
Chapter 8 機械学習の次のステップ
Chapter 2 環境を準備しよう
Chapter 3 スクレイピングでデータ収集をしよう
Chapter 4 日本語の文章生成をしよう
Chapter 5 手書き文字認識をしよう
Chapter 6 データの前処理を学ぼう
Chapter 7 回帰分析をしよう
Chapter 8 機械学習の次のステップ
関連書籍
ダウンロード
-
本書のサンプルコードです(2019/11/25更新)
お詫びと訂正
誤記のためにご迷惑をおかけし、誠に申し訳ございません。
- 46ページ インストールするPythonのバージョン
- [誤]
手順2:[Dounload Python 3.7.3](本書執筆時点) - [正]
2020年4月時点ではPython 3.8.2が最新ですが、Jupyter Notebookの依存パッケージが32bit版のPython 3.8.2に未対応のため、環境によってはJupyter Notebookのインストールに失敗することがあります。その場合はインストールされている32bit版のPython 3.8.2をアンインストール後、Python 3.7.7か64bit版のPython 3.8.2をインストールしてください。
なお、64bit版のPython 3.8.2は「https://www.python.org/downloads/release/python-382/」にアクセスし、[Windows x86-64 executable installer]をクリック、32bit版のPython 3.7.7は「https://www.python.org/downloads/release/python-377/」にアクセスし、[Windows x86 executable installer]をクリックしてインストーラーをダウンロードしてください。 - 【 第2刷にて修正 】
- [誤]
- 110ページ コードの4行目
- [誤]
for line in f: 各行を読み込む - [正]
for line in f: # 各行を読み込む -
備考:
「# 各行を読み込む」のようにコメントアウトが必要です。
- [誤]
- 113ページ 見出し
- [誤]
1 TSVファイルをpybotフォルダーへコピーする - [正]
1 TSVファイルをpybotwebフォルダーへコピーする
- [誤]
- 125ページ 4:文字列を形態素解析する
- [誤]
2020年8月23日にリリースされたJanome 0.4.0からtokenize()の結果がリストからgeneratorに変わりました。そのため、長さを確認するには一度リストに変換する必要があります。
・Janome 0.3.10の場合
>>> from janome.tokenizer import Tokenizer
>>> t = Tokenizer()
>>> text = '東京都でおいしいビールを飲もう。'
>>> tokens = t.tokenize(text)
>>> type(tokens) # tokensはリスト
<class 'list'>
>>> len(tokens)
9 - [正]
・Janome 0.4.0の場合
>>> from janome.tokenizer import Tokenizer
>>> t = Tokenizer()
>>> text = '東京都でおいしいビールを飲もう。'
>>> tokens = t.tokenize(text)
>>> type(tokens) # tokensはgenerator
<class 'generator'>
>>> token_list = list(tokens)
>>> len(token_list)
9 -
備考:
[janome 開発日誌] v0.4.0 をリリースしました
https://link.medium.com/6FqZmCJhL9
- [誤]
- 126ページ 5:形態素解析した結果を出力する
- [誤]
上記の2020年8月23日にリリースされたJanome 0.4.0に関連した変更により、125ページの手順4で「tokens」をリストに変換して「token_list」にしたため、そのあとの処理も「token_list」で行う必要があります。
for token in tokens:
print(token) - [正]
for token in token_list:
print(token)
- [誤]
- 157ページ コードの14~15行目
- [誤]
text = re.sub('(\w+)', '', text)
text = re.sub('[\w+]', '', text) - [正]
text = re.sub('([^)]+)', '', text)
text = re.sub('[[^]]+]', '', text)
- [誤]
- 164ページ 本文2行目
- [誤]
Pybotのフォルダーに - [正]
Pybotwebのフォルダーに
- [誤]
- 241ページ 本文の11行目~
- [誤]
結合される側(df)はIndex、結合される側(df_station)はon引数で指定された列が結合に使われます。 - [正]
結合される側(df)はon引数で指定された列、結合する側(df_station)はIndexが結合に使われます。
- [誤]
お問い合わせ
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。