いちばんやさしいPython機械学習の教本 人気講師が教える業務で役立つ実践ノウハウ

いちばんやさしいPython機械学習の教本 人気講師が教える業務で役立つ実践ノウハウ

2,860円(本体 2,600円+税10%)

品種名
書籍
発売日
2019/6/21
ページ数
304
サイズ
B5変形判
著者
鈴木 たかのり 著/降籏 洋行 著/株式会社ビープラウド 著/平井 孝幸 著
ISBN
9784295006411

実践的な基礎が学習しやすい!!

注目を集めるPython(パイソン)を使った機械学習の、実践的な基礎が学べる解説書です。小さいサンプルプログラム(bot)に機能を追加しながらデータ収集から前処理、学習、予測、評価まで周辺技術も含めた機械学習の全体像が学べます。本書のサンプルプログラムは、すべて本書のサポートページからダウンロードできます。

「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。

アンケートに答える

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

学校・法人一括購入に関するお問い合わせはこちらへ。

一括購入窓口

目次

Chapter 1 機械学習について知ろう
Chapter 2 環境を準備しよう
Chapter 3 スクレイピングでデータ収集をしよう
Chapter 4 日本語の文章生成をしよう
Chapter 5 手書き文字認識をしよう
Chapter 6 データの前処理を学ぼう
Chapter 7 回帰分析をしよう
Chapter 8 機械学習の次のステップ

ダウンロード

お詫びと訂正

誤記のためにご迷惑をおかけし、誠に申し訳ございません。

  • 46ページ インストールするPythonのバージョン
    • [誤]
      手順2:[Dounload Python 3.7.3](本書執筆時点)
    • [正]
      2020年4月時点ではPython 3.8.2が最新ですが、Jupyter Notebookの依存パッケージが32bit版のPython 3.8.2に未対応のため、環境によってはJupyter Notebookのインストールに失敗することがあります。その場合はインストールされている32bit版のPython 3.8.2をアンインストール後、Python 3.7.7か64bit版のPython 3.8.2をインストールしてください。

      なお、64bit版のPython 3.8.2は「https://www.python.org/downloads/release/python-382/」にアクセスし、[Windows x86-64 executable installer]をクリック、32bit版のPython 3.7.7は「https://www.python.org/downloads/release/python-377/」にアクセスし、[Windows x86 executable installer]をクリックしてインストーラーをダウンロードしてください。
    • 【 第2刷にて修正 】
  • 110ページ コードの4行目
    • [誤]
      for line in f:  各行を読み込む
    • [正]
      for line in f:  # 各行を読み込む
    • 備考:

      「# 各行を読み込む」のようにコメントアウトが必要です。

  • 113ページ 見出し
    • [誤]
      1 TSVファイルをpybotフォルダーへコピーする
    • [正]
      1 TSVファイルをpybotwebフォルダーへコピーする
  • 125ページ 4:文字列を形態素解析する
    • [誤]
      2020年8月23日にリリースされたJanome 0.4.0からtokenize()の結果がリストからgeneratorに変わりました。そのため、長さを確認するには一度リストに変換する必要があります。

      ・Janome 0.3.10の場合
      >>> from janome.tokenizer import Tokenizer
      >>> t = Tokenizer()
      >>> text = '東京都でおいしいビールを飲もう。'
      >>> tokens = t.tokenize(text)
      >>> type(tokens)  # tokensはリスト
      <class 'list'>
      >>> len(tokens)
      9
    • [正]
      ・Janome 0.4.0の場合
      >>> from janome.tokenizer import Tokenizer
      >>> t = Tokenizer()
      >>> text = '東京都でおいしいビールを飲もう。'
      >>> tokens = t.tokenize(text)
      >>> type(tokens)  # tokensはgenerator
      <class 'generator'>
      >>> token_list = list(tokens)
      >>> len(token_list)
      9
    • 備考:

       [janome 開発日誌] v0.4.0 をリリースしました

      https://link.medium.com/6FqZmCJhL9
  • 126ページ 5:形態素解析した結果を出力する
    • [誤]
      上記の2020年8月23日にリリースされたJanome 0.4.0に関連した変更により、125ページの手順4で「tokens」をリストに変換して「token_list」にしたため、そのあとの処理も「token_list」で行う必要があります。

      for token in tokens:
      print(token)
    • [正]
      for token in token_list:
      print(token)
  • 157ページ コードの14~15行目
    • [誤]
      text = re.sub('(\w+)', '', text)
      text = re.sub('[\w+]', '', text)
    • [正]
      text = re.sub('([^)]+)', '', text)
      text = re.sub('[[^]]+]', '', text)
  • 164ページ 本文2行目
    • [誤]
      Pybotのフォルダーに
    • [正]
      Pybotwebのフォルダーに
  • 241ページ 本文の11行目~
    • [誤]
      結合される側(df)はIndex、結合される側(df_station)はon引数で指定された列が結合に使われます。
    • [正]
      結合される側(df)はon引数で指定された列、結合する側(df_station)はIndexが結合に使われます。

お問い合わせ

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

お問い合わせフォーム