Pythonデータ分析/機械学習のための基本コーディング! Pandasライブラリ活用入門

Pythonデータ分析/機械学習のための基本コーディング! Pandasライブラリ活用入門

4,180円(本体 3,800円+税10%)

品種名
書籍
発売日
2019/2/22
ページ数
424
サイズ
B5判
著者
Daniel Y. Chen 著/吉川 邦夫 訳/福島 真太朗 監修

Python定番ライブラリの定石をマスター!

データ分析や機械学習では、まず必要なデータを取り込んで整備する必要があります。Pythonでは、そのためのライブラリpandasが用意されています。本書では、まずpandasの使い方の基本を説明。その後、データの整備/集約、可視化、モデル採択、正則化など、一連の定石的な手法を紹介。付録では、Pythonのインストールや文法を確認できます。本書は、データ分析や機械学習を進める前の準備段階として、データ処理の全体を見渡しつつその手法を確認できる一冊です(本書は『Pandas for Everyone: Python Data Analysis』の翻訳書です)。

「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。

アンケートに答える

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

学校・法人一括購入に関するお問い合わせはこちらへ。

一括購入窓口

目次

■第1部 基本的な使い方の基本
第1章 DataFrameの基礎

最初のデータセットをロードする/列、行、セルを見る/グループ化と集約/基本的なグラフ

第2章 pandasのデータ構造
データを自作する/Seriesについて/DataFrameについて/SeriesとDataFrameの書き換え
データのエクスポートとインポート

第3章 プロットによるグラフ描画
matplotlib/matplotlibによる統計的グラフィックス
seaborn/pandasのオブジェクト/seabornのテーマとスタイル

■第2部 データ操作によるクリーニング
第4章 データを組み立てる

"整然データ"/連結/複数のデータセットをマージする

第5章 欠損データへの対応
NaNとは何か/欠損値はどこから来るのか/欠損データの扱い

第6章 "整然データ"を作る
複数列に(変数ではなく)値が入っているとき/複数の変数を含む列がある場合
行と列の両方に変数があるとき/1個の表に観察単位が複数あるとき(正規化)
同じ観察単位が複数の表にまたがっているとき

■第3部 データの準備―変換/整形/結合など
第7章 データ型の概要と変換

データ型/型変換/カテゴリ型データ

第8章 テキスト文字列の操作
文字列/文字列メソッド/その他の文字列メソッド
文字列のフォーマッティング/正規表現/regexライブラリ

第9章 applyによる関数の適用
関数/applyの基本/applyの応用/関数のベクトル化/ラムダ関数

第10章 groupby演算による分割-適用-結合
集約/変換(transform)/フィルタリング
DataFrameGroupByオブジェクト/マルチインデックスを使う

第11章 日付/時刻データの操作
Pythonのdatetimeオブジェクト/datetimeへの変換
日付を含むデータをロードする/日付のコンポーネントを抽出する
日付の計算とtimedelta/datetimeのメソッド
………

■第4部 モデルをデータに適合させる
第12章 線形モデル

単純な線形回帰/重回帰/sklearnでインデックスラベルを残す

第13章 一般化線形モデル
ロジスティック回帰/ポアソン回帰/その他の一般化線形モデル/生存分析

第14章 モデルを診断する
残差/複数のモデルを比較する/k分割交差検証

第15章 正則化で過学習に対処する
なぜ正則化するのか/LASSO回帰/リッジ回帰
ElasticNet/交差検証

第16章 クラスタリング
k平均法/階層的クラスタリング

■第5部 締めくくり―次のステップへ
第17章 pandas周辺の強力な機能
第18章 さらなる学びのための情報源


■第6部 付録
インストール/コマンドライン/プロジェクトのテンプレート
Pythonの使い方/ワーキングディレクトリ/環境
パッケージのインストール/ライブラリのインポート
リスト/タプル/辞書/値のスライス/ループ/内包表記
………

関連書籍

近日発売

IT基礎教養 自然言語処理&画像解析 "生成AI"を生み出す技術

深くてやさしい!生成AIの仕組みが丸わかり

好評発売中

Pythonライブラリによる因果推論・因果探索[概念と実践] 因果機械学習の鍵を解く

好評発売中

仕事がはかどるPython&Excel自動処理 全部入り 改訂2版(できる全部入り)

ダウンロード

本製品の読者さまを対象としたダウンロード情報はありません。

お詫びと訂正

誤記のためにご迷惑をおかけし、誠に申し訳ございません。

  • 0ページ Daniel Y. Chen氏のプロフィール
    • [誤]
      …博士号を取得。
    • [正]
      …博士課程に在籍。
  • 132ページ 当該ページ下のコード枠の1行目
    • [誤]
      # 'region'列を除く
    • [正]
      # 'religion'列を除く
    • 【 第3刷にて修正 】
  • 168ページ 当該ページ一番下のコード枠の1行目
    • [誤]
      s = 'Hayden Planetarium Coordinates: lat, lon'
    • [正]
      s = 'Hayden Planetarium Coordinates: {lat}, {lon}'
    • 【 第3刷にて修正 】
  • 170ページ 8.5.5項のコード枠の2行目
    • [誤]
      s = f"It's just a var!"
    • [正]
      s = f"It's just a {var}!"
    • 【 第3刷にて修正 】
  • 170ページ 8.5.5項のコード枠の下から3行目
    • [誤]
      s = f'Hayden Planetarium Coordinates: lat, lon'
    • [正]
      s = f'Hayden Planetarium Coordinates: {lat}, {lon}'
    • 【 第3刷にて修正 】
  • 171ページ 表8.5の7項目
    • [誤]
      m | 直前の文字のm個の繰り返しとマッチする
    • [正]
      {m} | 直前の文字のm個の繰り返しとマッチする
    • 【 第3刷にて修正 】
  • 174ページ 当該ページ最初のコード枠の1、2行目
    • [誤]
      # 単純にパターンを使い回す
      m = re.match(pattern='\d10',
    • [正]
      # 前のパターンを単純化
      m = re.match(pattern='\d{10}',
    • 【 第3刷にて修正 】
  • 174ページ 当該ページ3番目のコード枠の4行目
    • [誤]
      p = '\d3\s?\d3\s?\d4'
    • [正]
      p = '\d{3}\s?\d{3}\s?\d{4}'
    • 【 第3刷にて修正 】
  • 174ページ 当該ページ4番目のコード枠の2行目
    • [誤]
      p = '\(?\d3\)?\s?\d3\s?-?\d4'
    • [正]
      p = '\(?\d{3}\)?\s?\d{3}\s?-?\d{4}'
    • 【 第3刷にて修正 】
  • 175ページ 当該ページ最初のコード枠の1行目
    • [誤]
      p = '\+?1\s?\(?\d3\)?\s?\d3\s?-?\d4'
    • [正]
      p = '\+?1\s?\(?\d{3}\)?\s?\d{3}\s?-?\d{4}'
    • 【 第3刷にて修正 】
  • 176ページ 当該ページ2番目のコード枠の1行目
    • [誤]
      p = re.compile('\d10')
    • [正]
      p = re.compile('\d{10}')
    • 【 第3刷にて修正 】

お問い合わせ

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

お問い合わせフォーム