Pythonデータ分析/機械学習のための基本コーディング! Pandasライブラリ活用入門
4,180円(本体 3,800円+税10%)
- 品種名
- 書籍
- 発売日
- 2019/2/22
- ページ数
- 424
- サイズ
- B5判
- 著者
- Daniel Y. Chen 著/吉川 邦夫 訳/福島 真太朗 監修
Python定番ライブラリの定石をマスター!
データ分析や機械学習では、まず必要なデータを取り込んで整備する必要があります。Pythonでは、そのためのライブラリpandasが用意されています。本書では、まずpandasの使い方の基本を説明。その後、データの整備/集約、可視化、モデル採択、正則化など、一連の定石的な手法を紹介。付録では、Pythonのインストールや文法を確認できます。本書は、データ分析や機械学習を進める前の準備段階として、データ処理の全体を見渡しつつその手法を確認できる一冊です(本書は『Pandas for Everyone: Python Data Analysis』の翻訳書です)。
- 紙の本を買う
-
「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。
学校・法人一括購入に関するお問い合わせはこちらへ。
目次
■第1部 基本的な使い方の基本
第1章 DataFrameの基礎
最初のデータセットをロードする/列、行、セルを見る/グループ化と集約/基本的なグラフ
第2章 pandasのデータ構造
データを自作する/Seriesについて/DataFrameについて/SeriesとDataFrameの書き換え
データのエクスポートとインポート
第3章 プロットによるグラフ描画
matplotlib/matplotlibによる統計的グラフィックス
seaborn/pandasのオブジェクト/seabornのテーマとスタイル
■第2部 データ操作によるクリーニング
第4章 データを組み立てる
"整然データ"/連結/複数のデータセットをマージする
第5章 欠損データへの対応
NaNとは何か/欠損値はどこから来るのか/欠損データの扱い
第6章 "整然データ"を作る
複数列に(変数ではなく)値が入っているとき/複数の変数を含む列がある場合
行と列の両方に変数があるとき/1個の表に観察単位が複数あるとき(正規化)
同じ観察単位が複数の表にまたがっているとき
■第3部 データの準備―変換/整形/結合など
第7章 データ型の概要と変換
データ型/型変換/カテゴリ型データ
第8章 テキスト文字列の操作
文字列/文字列メソッド/その他の文字列メソッド
文字列のフォーマッティング/正規表現/regexライブラリ
第9章 applyによる関数の適用
関数/applyの基本/applyの応用/関数のベクトル化/ラムダ関数
第10章 groupby演算による分割-適用-結合
集約/変換(transform)/フィルタリング
DataFrameGroupByオブジェクト/マルチインデックスを使う
第11章 日付/時刻データの操作
Pythonのdatetimeオブジェクト/datetimeへの変換
日付を含むデータをロードする/日付のコンポーネントを抽出する
日付の計算とtimedelta/datetimeのメソッド
………
■第4部 モデルをデータに適合させる
第12章 線形モデル
単純な線形回帰/重回帰/sklearnでインデックスラベルを残す
第13章 一般化線形モデル
ロジスティック回帰/ポアソン回帰/その他の一般化線形モデル/生存分析
第14章 モデルを診断する
残差/複数のモデルを比較する/k分割交差検証
第15章 正則化で過学習に対処する
なぜ正則化するのか/LASSO回帰/リッジ回帰
ElasticNet/交差検証
第16章 クラスタリング
k平均法/階層的クラスタリング
■第5部 締めくくり―次のステップへ
第17章 pandas周辺の強力な機能
第18章 さらなる学びのための情報源
■第6部 付録
インストール/コマンドライン/プロジェクトのテンプレート
Pythonの使い方/ワーキングディレクトリ/環境
パッケージのインストール/ライブラリのインポート
リスト/タプル/辞書/値のスライス/ループ/内包表記
………
関連書籍
ダウンロード
本製品の読者さまを対象としたダウンロード情報はありません。
お詫びと訂正
誤記のためにご迷惑をおかけし、誠に申し訳ございません。
- 0ページ Daniel Y. Chen氏のプロフィール
- [誤]
…博士号を取得。 - [正]
…博士課程に在籍。
- [誤]
- 132ページ 当該ページ下のコード枠の1行目
- [誤]
# 'region'列を除く - [正]
# 'religion'列を除く - 【 第3刷にて修正 】
- [誤]
- 168ページ 当該ページ一番下のコード枠の1行目
- [誤]
s = 'Hayden Planetarium Coordinates: lat, lon' - [正]
s = 'Hayden Planetarium Coordinates: {lat}, {lon}' - 【 第3刷にて修正 】
- [誤]
- 170ページ 8.5.5項のコード枠の2行目
- [誤]
s = f"It's just a var!" - [正]
s = f"It's just a {var}!" - 【 第3刷にて修正 】
- [誤]
- 170ページ 8.5.5項のコード枠の下から3行目
- [誤]
s = f'Hayden Planetarium Coordinates: lat, lon' - [正]
s = f'Hayden Planetarium Coordinates: {lat}, {lon}' - 【 第3刷にて修正 】
- [誤]
- 171ページ 表8.5の7項目
- [誤]
m | 直前の文字のm個の繰り返しとマッチする - [正]
{m} | 直前の文字のm個の繰り返しとマッチする - 【 第3刷にて修正 】
- [誤]
- 174ページ 当該ページ最初のコード枠の1、2行目
- [誤]
# 単純にパターンを使い回す
m = re.match(pattern='\d10', - [正]
# 前のパターンを単純化
m = re.match(pattern='\d{10}', - 【 第3刷にて修正 】
- [誤]
- 174ページ 当該ページ3番目のコード枠の4行目
- [誤]
p = '\d3\s?\d3\s?\d4' - [正]
p = '\d{3}\s?\d{3}\s?\d{4}' - 【 第3刷にて修正 】
- [誤]
- 174ページ 当該ページ4番目のコード枠の2行目
- [誤]
p = '\(?\d3\)?\s?\d3\s?-?\d4' - [正]
p = '\(?\d{3}\)?\s?\d{3}\s?-?\d{4}' - 【 第3刷にて修正 】
- [誤]
- 175ページ 当該ページ最初のコード枠の1行目
- [誤]
p = '\+?1\s?\(?\d3\)?\s?\d3\s?-?\d4' - [正]
p = '\+?1\s?\(?\d{3}\)?\s?\d{3}\s?-?\d{4}' - 【 第3刷にて修正 】
- [誤]
- 176ページ 当該ページ2番目のコード枠の1行目
- [誤]
p = re.compile('\d10') - [正]
p = re.compile('\d{10}') - 【 第3刷にて修正 】
- [誤]
お問い合わせ
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。