Pythonデータ分析 実践ハンドブック 実務で使えるデータ加工のテクニック
3,300円(本体 3,000円+税10%)
- 品種名
- 書籍
- 発売日
- 2023/9/22
- ページ数
- 424
- サイズ
- B5変形判
- 著者
- 寺田 学 著/神沢 雄大 著/@driller 著/辻 真吾 著
- ISBN
- 9784295017745
データ加工/分析の実践スキルを習得しよう
本書は、Pythonやpandasの基礎を身につけた方が、データ分析を行ううえで知っておきたい「データ分析の実務で使うノウハウ」をまとめた書籍です。さまざまな種類のデータの読み込みから加工、可視化、データの評価、pandasやNumPyの活用方法など、Pythonを使ってデータを加工し分析する方法を詳しく学べます。データ加工のレシピやデータ分析に必要な数学の知識についても学べます。
- 電子版を買う
-
「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。
学校・法人一括購入に関するお問い合わせはこちらへ。
詳細
著者紹介
■寺田学(てらだ まなぶ)
[担当:第1章、第2章(「parquet形式」除く)、第7章(Pythonを使った文字列処理)、第8章(Pillowを使った画像の加工)、付録A・B]
Python Web関係の業務を中心にコンサルティングや構築を株式会社CMSコミュニケーションズ代表取締役として手がけている。ほかにも、一般社団法人PyCon JP Association理事や一般社団法人Pythonエンジニア育成推進協会 顧問理事を務める。
Pythonをはじめとした技術話題を扱うPodcast「terapyon channel」https://podcast.terapyon.net/を配信中。共著『見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑』『Pythonによるあたらしいデータ分析の教科書 第2版』(いずれも翔泳社)、監修『スラスラわかるPython 第2版』(翔泳社)、監訳『Pythonハッカーガイドブック』(マイナビ出版)、そのほかの執筆活動も行っている。
■神沢 雄大(かんざわ ゆうた)
[担当:第2章(parquet形式)、第5章、第8章(NumPyを使った画像データ処理)、付録C]
チューリッヒ保険会社にて、カスタマーエクスペリエンス向上やマーケティング、業務改善のためのデータ分析と機械学習モデル構築/運用に従事し、データに基づいたビジネス上の意思決定と効率化をサポートしている。R言語のコミュニティTokyo.Rの運営チームのメンバーでもあり、そのほか、定期的に国内外のイベントに登壇している。https://ytknzw.github.io/
■@driller(どりらー)
[担当:第3章、第6章、第7章(pandasによるテキストデータの処理)、第10章]
デリバティブを中心とした金融データの分析にPythonを活用している。Python × 金融のコミュニティfin-py主宰。共著に『改訂版 Pythonユーザのための Jupyter[実践]入門』(技術評論社)、『Pythonインタラクティブ・データビジュアライゼーション入門』(朝倉書店)がある。
■辻 真吾(つじ しんご)
[担当:第4章、第9章、第11章]
大学の研究所に勤務し、Pythonを使ったデータ解析をバイオ、エネルギー、教育といった幅広い分野へ適用する研究を行っている。『Pythonスタートブック[増補改訂版]』(技術評論社)、『Pythonで学ぶアルゴリズムとデータ構造』(講談社)、『ゼロから始めるデータサイエンス入門——R・Python一挙両得——』(講談社)などの著書がある。詳しくは、www.tsjshg.infoまで。
目次
第1章 データ加工概論
1-1 データ加工の目的
1-2 データ分析エンジニアの役割
1-3 データの種類
1-4 ライブラリの種類
第2章 データの種類と読み込み
2-1 CSV形式
2-2 Excel形式
2-3 JSON形式
2-4 HTML形式
2-5 XML形式
2-6 文書データ
2-7 画像データ
2-8 音声データ
2-9 RDBデータ
2-10 pickle形式
2-11 parquet形式
第3章 表形式データの加工
3-1 データの連結/結合
3-2 データの変形
3-3 カテゴリーデータの処理
3-4 データのグループ化
3-5 階層型インデックス(MultiIndex)
第4章 NumPyと数値データ
4-1 配列の構造とブロードキャスト
4-2 数値データの型
第5章 データの評価
5-1 使用するデータの紹介と読み込み
5-2 定量的評価(統計量)
5-3 定性的評価(可視化)
5-4 データの分布の確認
5-5 外れ値、異常値
5-6 欠損値
5-7 値の重複
第6章 時系列データの処理
6-1 時系列データを扱うpandasのデータ型
6-2 時系列データのインデックス
6-3 リサンプリング
6-4 .dtアクセサ
6-5 タイムゾーン情報を含むdatetime型の操作
第7章 テキスト情報の処理
7-1 Pythonを使った文字列処理
7-2 pandasによるテキストデータの処理
第8章 画像データの処理
8-1 Pillowを使った画像の加工
8-2 NumPyを使った画像データ処理
第9章 グラフデータの処理
9-1 グラフとNetworkX
9-2 実践的なグラフデータの解析
第10章 地理空間データの処理
10-1 地理空間データの概要
10-2 地理空間データのファイル形式と読み込み
10-3 地理空間データの操作
10-4 GeoPandas
10-5 地理空間データの可視化
第11章 データ加工のための線形代数
11-1 線形代数の基本
11-2 行列の特異値分解
付録A Pythonのインストール
付録B パッケージのインストール
付録C pandasとMatplotlibによる可視化
関連書籍
ダウンロード
お詫びと訂正
現在のところ、本製品に正誤情報はありません。
お問い合わせ
書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。