Pythonデータ分析 実践ハンドブック 実務で使えるデータ加工のテクニック

Pythonデータ分析 実践ハンドブック 実務で使えるデータ加工のテクニック

3,300円(本体 3,000円+税10%)

品種名
書籍
発売日
2023/9/22
ページ数
424
サイズ
B5変形判
著者
寺田 学 著/神沢 雄大 著/@driller 著/辻 真吾 著
ISBN
9784295017745

データ加工/分析の実践スキルを習得しよう

本書は、Pythonやpandasの基礎を身につけた方が、データ分析を行ううえで知っておきたい「データ分析の実務で使うノウハウ」をまとめた書籍です。さまざまな種類のデータの読み込みから加工、可視化、データの評価、pandasやNumPyの活用方法など、Pythonを使ってデータを加工し分析する方法を詳しく学べます。データ加工のレシピやデータ分析に必要な数学の知識についても学べます。

「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。

アンケートに答える

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

学校・法人一括購入に関するお問い合わせはこちらへ。

一括購入窓口

詳細

著者紹介

■寺田学(てらだ まなぶ)
[担当:第1章、第2章(「parquet形式」除く)、第7章(Pythonを使った文字列処理)、第8章(Pillowを使った画像の加工)、付録A・B]
Python Web関係の業務を中心にコンサルティングや構築を株式会社CMSコミュニケーションズ代表取締役として手がけている。ほかにも、一般社団法人PyCon JP Association理事や一般社団法人Pythonエンジニア育成推進協会 顧問理事を務める。
Pythonをはじめとした技術話題を扱うPodcast「terapyon channel」https://podcast.terapyon.net/を配信中。共著『見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑』『Pythonによるあたらしいデータ分析の教科書 第2版』(いずれも翔泳社)、監修『スラスラわかるPython 第2版』(翔泳社)、監訳『Pythonハッカーガイドブック』(マイナビ出版)、そのほかの執筆活動も行っている。

■神沢 雄大(かんざわ ゆうた)
[担当:第2章(parquet形式)、第5章、第8章(NumPyを使った画像データ処理)、付録C]
チューリッヒ保険会社にて、カスタマーエクスペリエンス向上やマーケティング、業務改善のためのデータ分析と機械学習モデル構築/運用に従事し、データに基づいたビジネス上の意思決定と効率化をサポートしている。R言語のコミュニティTokyo.Rの運営チームのメンバーでもあり、そのほか、定期的に国内外のイベントに登壇している。https://ytknzw.github.io/

■@driller(どりらー)
[担当:第3章、第6章、第7章(pandasによるテキストデータの処理)、第10章]
デリバティブを中心とした金融データの分析にPythonを活用している。Python × 金融のコミュニティfin-py主宰。共著に『改訂版 Pythonユーザのための Jupyter[実践]入門』(技術評論社)、『Pythonインタラクティブ・データビジュアライゼーション入門』(朝倉書店)がある。

■辻 真吾(つじ しんご)
[担当:第4章、第9章、第11章]
大学の研究所に勤務し、Pythonを使ったデータ解析をバイオ、エネルギー、教育といった幅広い分野へ適用する研究を行っている。『Pythonスタートブック[増補改訂版]』(技術評論社)、『Pythonで学ぶアルゴリズムとデータ構造』(講談社)、『ゼロから始めるデータサイエンス入門——R・Python一挙両得——』(講談社)などの著書がある。詳しくは、www.tsjshg.infoまで。

ページイメージ

クリックすると大きい画像でご覧いただけます

目次

第1章 データ加工概論 
 1-1 データ加工の目的 
 1-2 データ分析エンジニアの役割 
 1-3 データの種類 
 1-4 ライブラリの種類 
第2章 データの種類と読み込み 
 2-1 CSV形式 
 2-2 Excel形式 
 2-3 JSON形式 
 2-4 HTML形式 
 2-5 XML形式 
 2-6 文書データ 
 2-7 画像データ 
 2-8 音声データ 
 2-9 RDBデータ 
 2-10 pickle形式 
 2-11 parquet形式 
第3章 表形式データの加工 
 3-1 データの連結/結合 
 3-2 データの変形 
 3-3 カテゴリーデータの処理 
 3-4 データのグループ化 
 3-5 階層型インデックス(MultiIndex) 
第4章 NumPyと数値データ 
 4-1 配列の構造とブロードキャスト 
 4-2 数値データの型 
第5章 データの評価 
 5-1 使用するデータの紹介と読み込み 
 5-2 定量的評価(統計量) 
 5-3 定性的評価(可視化) 
 5-4 データの分布の確認 
 5-5 外れ値、異常値 
 5-6 欠損値 
 5-7 値の重複 
第6章 時系列データの処理 
 6-1 時系列データを扱うpandasのデータ型 
 6-2 時系列データのインデックス 
 6-3 リサンプリング 
 6-4 .dtアクセサ 
 6-5 タイムゾーン情報を含むdatetime型の操作 
第7章 テキスト情報の処理 
 7-1 Pythonを使った文字列処理 
 7-2 pandasによるテキストデータの処理 
第8章 画像データの処理 
 8-1 Pillowを使った画像の加工 
 8-2 NumPyを使った画像データ処理 
第9章 グラフデータの処理 
 9-1 グラフとNetworkX 
 9-2 実践的なグラフデータの解析 
第10章 地理空間データの処理 
 10-1 地理空間データの概要 
 10-2 地理空間データのファイル形式と読み込み 
 10-3 地理空間データの操作 
 10-4 GeoPandas 
 10-5 地理空間データの可視化 
第11章 データ加工のための線形代数 
 11-1 線形代数の基本 
 11-2 行列の特異値分解 
 
付録A Pythonのインストール 
付録B パッケージのインストール 
付録C pandasとMatplotlibによる可視化

ダウンロード

お詫びと訂正

現在のところ、本製品に正誤情報はありません。

お問い合わせ

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

お問い合わせフォーム