PyTorch自然言語処理プログラミング word2vec/LSTM/seq2seq/BERTで日本語テキスト解析!

PyTorch自然言語処理プログラミング word2vec/LSTM/seq2seq/BERTで日本語テキスト解析!

3,080円(本体 2,800円+税10%)

品種名
書籍
発売日
2021/3/18
ページ数
256
サイズ
B5変形判
著者
新納 浩幸 著
ISBN
9784295011132

PyTorchの活用でより容易に実装できる!

ディープラーニング技術を使った自然言語処理においてword2vec、LSTM、seq2seq、BERTは、重要な技術です。本書では、機械学習フレームワークのPyTorchを利用することで、それらのディープラーニング技術を使ったプログラムをより容易に実装する方法を解説します。本書で作成するプログラムは、「文章内の単語の品詞を分類する」「日英の機械翻訳を行う」「質問に対する回答を返す」ことなどを目的にしています。本書は、そうした自然言語処理システムの実装を試してみたいという方にとって格好の一冊です。

「読者アンケートに答える」「読者プレゼントに応募」の場合もこちらをご利用ください。

アンケートに答える

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

学校・法人一括購入に関するお問い合わせはこちらへ。

一括購入窓口

詳細

著者紹介

◎新納 浩幸(しんのう ひろゆき)
1961年生まれ。1985年 東京工業大学理学部情報科学科卒業。
1987年 東京工業大学大学院理工学研究科情報科学専攻修士課程修了。
現在、茨城大学工学部情報工学科教授、博士(工学)。
専門分野は自然言語処理、機械学習、統計学など。
2018年から言語処理学会 理事を務める。

目次

第1章 PyTorchの基礎
第2章 word2vecによる分散表現 ~単語をベクトルで表現~
第3章 LSTMによる時系列データ解析 ~文を単語の系列として解析~
第4章 seq2seqモデルによる機械翻訳 ~ある系列を別の系列に変換~
第5章 事前学習済みモデルBERTの活用 ~タスクに応じてモデルを調整~
付録A プログラミング環境の構築(Windows)
付録B 本書で解説した主要プログラム集

ダウンロード

本書のサンプルプログラムを含むZIPファイルは、下記のリンクからダウンロードできます。このZIPファイルには以下のファイルが含まれています。まずはreadme.txtの内容からご覧ください。



◎本書のサンプルプログラム

◎データの一部

◎一部のデータを構築するプログラム

◎readme.txt

お詫びと訂正

誤記のためにご迷惑をおかけし、誠に申し訳ございません。

  • 0ページ サンプルコード内[Chapter4]フォルダのnmt.pyの15行目
    • [誤]
      with open('train.en.vocab.4k','r',encoding='utf-8) as f:
    • [正]
      with open('train.en.vocab.4k','r',encoding='utf-8') as f:
    • 備考:

       このページから提供していたサンプルコード(pytorch-nlp.zip)のファイルに誤りがありました。現在、提供しているpytorch-nlp01.zipでは、上記の内容を修正済みです(2021/11/05)。

  • 0ページ サンプルコード内[Chapter4]フォルダのatt-nmt.pyの83行目
    • [誤]
      return torch.tanh(self.W(oy2))
    • [正]
      return self.W(oy2)
    • 備考:

      このページから提供していたサンプルコード(pytorch-nlp01.zip)のファイルに誤りがありました。現在、提供しているpytorch-nlp01r1.zipでは、上記の内容を修正済みです(2022/10/19)。

  • 56ページ 網掛けコード部分の5行目(lstm0をlstmに)
    • [誤]
      >>> yn, (hn, cn) = lstm0(xn, (h0, c0))
    • [正]
      >>> yn, (hn, cn) = lstm(xn, (h0, c0))
  • 144ページ 本文3行目(小文字xを大文字Xに)
    • [誤]
      xの0の部分は
    • [正]
      Xの0の部分は
  • 194ページ 網掛けコード部分の下から3行目
    • [誤]
      >>> out = torch.tensor([ids]), token_type_ids=torch.tensor([tids]))
    • [正]
      >>> out = net(torch.tensor([ids]), token_type_ids=torch.tensor([tids]))
  • 221ページ コードの9行目
    • [誤]
      return torch.tanh(self.W(oy2))
    • [正]
      return self.W(oy2)
  • 233ページ 脚注を追加
    • [誤]
      (※1と※2の漏れを追加)
    • [正]
      ※1 https://pytorch.org/docs/stable/index.html
      ※2 https://pytorch.org/tutorials/

お問い合わせ

書籍の内容に関するお問い合わせはこちら。お答えできるのは本書に記載の内容に関することに限ります。

お問い合わせフォーム