こんにちは、はやたす(@hayatasuuu )です。
この記事を書いている僕は、現役のフリーランスエンジニア。
現在は、スクレイピングと自然言語処理を扱う分析案件に参画しています。
今回はそんな僕が「自然言語処理の独学でおすすめの本・書籍4冊」を紹介していきます。
難易度や目的別で紹介しているので、
この記事を読めば自分にあった自然言語処理の本が見つかりますよ!
自然言語処理の入門・独学でおすすめの本・書籍4冊【初学者OK】
ここで紹介した本・書籍は、順番に読んでいくのがおすすめです。
おすすめ本① : 自然言語処理〔改訂版〕 (放送大学教材)
「自然言語処理に入門したい」と思ったら、まず最初に読むべき本です。
この書籍を読めば、自然言語処理の全体像を掴めるようになります。
実は、自然言語処理という分野は、想像以上に奥が深いです。
ひとことで「自然言語処理を専門にしている」と言っても、色々な分野があるわけですね。
ゆえに全体像を把握せずに自然言語処理の勉強を始めると、分からないことが多すぎて苦労することになります。
そもそも「自然言語処理 = 機械学習」ではないですからね。
まずはこの本から入門して、自然言語処理の全体像を掴んでいきましょう。
ページ数も約200Pとコンパクトなので読みやすいです。
おすすめ本② : 機械学習・深層学習による自然言語処理入門
Pythonを使った「機械学習による自然言語処理の実装」を学べる本です。
2020年2月に発売された本で、最近登場した”BERT”の解説が入っています。(2021年10月ではBERTも”最近”ではなくなってきましたが…)
理論面の話は盛り込まれていませんが、自然言語処理における機械学習の「実装」は、これ一冊で十分かなと感じています。
まずはPythonを使った実装を学び、自然言語処理のイメージを膨らませていきましょう。
おすすめ本③ : ゼロから作るDeep Learning 2 ―自然言語処理編
自然言語処理でよく使われるディープラーニングの理論を学べる本です。
こちらは「ゼロから作るDeep Learning」を読み終えたあとに取り組むのがおすすめ。
「ゼロから作るDeep Learning」の内容が分かっていないと、「ゼロから作るDeep Learning2」の内容を理解するのは難しいと思います。
自然言語処理で使われるディープラーニングは、
- Attentionを理解するには、seq2seqが必要
- seq2seqを理解するには、LSTMやGRUが必要
- LSTMやGRUを理解するには、RNNとゲートの概念が必要
- RNNとゲートの概念を理解するには、ディープラーニングの基礎が必要
といった感じで、基礎知識がどんどん発展していきます。
その点「ゼロから作るDeep Learning2」では、基礎からしっかり書かれているので躓くことなく読み進められるはずです。
おすすめ本④ : 深層学習による自然言語処理
自然言語処理で使うディープラーニングの理論に特化した本です。
内容はかなり難しく、レベルとしては大学院の教材に使われてるくらいです。
数式がたくさん登場するので、知識に不安があったら先に数学の基礎学習をおすすめします。
おまけ : 自然言語処理のおすすめ独学手順
自然言語処理の勉強で、おすすめの手順を紹介していきます。
結論からいうと、①動画を使って実装を学び、②そのあとで書籍を使った学習に切り替えるのが良いです。
STEP① : Udemyで自然言語処理の実装を学ぶ
この記事では自然言語処理を学ぶ方法として「書籍」を紹介しました。
でもまずは「動画」を使って学ぶのが良いと思います。
それは、ヒトは自分がイメージできないことを理解できないからです。
学生さんのように教えてくれる教授がいるなら別ですが、
独学ならいきなり本を使って勉強するのはやめておきましょう。
そこでおすすめなのがUdemyの講座です。
参考 : 自然言語処理とチャットボット: AIによる文章生成と会話エンジン開発
僕もこちらの講座で実装を学び、あとから理論を勉強しました。
動画だと動きを確認しながら学べるので、理解しやすく挫折リスクがグンと下がります。
まずはオンラインコースで実装を確認しながら、雰囲気を掴んでいきましょう。
STEP② : 自然言語処理の知識を書籍で深掘りする
動画でPythonを使った実装を学んだら、あとは知識を深掘りしていきます。
そこで、本記事で紹介した本・書籍を活用していきましょう。
おそらく「自然言語処理とは何か?」という内容は大丈夫だと思います。
ぜひ以下の書籍から深掘りを進めてみてください。
Udemy講座では学べなかった、TensorFlowを活用したBERTの実装なども習得できます。
STEP③ : 自然言語処理を使ったデータ分析をやってみる
動画や本を使った座学も良いですが、それだけだとさすがに退屈になるはずです。
そこで自然言語処理を使ったデータ分析をやってみましょう。
データ分析を体験するにはKaggleを使います。
コンペの画面で「natural language processing」とか検索してみてください。
過去に実施された自然言語処理を使ったコンペが見つかるはずです。
まとめ : 自然言語処理は楽しいので、たくさん勉強しよう
というわけで、自然言語処理の独学でおすすめの本・書籍を紹介してきました。
とにかく、まずはUdemyの『自然言語処理とチャットボット: AIによる文章生成と会話エンジン開発』で勉強を始めるのがおすすめですね。
自然言語処理は楽しいです。
僕は休日、気がついたらお昼を食べるのも忘れて7〜8時間くらい経過していました。
自然言語処理に興味を持った方は、ぜひともハマっていただけたらと思います😌
おしまいです。