Contents
【2020年最新】データサイエンスでおすすめの本10冊【現役が紹介】
2020年最新版にて、データサイエンスでおすすめの本・書籍を10冊紹介していきます。
本当はもう少し絞りたかったのですが、データサイエンスは必要な知識が多いので、御許しいただければと思いますm(_ _)m
データサイエンスでおすすめの本 : 入門編3冊
まずは、「これからデータサイエンスを学んでみたい」と考えている方向けの書籍を3冊紹介します。
大学4年間のデータサイエンスが10時間でざっと学べる
こちらの書籍では、これから勉強を始める方が、データサイエンスの全体を俯瞰するのに最適な書籍になっています。
大学4年間のデータサイエンスを10時間で学べると歌っているだけあって、よくまとまっている一冊だと思います。
データサイエンスを始めたい!と思ったら、まずは「大学4年間のデータサイエンスが10時間でざっと学べる」が良いでしょう。
完全独習 統計学入門
こちらは、統計学の入門書としてよく使われている書籍になっています。
データサイエンスは、言うまでもなく統計学を使っていくことになりますので、しっかりと学んでおく必要があります。
とはいえ、統計学の「と」の字も知らない状態から、ゴリゴリに難しい本を読んでいくのもナンセンスなので、まずは「完全独習 統計学入門」から攻めるのがおすすめですね。
機械学習のエッセンス
こちらは、機械学習について学ぶときに、よくおすすめされる書籍になっています。
ディープラーニングは収録されていないものの、一般的でデータサイエンスで使うような機械学習手法については網羅的に書かれています。
Pythonの基礎からしっかりと書かれているので、はじめてPythonを学習していく場合でも、このタイミングで一緒に勉強できるようになっています。
補足 : Pythonの学習は、本を使うべきではないです
なおPythonでおすすめの書籍については、以下の記事で紹介しています。

そして、記事を見ていただけると分かりますが、僕は本を使ってPythonの勉強をしていくことをおすすめしていません。
現代では、Progateや有益な動画学習サービスがあるので、わざわざ本を開いてプログラムを書く必要はないと思っています。
データサイエンスでおすすめの本 : 実践編4冊
入門編の書籍を読み終えたら、実践編の書籍に移っていきましょう。
内容に関しては、わりと難しくなっていきます。
東京大学のデータサイエンティスト育成講座
こちらの書籍は題目にもあるとおりで、東京大学で行われているデータサイエンティスト育成講座を元に作られた書籍です。
「データサイエンティストの仕事内容から、具体的なデータサイエンスに関する知識」までが網羅的に書かれています。
入門編を終えたら、まずは「東京大学のデータサイエンティスト育成講座」で体系的に学習を進めるのが良いですね。
Pandasライブラリ活用入門
これはあまり紹介している人がいませんでしたが、Pandasライブラリ活用入門もおすすめです。
というのも、データ分析したり、機械学習したりするとき、Pythonライブラリで1番使うのって、Pandasなんですよね。
基本的にPandasで色々とデータを整形してから、機械学習をはじめていきます。
そして、一つの問題に対して「データの整形 : 機械学習 = 8 : 2」と言われているくらい、データの整形が重要になってきます。
なので、Pandasは別でしっかりと学習しておくのがおすすめです。
Pythonで学ぶ統計的機械学習
こちらの書籍は統計的機械学習について学べる本になっていて、ざっくり言うと機械学習の理論面をしっかりと学べる本になっています。
のちに紹介する、「はじめてのパターン認識」を読む前にこの本を使っておくと、スムーズに学習が進むのかなと感じますね。
統計学入門
統計学入門、通称赤本です。
こちらの書籍は、確率・統計について、かなり詳細に書かれている書籍です。
僕自身、大学が修学か出身なのですが、数学科で習う確率・統計の授業に教科書として使われるような書籍になっています。
なので逆を返せば、この書籍を学んでおけば、確率・統計分野に関しては申し分ないのかなと感じますね。
ただ、基本的に難しいと言われている書籍なので、無理せず少しずつ勉強していくので良いと思います。
はじめてのパターン認識
はじめてのパターン認識、通称はじパタです。
表紙もポップだし、「はじめての」 と書いてあるから簡単そうに思えますが、内容はわりと難しいです。
ただ、ディープラーニング以外の機械学習については、かなり詳細に理論面が紹介されています。
この一冊をマスターできれば、かなり力がつきますね。
データサイエンスでおすすめの本 : 実務編2冊
Kaggleで勝つデータ分析の技術
こちらは、データサイエンスコンペのKaggleで勝つための方法・手法について書かれた本です。
おそらくデータサイエンスを勉強する方であれば、Kaggleをやることになるので、この書籍は持っておいて損はないかと。
Kaggleで勝つための手法と言っていますが、「Kaggleで勝てる = 実務でも応用が効く」です。
さらに、少し先の話かもしれませんが、Kaggleで好成績をおさめていると、わりと就職しやすかったりします。
そんなKaggleでの戦い方について書かれているので、是非とも持っておきたい一冊ですね。
前処理大全
こちらは、機械学習を始める前のデータ前処理について学習できる書籍になっています。
使い方としては参考書のように学習するのではなく、「データ前処理をするとき片手に持って参考にする」のが良いかと。
データサイエンスを実務でやっていくのであれば、持っておきたい書籍ですね。
まとめ : いますぐ本を買って、データサイエンスを学習しよう
と言うわけで、データサイエンスでおすすめの書籍を紹介してきました。
たくさん紹介しましたが、兎にも角にも、まずは入門編から始めるべきですね。
データサイエンスに興味を持ったその瞬間から、さっそく学習を始めていきましょう。
それでは、この辺で。
おすすめの記事