こんにちは、はやたす(@hayatasuuu )です。
僕は普段、フリーランスでデータサイエンティストをやっています。
そんな僕が「統計学の勉強方法」を3ステップで解説していきます。
統計学は抽象的な概念が多いので、独学方法を知らないと途中で挫折するハメになります。
この記事を読んで、挫折することなく正しい順番で統計学を習得していきましょう!
【独学OK】統計学の勉強方法を3ステップで解説【文系でも安心】
先に結論から書いていきます。
統計学の勉強方法は、以下の3ステップです。
- 統計Webを使って無料で勉強する
- 参考書を使って体系的に学習する
- 統計検定2級の問題集で理解度を確認する
順番に紹介していきますね。
STEP① : 統計Webを使って無料で勉強する
まずは『統計Web』で、基礎知識を固めていきましょう。
統計Webは、無料で統計学を学べるサイトです。
統計学に限らず、まずは無料で使える教材で勉強を始めてみるのが鉄則。
車を買うときは試乗するし、家を借りるときは内見してから購入しますよね。それと同じです。
統計Webは、図解多めなので初心者でも安心して利用できます。
『統計検定(=統計学の資格試験)』を受験するような中級者も使っているサイトです。
統計Webを使うときは、以下の手順で学習するのがおすすめ。
- 完璧を目指さず、とりあえず一回流し読み
- もう一回読む。このとき、練習問題も解く。
- 分からなかった部分は、別で調べてみる
要するに、一発で理解しようとせず、繰り返しの学習が大切です。
というのも、統計学は抽象的な概念が多く、理解しづらい部分が多々あります。
いきなり理解するのは”まず無理”だと思って、最初から繰り返し学習するつもりで取り組みましょう。
STEP② : 参考書を使って知識を体系的に学習する
統計Webを使うと、ざっくりした統計学の知識が身に付きます。
そこで次に参考書を使って、体系的に統計学を学んでいきます。
数式を使った統計学の解説本で、一番分かりやすい本です。
統計検定という統計学の資格試験でよく使われている人気の本でもあります。
まずは有名かつ人気のあるこちらの書籍で統計学を学んでいきましょう!
ただし「統計学でおすすめの本5冊」で4番目の難易度。
もう少し優しい本を使いたい方は、以下の記事をご覧ください。
STEP③ : 統計検定2級の問題集で理解度を確認する
ひたすら参考書を読み進めるのも良いですが、ちゃんと理解するのは「アウトプット」が必須。
ここで役に立つのが、統計検定2級の問題集です。
統計学の基礎を学んだら、ぜひアウトプットしてみてください。
- 本やサイトを読んで理解できる
- 実際に問題を解いてアウトプットできる
この2つでは、知識の定着具合に雲泥の差があります。
せっかく参考書を読んで理解しても、次の日に忘れていたのでは頑張ったのが意味がありません。
自分の努力を水の泡にしないためにも、問題を解いてしっかりアウトプットしましょう。
統計検定2級も問題が解けると、大学1〜2年生レベルの統計学が習得できています。
ちなみに「統計学の知識が身に付いているか」を確認することが目的なので、統計検定2級は受験しなくて大丈夫です。
もし資格取得に興味があれば、統計検定は「統計学の知見を持っていることの証明」になります。取得して損はありません。
独学のコツ : Pythonで「統計学を使う」のが最強の勉強です
ここまで統計学の勉強方法を紹介してきました。
でも正直なところ、統計学は使わないと知識が定着しません。
そこでPythonを使って統計学に触れていきましょう。
プログラミングなんてやったことないよ…。そんなあなたでも、以下のステップで勉強していけば大丈夫です。
- Pythonの勉強をする
- 動画でデータサイエンスを学ぶ
- 本を使ってデータサイエンスを体系的に学ぶ
順番に紹介します。
STEP① : Pythonの勉強をする
統計学を使うために、プログラミング言語「Python」を学習していきましょう。
「プログラミングで統計学を扱う」なら、Python
だけでなくR(アール)
も有名です。
僕は数学科出身ですが、当時は統計のシミュレーションにR
を使う人が多かったです。
でも現代であれば、R
よりもPython
を学びましょう。その理由が以下のとおりです。
- RよりPythonの方が、企業で採用されている
- Pythonを学ぶと、できることが多い
- 勉強に使える教材が多く、学習コストが低い
要するにR
よりPython
の方が汎用性と需要が高いです。
特別な理由がない限り、Pythonを選べば間違いないですね。
なお、Pythonの勉強方法については以下で詳しくまとめました。
プログラミング未経験の状態からPythonを習得するためのロードマップです。ぜひ参考にしてみてください。
STEP② : 動画でデータサイエンスを学ぶ
Pythonの基礎学習が終わったら、いよいよ統計学を使っていきましょう。
「Pythonと統計学を組み合わせる」というのは、データサイエンスに入門することを意味します。
そこでおすすめなのが、以下のオンラインコースです。
参考 : 【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門
この講座で”データサイエンスの流れ”を把握できます。
具体的にいうと、データの取り扱いから機械学習を使った予測・分類までを学習できるので、統計学がどのように使われているか分かります。
このコースを学習していると、「これ統計学の本で学習したやつだ!」と気が付くはずです。
データサイエンスは需要の高いスキルだし、統計学を実際に活かしている学問。だから学んでおいて損はないですね。
STEP③ : 本を使ってデータサイエンスを体系的に学ぶ
動画で”データサイエンスの流れ”を学んだら、次は本で体系的に学びましょう。
Pythonや統計学、またデータサイエンスの基礎を学習するなら、以下の一冊がおすすめです。
データサイエンスを学べる本はたくさんありますが、この本はデータサイエンスの基礎から網羅的に書かれています。
「そもそもデータサイエンスとは何か」といった概念の説明も書かれています。Pythonや統計学を勉強したなら持っておいて損がない本です。
本のタイトルに「東京大学」とありますが、内容は分かりやすく書かれています。ぜひ安心して学習に使ってみてください。
まとめ : 統計学の勉強は、理論だけではなく実践もしよう
というわけで、統計学の具体的な勉強方法について書いてきました。
僕の経験上、座学で本を読み続けるよりも、ある程度の基礎知識を身に付けたら実践に移った方が勉強になると感じています。
そもそも統計学を勉強する理由って、以下のいずれかですよね。
- データサイエンティストになりたい
- 企業内のデータを活用できるようになりたい
そして、これらの最終的な目標は、結局のところ「実践」です。
それなら最初から、Pythonを使って実践的な内容を学ぶyのが近道だと思います。
しかも、統計学は奥が深いので、すべてを網羅するのは無理です。
この記事で紹介している統計学は初歩的な内容で、本当は「測度論的確率論」という数学科でも挫折するような領域が待っています。
だから座学に時間をかけすぎるのではなく、「目標を達成できるような学習方法」に早い段階で切り替えていきましょう。
統計学もプログラミングも最初は難しいです。
でも身に付けたら重宝するスキルなので、自分の市場価値を上げるためにも頑張っていきましょう。
それでは、この辺で。