Webスクレイピング

【厳選4冊】Webスクレイピング(Python)でおすすめの本【実務OK】

Python スクレイピング 本
Pythonの基礎学習を終えた人
Pythonの基礎学習を終えた人
ProgateでPythonの勉強が終わったんだけど、次はスクレイピングを学習したいな…。

スクレイピングでおすすめの本があったら、教えて欲しいな…。

この記事では、上記のような悩みを解決していきます。

 

この記事の内容

  • 【厳選4冊】Webスクレイピング(Python)でおすすめの本【実務OK】
  • 【Webスクレイピング学習】Pythonとセットで学ぶべきこと3つ

 

この記事を書いている僕は、現役のフリーランスエンジニア。

現在は、スクレイピングと自然言語処理を使う案件に参画しているので、実務でもスクレイピングを使用した経験があります。

 

今回はそんな僕が『Webスクレイピング(Python)でおすすめの本4冊』を紹介していきます。

 

スクレイピング系の本は、初心者にとって内容の難しいものが多いです。

でもこの記事を読めば、難易度順でおすすめ本を紹介しているので、挫折することなくスクレイピングを習得できるようになります。

 

スクレイピングを習得したいと考えている人は、必見の記事ですね(`・ω・´)!

 

【厳選4冊】Webスクレイピング(Python)でおすすめの本【実務OK】

Python スクレイピング 本

難易度順で、Webスクレイピング学習に役立つ本を紹介していきます。

 

おすすめ① : Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!

Webスクレイピング系の技術書で、1番やさしく書かれている書籍です。

Progateを使ってPythonの基礎を身につけたけど、次にどうしたら良いのか分からない…」といった場合には、この本で入門すれば挫折することなく学習できます。

絵本の形式で書かれている本なので、技術書を使った学習に慣れていないプログラミング初心者でも安心です。

Webスクレイピングを学べる本の中で、1番やさしい内容になっている
実務で使っていくには、中身が物足りない

おすすめ② : Pythonクローリング&スクレイピング[増補改訂版]

 

少し分厚くなりますが、Webスクレイピングをしっかりと学べる書籍になっています。

そもそもスクレイピングというのは、Pythonを含めたプログラミング言語を使わずともできます。ではなぜPythonを使うのかといえば、データ加工したりデータベースのアクセスが容易だからです。

UNIXコマンドを使えばスクレイピングは可能ですが、そういった”スクレイピング自体の根本”と言える部分を学べるのが、こちらの書籍になります。

この書籍を学べば、Pythonを使ったスクレイピングの基礎は、しっかり身についていると考えて大丈夫ですね。

Webスクレイピングの基礎がしっかり身につく
おすすめ①よりも難易度が上がる

おすすめ③ : Pythonスクレイピングの基本と実践 データサイエンティストのためのWebデータ収集術

Webスクレイピングと、その後の活用方法まで学べる書籍です。

そもそも、Pythonを使ってスクレイピングする場合、以下のような理由や目的が挙げられます。

  • コピペなどの手作業を自動化したい
  • 外部からデータを収集して、自社の分析に活かしたい
  • Webからデータ収集して、AIを作るときのデータセットにしたい

要するに、Webスクレイピングはデータを収集する「手段」であって、その後には何らかの目的があります。

こういった、スクレイピング後の「活用方法」まで学べるのが、Pythonスクレイピングの基本と実践です。

「とりあえずスクレイピングを学びたいけど、その後には機械学習も学んでみたい…」と考えているなら、ぜひこちらの書籍を学んでみてください。

Webスクレイピングと、その活用方法まで学べる
少し内容が難しくなってくる

おすすめ④ : PythonによるWebスクレイピング 第2版

実務でスクレイピングを使うなら、学習しておきたい1冊です。

 

こちらの本が、実務に適している理由は以下のとおり。

  • MySQLを使ったデータ保存方法を学べる
  • 並列処理を使ったスクレイピングを学べる
  • スクレイピングでよくあるトラップを回避する方法を学べる

たとえば、「スクレイピングで取得したデータを、データベースに格納する」といった処理実務で頻出の項目になります。

またサイトによっては、「プログラムによる自動収集を察知したら、そのIPアドレスをブロックする」といったトラップを仕掛けていることもあります。

ざっくりいえば「人間っぽくアクセスする」のが大事になるのですが、それらの知識を1冊にまとめたのがこの本ということです。

もしPythonを使ってデータ分析する仕事に就きたいと考えているなら、間違えなく役に立つ1冊になりますよ。

実務で役に立つスクレイピング技術を学べる
プログラミング初心者には難しい

【Webスクレイピング学習】Pythonとセットで学ぶべきこと3つ

Python スクレイピング 本

結論、スクレイピングを学ぶなら、以下の知識をおさえておくのが良いです。

  • 学ぶべきこと① : HTML, CSS
  • 学ぶべきこと② : JavaScript
  • 学ぶべきこと③ : Web技術の知識

学習方法とセットで解説します。

学ぶべきこと① : HTML, CSS

Webスクレイピングは、結局のところ「Webページに埋め込まれているHTMLから情報を抽出する技術」です。

それゆえ、HTMLが分かっていないと、スクレイピングでデータを取得することができません。

またCSSも理解しておくと、「文字色が赤くなっている部分だけ抽出する」といったことが可能になります。

なので、Pythonの基礎を習得したら、その次はHTMLとCSSを学習しましょう。

 

おすすめの学習方法

Progateを使って学習すればOKです。

Progate HTML CSS

さらに、すべてのコースを学習する必要はなく、以下の3つだけやれば大丈夫です。

  • HTML & CSS 初級編
  • HTML & CSS 中級編
  • HTML & CSS 上級編

Pythonよりカンタンですので、サクサク学習していきましょう。

学ぶべきこと② : JavaScript

HTMLとCSSを理解するだけでもスクレイピングできますが、以下のような問題が発生します。

  • アプリにログインしないと、欲しいデータを取得できない
  • 「もっと見る」を押さないと、取得したい一覧を表示できない
  • 下にスクロールしないと、取得したいデータが表示されない

 

たとえば「Yahoo!画像検索を使って、浜辺美波の画像を自動で取得したい」と思ったら、画面を下にスクロールしないと画像が表示されません。

 

動画で紹介しました

こちら僕のYouTubeです。

JavaScriptが分かると、画像を下にスクロールする操作すらも、自動化できるようになります。

 

おすすめの学習方法

HTML, CSSと同様に、JavaScriptもProgateを使って学習すればOKです。

Progate JavaScript

スクレイピングのためにJavaScriptを学習するなら、以下の3つで事足ります。

  • JavaScript I
  • JavaScript II
  • JavaScript III

特に画像をスクレイピングで取得したいと考えているなら、JavaScriptもあわせて学習しておきましょう。

学ぶべきこと③ : Web技術の知識

Pythonを使ってスクレイピングするには、以下のような手順を踏みます。

  • STEP① : Pythonプログラム上で、URLにアクセスする
  • STEP② : アクセス先から、HTMLの情報を取得する
  • STEP③ : 取得したHTMLを解析して、欲しいデータを取得する

上記のとおり。

そして、STEP①でURLにアクセスするとき、「そもそもリクエストってどうやって送っているんだろう?」といったWeb技術の知識があると、コーディングが理解しやすくなるかと。

逆にWeb系の知識を持っていないと、専門用語の理解に苦労しますので、いったん体系的に学んでおくのがおすすめですね。

 

おすすめの学習方法

Web技術の知識を習得するなら、以下の本がおすすめです。

図解が多めで初心者でも読みやすく、とはいえ内容もしっかり書かれている良書ですね。

 

ソフトウェアのエンジニアになるのであれば、もう少し踏み込んだ内容が必要ですが、スクレイピング学習には、この難易度がちょうど良いかと。

いきなり飛ばし過ぎても挫折するだけなので、少しずつステップアップしていきましょう(`・ω・´)!

 

まずは無料でPythonとスクレイピングを学ぼう【本より分かりやすい】

 

今回は、Webスクレイピング(Python)の学習でおすすめの本を紹介してきました。

 

ただ、個人的な僕の意見は、プログラミング初心者が本を使って学習し始めるのは、あんまりオススメできないかなと。

理由は以下のとおりです。

  • 本・書籍代が高い
  • 動画で学んだ方が、理解しやすい
  • コードを書き写しても、実行できないことがある

要するに、動画を使って無料で学習できるのが1番だと考えています。

 

という発想なので、僕個人が「Pythonのすべてを学べる」がコンセプトのYouTubeチャンネルを作成しました。

»参考 : はやたす / Pythonエンジニア | YouTube

Pythonの基本文法はもちろん、Excelの自動操作といった人気講座も取り扱っているので、よかったら使ってみてください(`・ω・´)!

※スクレイピングは、今後追加予定です!

 

それではこの辺で。よきPythonライフを!