Python

kaggleでtitanicを始めるまで

 

STEP1 : Kaggleの登録をする

 

まずは、兎にも角にもKaggleに登録しましょう。

参考ページ >> Kaggle: Your Home for Data Science

 

アクセスすると、下の画像のような画面になりますので、Googleアカウントで登録していきましょう。

kaggle 初心者 titanic

Googleアカウントを持っていない場合は、自前のメールアドレスでも作成できますが、何かと便利なのでGoogleアカウントを作っておきましょう。

無料でGPU環境を構築できるGoogle Colaboratoryが使えるなど、色々とメリットがあります。

 

Googleアカウントでログインすると、おそらくトップページに戻ってくるので、左上のハンバーガーメニューを開いて、「Register」をクリックしましょう。

kaggle 初心者 titanic

 

ユーザー名と、表示名を入力して、Get Startedしましょう。

kaggle 初心者 titanic

 

よくある確認画面に移ります。同意して、下にスクロールしていきましょう。

kaggle 初心者 titanic

 

すると、下の方にもチェックボックスがあるので、同意してあげます。

kaggle 初心者 titanic

合計2箇所の同意ができたら、「Create Account」でアカウント作成します。

 

無事にアカウント作成できると、下の画像のような画面になるかと思います。

kaggle 初心者 titanic

ここまで出来ていたら、アカウントの作成は完了です(`・ω・´)!

あとは、Kaggleをイジっていくだけですね。

 

STEP2 : titanicチュートリアルに参加する

 

そうしたら、さっそくtitanicチュートリアルに参加していきましょう。

画面左上の「Kaggle」をクリックして、メニューを開いたら「Competitions」があるので、クリックします。

kaggle 初心者 titanic

 

Competitionsに移ったら、おそらくトップ画面にTitanicチュートリアルがあるはずです。クリックしましょう。

kaggle 初心者 titanic

 

そうすると、Titanicチュートリアルのトップ画面になります。

まずは、Join Competitionsで、Titanicチュートリアルに参加しましょう。

kaggle 初心者 titanic

こんな感じで確認画面が出てくるかと思いますが、「I Understand and Accept」で大丈夫です。

kaggle 初心者 titanic

 

ここまで出来たらトップ画面に戻ってきますので、「Data」をクリックします。

kaggle 初心者 titanic

 

下の方にスクロールしていくと、「Download All」があるのでクリックして、データを取得しましょう。

kaggle 初心者 titanic

おそらくこんな感じで、titanicという名前でディレクトリごとダウンロードできているはずです。

kaggle 初心者 titanic

ダウンロードした中身は、下記のとおり。

  • train.csv
  • test.csv
  • gender_submission.csv

訓練用データとテスト用データがあり、さらにデモ用のファイルが入っています。

 

このtitanicディレクトリと同じところに、今回コードを書いていくPythonファイルを作成しましょう。

kaggle 初心者 titanic

※Jupyter notebookw使う場合には、Jupyterを立ち上げてtitanicディレクトリでipynbファイルを作ってあげればOKです。

 

ここまででTitanicチュートリアルに参加する準備ができました。

あとはコードを書いて、機械学習させるのみですね。