下校時刻

メモ、読んだ本のまとめメモ、考えたことのメモ、その他のメモなどが書いてあるブログです(twitter: @hoture6)

KaggleのTitanic問題をとりあえず提出する

Kaggleのgetting started的な位置付けのTitanic: Machine Learning from Disaster | Kaggleを解いてみました。今回はscikit-learnを思い出すことと提出することが目的なので、精度は一切求めません(言い訳)。また、他の人の回答を調べているうちに以下のやり方はいろいろとだめっぽいことがわかってきたのですが、今回の目的はとりあえず提出なので気にしないことにします(目的を言い訳にするプロ)。そして最終的にxgboostの結果を提出して正解率75%くらいだったんだけど、random forestの方がいいっぽい(?)。次の記事で精度を上げることを頑張ってみます。

参考にしたもの

xgboostのインストール: macOS SierraでJupyter Notebookを使った機械学習環境を手っ取り早く作る手順 with anaconda - Qiita

xgboostの使い方、パラメータ、チューニング: PythonでXgboost · Wolftail Boundsxgboost のパラメータ - puyokwの日記XGBoostのパラメータチューニング実践 with Python | かものはしの分析ブログ