KaggleのTitanic問題をとりあえず提出する
Kaggleのgetting started的な位置付けのTitanic: Machine Learning from Disaster | Kaggleを解いてみました。今回はscikit-learnを思い出すことと提出することが目的なので、精度は一切求めません(言い訳)。また、他の人の回答を調べているうちに以下のやり方はいろいろとだめっぽいことがわかってきたのですが、今回の目的はとりあえず提出なので気にしないことにします(目的を言い訳にするプロ)。そして最終的にxgboostの結果を提出して正解率75%くらいだったんだけど、random forestの方がいいっぽい(?)。次の記事で精度を上げることを頑張ってみます。
参考にしたもの
xgboostのインストール: macOS SierraでJupyter Notebookを使った機械学習環境を手っ取り早く作る手順 with anaconda - Qiita
xgboostの使い方、パラメータ、チューニング: PythonでXgboost · Wolftail Bounds、 xgboost のパラメータ - puyokwの日記、 XGBoostのパラメータチューニング実践 with Python | かものはしの分析ブログ