2017-05-01から1ヶ月間の記事一覧
統計の知識が一ミリもない状態から、3ヶ月くらい勉強してなんとなくPythonでベイズ推定ができるようになったので、その過程で勉強した本を挙げていきます。 勉強した内容は大きく分けて以下です。 統計学の基礎 Pythonによるデータ操作 ベイズ推定とMCMC 統…
いままではすべて分類の話だったのですが、Ch10は回帰について書いてあります。
昨日の記事の続きです。 hoture6.hatenablog.com 概要 KaggleのTItanic問題についてネット上をいろいろ見てみると正解率80%がちょうど良い目標っぽいので、いろいろ頑張ってみてRandom Forestで80.8%を達成しました。実装は自分で考えつつやったのですが、や…
Kaggleのgetting started的な位置付けのTitanic: Machine Learning from Disaster | Kaggleを解いてみました。今回はscikit-learnを思い出すことと提出することが目的なので、精度は一切求めません(言い訳)。また、他の人の回答を調べているうちに以下のや…
Ch. 6はscikit-learnを使った機械学習におけるいろいろなベストプラクティスの話です。cross validationやパラメータチューニングについての話題が多い。
Ch. 5は次元削減の話です。この章はけっこう難しかったので簡単にまとめて、また興味や必要に応じて戻ってくることにしました。
11章の空間構造を持つモデルをやってみます。PyMCでCARモデルの作り方がわからなかったので、PyStanでやりました。
10.5節の、個体差に加えて場所差も考慮したベイズモデルを実装します。せっかくなので(?)、PyMC3とPyStan両方でやってみました。 PyMC3 PyStan