kaggleの入門としてタイタニック号の生存者予測があるのですが実力試しでしています。(精度上げはこれからです。)
8/6時点でのソースコードです。うまく貼れてなかったらすみません。
github.com
最後に出力されているteisyutu.csvをkaggleのコンペにアップロードしたら精度が出ます。ちなみに精度は67%くらいでした。かなり低いですが"精度50%以上で動くこと"が目標だったので目標達成です。
NaNの扱いが酷く、NaNがある性別や年齢データごと消したりしちゃってるのでそれだけでもかなり精度上がるでしょうし見直したいですね。