夜は短し歩けよ未来大生

未来大生が人工知能を中心に勉強していく上で、学習メモや日記として書いていきます。

夏休みDay6

今日は特に何もできなかったやらなかった。

でも、夏休みの明確な目標を立てたからここに書いておくことにする。

  • PRMLを読み切り、出てくる式を自分で導けるようになる。
  • 強化学習を用いて自分よりも強いFlapy Birdを作る 
  • 自分より強いFlapy Birdを攻略するモデルをDQN, DDQN, A3C, A2C, Ape-Xで実装する

今日はお試しに自分だけでDQNを実装してOpenAI Gymに取り組もうかと思ってたんですけど、どうも何から手をつければいいのかわからず、進捗を生み出せませんでした。
どこから手をつければいいのか、何を考えながら実装すればいいのか。。。
やっぱり強化学習教師あり学習とかと違って難しいですね