俺のブログ

学習メモや日記をつらつらと書きます。

強化学習

簡単に理解してDQNを実装してみる

この記事は この記事はFUN Advent Calendar 2018 5日目の記事です。 去年に引き続き12/5に記事を公開してます。 昨日は mecaota さんでした。 注意 時間足りなくて途中で心が折れてます。気をつけてください。 だいぶ適当なこと書いてるので、間違いは訂正コ…

夏休みDay n(nは任意の整数)強化学習でFlappy_Birdやってみた

強化学習でFlappy_Birdやってみた(Q学習編) Playing Flappy Bird by Q_Learning ↑2000回学習させたもの 忙しい人のためにコードはコチラ 記事を読む上での注意 細かい強化学習の説明はできないため書いてありません 勉強中のため色んな本やサイトを参考にコ…

夏休みDay4(DQNがだんだんわかってきた)

ずっとDQNがわからなかったんですけど 今日なんとなく理解できた気がしました。 いやーやっぱり、説明のメモ取りながら理解していくってのは重要ですね。 具体的に何が理解できていなかったのか考えてみると、DQNって学習を安定させるために色んな技術を使う…