夜は短し歩けよ未来大生

未来大生が人工知能を中心に勉強していく上で、学習メモや日記として書いていきます。

強化学習

簡単に理解してDQNを実装してみる

この記事は この記事はFUN Advent Calendar 2018 5日目の記事です。 去年に引き続き12/5に記事を公開してます。 昨日は mecaota さんでした。 注意 時間足りなくて途中で心が折れてます。気をつけてください。 だいぶ適当なこと書いてるので、間違いは訂正コ…

夏休みDay n(nは任意の整数)強化学習でFlappy_Birdやってみた

強化学習でFlappy_Birdやってみた(Q学習編) Playing Flappy Bird by Q_Learning ↑2000回学習させたもの 忙しい人のためにコードはコチラ 記事を読む上での注意 細かい強化学習の説明はできないため書いてありません 勉強中のため色んな本やサイトを参考にコ…

夏休みDay6

今日は特に何もできなかったやらなかった。 でも、夏休みの明確な目標を立てたからここに書いておくことにする。 PRMLを読み切り、出てくる式を自分で導けるようになる。 強化学習を用いて自分よりも強いFlapy Birdを作る 自分より強いFlapy Birdを攻略する…

夏休みDay4(DQNがだんだんわかってきた)

ずっとDQNがわからなかったんですけど 今日なんとなく理解できた気がしました。 いやーやっぱり、説明のメモ取りながら理解していくってのは重要ですね。 具体的に何が理解できていなかったのか考えてみると、DQNって学習を安定させるために色んな技術を使う…

夏休みDay2(DQNが分からない)

()# 強化学習のお勉強をした 夏休みの二日目に入った。 さすがにそろそろ勉強し始めなきゃと思って、試験前に勉強していた強化学習の続きをやり始めた。 やり始めてすぐに思ったのは「あ、DQNやっぱりわからねぇ」だった。 DQNがよくわからない DQNを表した…