夜は短し歩けよ未来大生

未来大生が人工知能を中心に勉強していく上で、学習メモや日記として書いていきます。

Sim2Real転移のためのDomain Randomization(翻訳)

この記事は,Lilian Weng氏によるDomain Randomization for Sim2Real Transferの記事を日本語訳したものです. 元記事 : Domain Randomization for Sim2Real Transfer: 2019年5月5日 by Lilian Weng 訳 : たける シミュレーター上で学習したモデルやポリシー…

スレートプレートを買った自慢がしたい

スレートプレートを買った. 最近は外出せずにYouTubeでお料理の動画ばかり見ている. 色々なお料理の動画を見ている中で,私はスレートプレートに出会ってしまった. なぜ私がそれに惹かれたのかは分からない. ただ,スレートプレートを使った料理はどれも…

Solving Rubik's Cube with a Robot Hand を読んだ

はじめに この記事は強化学習Advent Calendar20198日目の記事です. たくさん空いているのでどなたでも気軽に参加して貰えると嬉しいです. 自己紹介 北海道の雄大な自然の中にある大学に通う学部4年のたけるです. 卒業研究では,深層強化学習を使ったロボ…

iPadを買っておけ間違いないから!!!

この記事は,FUN Advent Calendar2019の12月5日の記事です. 昨日はnao(ki)さんの1/32の車のお話。でした. 学部4年の知能コースのたける(Twitter)です. 強化学習とか深層学習とかロボットの制御的な感じの研究してます. 特に最近は自分の無能さに病みがち…

GitHub Actionsを使って,TeXをビルドする仕組み作ってみた

概要 GitHub ActionsというCIを用いて,リポジトリにPushすると自動的にTeXファイルからPDFファイルに出力するようなもの.出力はGitHub APIを使って,GitHub ReleaseのAssetsに添付します. リポジトリ READMEにも同様の説明があるよ リポジトリ 前提 Gitを…

簡単に理解してDQNを実装してみる

この記事は この記事はFUN Advent Calendar 2018 5日目の記事です。 去年に引き続き12/5に記事を公開してます。 昨日は mecaota さんでした。 注意 時間足りなくて途中で心が折れてます。気をつけてください。 だいぶ適当なこと書いてるので、間違いは訂正コ…

勉強する意味。

注意 このブログは個人の考え・意見です。 発言に一切の責任は負いません。 異論、あなたの考え、大歓迎です。 思うことがあれば是非教えてほしいです。 時間がない人向け 勉強する意味がわからない人は、勉強しなくてもいいから色んなことに興味を持って欲…

夏休みDay n(nは任意の整数)強化学習でFlappy_Birdやってみた

強化学習でFlappy_Birdやってみた(Q学習編) Playing Flappy Bird by Q_Learning ↑2000回学習させたもの 忙しい人のためにコードはコチラ 記事を読む上での注意 細かい強化学習の説明はできないため書いてありません 勉強中のため色んな本やサイトを参考にコ…

夏休みDay8,9

昨日完全に記事を書くことを失念してました。 いやーもう完全に忘れてたね、なんならさっきまで忘れてたね(9/11 23:54現在) ここ2日目はゆっくりPRMLを読んでました もうね序論から時間かかりまくり 確率密度関数とか共分散行列とか講義でやったのに全然覚え…

夏休みDay7

今日は稀にある何一つやる気が起きない日 やる気がなさすぎたから近所にあるラーメン屋さんでラーメンを食べました。 とても美味しかったです。 函館にある櫓屋さんです。 とっても美味しいのでおススメです。

夏休みDay6

今日は特に何もできなかったやらなかった。 でも、夏休みの明確な目標を立てたからここに書いておくことにする。 PRMLを読み切り、出てくる式を自分で導けるようになる。 強化学習を用いて自分よりも強いFlapy Birdを作る 自分より強いFlapy Birdを攻略する…

夏休みDay5(DL4US課題)

今日は明後日までに期限が迫ってきたDL4USの課題に取り組んでいました。 詳しいことは自分で調べてもらうとDL4US( DL4US | Deep Learning for All of Us )が何なのかわかりやすい説明が出てくると思います。 DL4USの資料や課題の詳しい内容はもちろん言って…

夏休みDay4(DQNがだんだんわかってきた)

ずっとDQNがわからなかったんですけど 今日なんとなく理解できた気がしました。 いやーやっぱり、説明のメモ取りながら理解していくってのは重要ですね。 具体的に何が理解できていなかったのか考えてみると、DQNって学習を安定させるために色んな技術を使う…

夏休みDay3

今日はPRML(パターン認識と機械学習 上 )の序章やってました。 確率論の加法定理とからへんまで進めました。 まぁ、この辺はまだ難しいとかはなく大学でもやった内容なんでサクサクいけますね。 明日は先輩ならこれからの強化学習を借りれる事になったので借…

夏休みDay2(DQNが分からない)

()# 強化学習のお勉強をした 夏休みの二日目に入った。 さすがにそろそろ勉強し始めなきゃと思って、試験前に勉強していた強化学習の続きをやり始めた。 やり始めてすぐに思ったのは「あ、DQNやっぱりわからねぇ」だった。 DQNがよくわからない DQNを表した…

夏休みDay1

昨日前期の全ての試験が終わった。 試験が終わったので友人と飲みに行き、二日酔いで午前中はキツかった。 夏休みだからどうせなら毎日アウトプットしたいと思った。 大学3年生になって、周りの人達が 単位のために 将来のことを考え始めてサマーインターン…

DL4US Lesson1やったった

この記事は東京大学松尾研究室主催DL4US(DL4US | Deep Learning for All of Us)を受講した感想を書いているものです。 先程、DL4USのLesson1を受けてきました。 詳しいことは書かないほうが良いと思うので書きませんが、Lesson1ならこんなもんかなと思うよう…

DL4US第二期を受講することになった

東京大学松尾研究室主催 DL4US( DL4US | Deep Learning for All of Us ) の抽選を無事通過し、受講することになりました。 受講までの流れとしては、 応募締め切り 6/30 -> 受講オンラインテスト 7/13~//17 -> 結果 7/19 といった流れで受講するための選考が…

Pythonのパスの結合について-忘れないためのメモ

Pythonのパスの結合で何回でもやりそうな失敗したからメモ Pythonには標準ライブラリの os ライブラリに環境に合わせていい感じにパスを繋げてくれるモジュールがある 具体的には import os os.path.join('User', 'desktop') なんかにすると /User/desktop …