ML-Agents を使ったゲームをリリースしようと、ここ知らばくUnityばかりしていましたが、ようやくリリースすることができました。 Google Play のこちらからダウンロードできます。 以下、苦労した点の覚書です。まだ、Unityに慣れていないこともあり、もっとよい対 […]
ハンドロンという過去に制作したロボットの動きを強化学習で作りました。その忘備録になります。 ハンドロンとは ハンドロンは、昔作った卓球ボールを打ち返すロボットです。 この時は、ボールを打つ動作はプログラムで作成しておき、その打つ動作を発動させるタイミングを強化学習で調節させました […]
エアホッケーを目指したロボットの実験のの忘備録です。 —– ボールを向こう側に押し出す動作を学習させた。 報酬は、赤いディスクが落ちた時の縦方向の速度(向こう側が正)とした。結構激しい動きだが、ディスクは向こう側に押し出されている。 前回は、稼働部分をHi […]
二つのリンクをつなげたハンドのリーチングを学習させました。 この時の設定やプログラムの忘備録です。 以下、作成したゲームオブジェクトです。 リーてぃんぐのTargetはシンプルです。cube を作っただけで、Rigid Bodyは作っていません。Box Collidorはついてい […]
自分の回りのマスしか見えないルールで水を見つけるゲームを強化学習用に作りました。 水の場所と壁の位置は毎回変わりますので、どんな配置でも再学習なしに水を見つけることがミッションです。20ステップ以内に水までたどり着けないと力尽きてしまいます。 動画は基本のアルゴリズムであるQ学習 […]
Kerasを使ってLSTMを実装しました。 こちらにまとめました。 02 LSTMをKerasで動かす パルス波の予測
時系列の学習には、リカレントニューラルネットワーク(RNN)を使います。その一つに、Long short-term memory (LSTM)という記憶セルを使うやり方があります。その実装についての忘備録です。 ネットワークとやりたいこと 入出力が1次元で中間層に20個のLSTM […]
NVIDAのグラフィックボードを積んだPCがあるので、kerasやtensorflow をgpuで動かしたいと思っていたのですが、開発環境を作るのがたいへんですね。 バージョンの組み合わせとか、もうおまじないのレシピみたいです。 windowsで何とかできたので覚書。金子邦彦研究 […]