ハンドロンという過去に制作したロボットの動きを強化学習で作りました。その忘備録になります。 ハンドロンとは ハンドロンは、昔作った卓球ボールを打ち返すロボットです。 この時は、ボールを打つ動作はプログラムで作成しておき、その打つ動作を発動させるタイミングを強化学習で調節させました […]
エアホッケーを目指したロボットの実験のの忘備録です。 —– ボールを向こう側に押し出す動作を学習させた。 報酬は、赤いディスクが落ちた時の縦方向の速度(向こう側が正)とした。結構激しい動きだが、ディスクは向こう側に押し出されている。 前回は、稼働部分をHi […]
二つのリンクをつなげたハンドのリーチングを学習させました。 この時の設定やプログラムの忘備録です。 以下、作成したゲームオブジェクトです。 リーてぃんぐのTargetはシンプルです。cube を作っただけで、Rigid Bodyは作っていません。Box Collidorはついてい […]
物心ついたころから、ノートパソコンはThinkPad しか買ったことがありません。 キーボードの真ん中の赤いぽっちこと「トラックポイント」がないと、 生きていけません。 トラックポイントがないPCを使うときには、ThinkPadの外付けキーボードを使います。 ところがこのキーボー […]
2次元データの分類をまとめました。 下をクリックするとColaboratoryで開きます。 Colaboratory ニューラルネット、サポートベクトルマシンで分類しました。
1次元データの回帰をまとめました。 下をクリックするとColaboratoryで開きます。 Colaboratory 線形回帰、多項式回帰、ニューラルネット、ガウス過程回帰で試しました。
2次元データの表示の時に、よく調べるポイントである、 成分のカラー表示、 等高線、surface、マチ針表示をまとめました。 colaboratoryで表示 HTMLで表示
1次元データのプロットや棒グラフの仕方をまとめました。 colabratoryで表示 HTMLで表示 データ点とフィッティング関数の表示 stdの表示
Tensorflow を強化学習でversion2.1を使うとversion1.12よりも遅くなるので原因を確認しました。 結論から述べますと、version2.1は、バッチで学習させるときにはversion1.12よりも若干速いのですが、データを1つづつに分けて学習させる場合で […]
しばらくブログを更新していなかったのですが、 ずっと強化学習のシミュレーションにはまっていました。 動画は、普通の強化学習では解けないT型の迷路をアルゴリズムが解いているところです。普通と違う点は、ゴールが二つあるというところです。 どちらか一つのゴールに行くと強制的にスタート地 […]