強化学習 | M-note　プログラムと電子工作

2022年11月20日コメント(0)

【ML-Agents】Deep Robot Tennis リリースまでの覚書

ML-Agents を使ったゲームをリリースしようと、ここ知らばくUnityばかりしていましたが、ようやくリリースすることができました。 Google Play のこちらからダウンロードできます。以下、苦労した点の覚書です。まだ、Unityに慣れていないこともあり、もっとよい対 […]

2022年7月30日コメント(0)

【ダイエット】強化学習的ダイエット方法　2か月で8キロ減　まだ下がっている

このブログを読んでくれている皆さんもそうだと思いますが、僕はこれまでにいろいろなダイエットに挑戦し、ことごとく失敗してきました。たまにうまく目標体重まで減らせることもあったのですが、そのあとで、かならずリバウンドしてしまっていました。年齢が上がるとどんどん痩せにくくなり、最近 […]

2022年4月16日コメント(0)

【ML-Agents】ピンポン玉を打ち返すロボット動作を強化学習で作る

ハンドロンという過去に制作したロボットの動きを強化学習で作りました。その忘備録になります。ハンドロンとはハンドロンは、昔作った卓球ボールを打ち返すロボットです。この時は、ボールを打つ動作はプログラムで作成しておき、その打つ動作を発動させるタイミングを強化学習で調節させました […]

2022年4月12日コメント(0)

【ML-Agents】エアホッケーロボットの動きを強化学習で作る

エアホッケーを目指したロボットの実験のの忘備録です。 —– ボールを向こう側に押し出す動作を学習させた。報酬は、赤いディスクが落ちた時の縦方向の速度（向こう側が正）とした。結構激しい動きだが、ディスクは向こう側に押し出されている。前回は、稼働部分をHi […]

2022年4月8日コメント(0)

【ML-Agents】2リンクハンドのリーチングを強化学習

二つのリンクをつなげたハンドのリーチングを学習させました。この時の設定やプログラムの忘備録です。以下、作成したゲームオブジェクトです。リーてぃんぐのTargetはシンプルです。cube を作っただけで、Rigid Bodyは作っていません。Box Collidorはついてい […]

2022年3月6日コメント(0)

【ML-Agents】Unityの自作環境で強化学習をはじめる最小限の手続き

Unity ML-Agents とは、Unityで強化学習をできるようにするUnityのプラグインです。強化学習の「環境」をUnityで動かし、「エージェント」はPython側で動かし、両者を通信させながらエージェントを学習させることができます。 ML-Agents のExamp […]

2021年10月27日コメント(0)

書籍「強化学習を学びたい人が最初に読む本」が出版されます。

強化学習の本を書きました。2021/11/20に発売される予定です。 (Amazon 予約はこちらから) 【目次】は以下のようになります。 1章強化学習の位置づけ 2章 Pythonの環境構築 3章教師あり学習 4章強化学習の問題設定 5章基本のQ学習 […]

2020年12月31日コメント(0)

10 q, qnet, gru/lstm のパフォーマンスチェック

q, qnet, gru, lstm のコーディングに間違いはないのでしょうか？その確認をするためには、Q値が正しい値に収束するかをチェックすることが大切です。また、短期記憶ユニット(gru/lstm)の短期記憶の能力はどれくらいなのでしょうか。定量的に知りたいです。このよう […]

2020年12月28日コメント(0)

09 短期記憶(LSTM/GRU)で強化学習をパワーアップ

LSTM/GRUを使ったエージェント、agt_lstm, agt_gru の解説です。 LSTMを取り入れたネットワーク構造それではqnet にどのようにLSTMを組み込むのが良いのでしょうか。先行研究として、DQNのネットワークの出力層の手前の全結合層をLSTMに置き換えた […]

2020年11月17日コメント(0)

08 短期記憶の必要性、RNN, LSTM, GRU

短期記憶を取り入れた強化学習を説明します。ここからは、一般的な強化学習の話以外に、筆者独自の考えも書いていきます。なぜ短期記憶が必要なのか心理学では、記憶を感覚記憶、短期記憶、長期記憶に分類します。短期記憶とは、数十秒程度しか保持できない記憶とも言われていますが、ここでは、最 […]

月	火	水	木	金	土	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

ブログ

「強化学習」カテゴリーの記事一覧

【ML-Agents】Deep Robot Tennis リリースまでの覚書

【ダイエット】強化学習的ダイエット方法　2か月で8キロ減　まだ下がっている

【ML-Agents】ピンポン玉を打ち返すロボット動作を強化学習で作る

【ML-Agents】エアホッケーロボットの動きを強化学習で作る

【ML-Agents】2リンクハンドのリーチングを強化学習

【ML-Agents】Unityの自作環境で強化学習をはじめる最小限の手続き

書籍「強化学習を学びたい人が最初に読む本」が出版されます。

10 q, qnet, gru/lstm のパフォーマンスチェック

09 短期記憶(LSTM/GRU)で強化学習をパワーアップ

08 短期記憶の必要性、RNN, LSTM, GRU

カテゴリー

ブログ

「強化学習」カテゴリーの記事一覧

【ML-Agents】Deep Robot Tennis リリースまでの覚書

【ダイエット】強化学習的ダイエット方法 2か月で8キロ減 まだ下がっている

【ML-Agents】ピンポン玉を打ち返すロボット動作を強化学習で作る

【ML-Agents】エアホッケーロボットの動きを強化学習で作る

【ML-Agents】2リンクハンドのリーチングを強化学習

【ML-Agents】Unityの自作環境で強化学習をはじめる最小限の手続き

書籍「強化学習を学びたい人が最初に読む本」が出版されます。

10 q, qnet, gru/lstm のパフォーマンスチェック

09 短期記憶(LSTM/GRU)で強化学習をパワーアップ

08 短期記憶の必要性、RNN, LSTM, GRU

カテゴリー

【ダイエット】強化学習的ダイエット方法　2か月で8キロ減　まだ下がっている