月: 2020年11月

Ｔ迷路、メモリー付き強化学習

しばらくブログを更新していなかったのですが、ずっと強化学習のシミュレーションにはまっていました。動画は、普通の強化学習では解けないＴ型の迷路をアルゴリズムが解いているところです。普通と違う点は、ゴールが二つあるというところです。どちらか一つのゴールに行くと強制的にスタート地 […]