強化学習の本を書きました。2021/11/20に発売される予定です。
(Amazon 予約はこちらから)

【目次】は以下のようになります。
1章   強化学習の位置づけ
2章   Pythonの環境構築
3章   教師あり学習
4章   強化学習の問題設定
5章   基本のQ学習:tableQ
6章   ニューラルネットQ学習: netQ
7章   経験再生を取り入れたQ学習: replayQ、targetQ
8章   改良と工夫
講座A   Visual Studio Codeのインストールと使い方
講座B   Pythonの基本

ニューラルネットを使ったQ学習の学習の成果の動画はこちらです。

ロボットは2マス先までしか見えなく、マップは毎回ランダムに変わりますが、クリスタルを探して回収するアルゴリズムを自ら学習します。