模倣学習
「模倣学習」は、教師となる人間の一連の行動(「デモ」と呼びます)を模倣することで、タスクを攻略する学習法です。報酬を得る ことが難しいゲームでも、人間の行動を模倣することで、学習を早く進めることができます。
模倣学習の学習環境の準備
「4-6 Curiosity」で作成した学習環境で「模倣学習」を学習します
デモの記録
①エージェントに「DemonstrationRecorder」
RecordをチェックしてUnityエディタを実行すると、「Demonstration Directory」でデモの保存先を指定できます。デフォルトでは「Assets/Demonstrations/」
| 項目 | 説明 |
|---|---|
| Record | デモファイルを保存するかどうか |
| Num Steps To Record | 記録するステップ数(0は無制限) |
| Demonstration Name | デモファイル名 |
| Demonstration Directory | デモファイルを保存するフォルダ(デフォルトは「Demonstrations/」) |
②「Unityエディタ」上で、ヒューリスティックモードで実行
「Behavior Parameters」にモデルが指定されている場合は、「Behavior Type」に「Heuristic Only」を指定してください。
③キー操作で5周回った後、Stopボタンで終了
「Assets/Demonstrations」に「ImitationEx.demo」が生成されています
④ProjectWindowで「ImitationEx.demo」を選択
Inspector Windowsにでもファイルの情報が表示されます。