3-6 mlagents-learn
学習を実行するコマンド「mlagents-learn」について見ていく。
mlagents-learnでの学習の実行
「Unity ML-Agents」では、「mlagents-learn」を使って、エージェントの学習を行います。「mlagents-learn」は、「」と「」のパラメータで、学習方法を設定します。
mlagents-learn <学習設定ファイルのパス> --env=<Unityアプリのパス> --run-id=<実行ID>
## mlagents-learnのコマンドライン引数
基本のコマンドライン引数は、次のとおりです。
| コマンドライン引数 | 説明 |
|---|---|
| -h,--help | ヘルプの表示 |
--env=<ENV-PATH> | Unityアプリのパス(デフォルト:Unityエディタ) |
--run-id=<RUN_ID> | 学習結果を識別するための実行ID(デフォルト:ppo) ※デフォルト名はppoだが、強化学習アルゴリズムとは関係なく、フォルダ名の設定になる |
--num-envs=<NUM_ENVS> | Unityインスタンスの起動数(デフォルト:1) |
--results-dir=<RESULTS_DIR> | 出力フォルダ(デフォルト:results) |
--seed=<SEED> | 乱数シード(デフォルト:-1) |
--base-port=<BASE_PORT> | ベースポート(デフォルト:5005) |
| --debug | デバッグ出力 |
--env-args=<ARGS> | 環境引数(デフォルト:None) |
既存モデルが存在する時のコマンドライン引数は、次のとおりです。
| コマンドライン引数 | 説明 |
|---|---|
| --resume | 既存モデルの学習再開 |
| --inference | 既存モデルの推論実行 |
| --force | 既存モデルを上書きして、新規に学習開始 |
--initialize-form=<RUN_ID> | 既存モデルを初期値にして、新規に学習開始 |
画面表示関連のコマンドライン引数は、次のとおりです。
| コマンドライン引数 | 説明 |
|---|---|
--width = <WIDTH> | 画面幅(デフォルト:84) |
--height = <HEIGHT> | 画面高さ(デフォルト:84) |
--quality-level=<QUALITY_LEVEL> | 品質レベル(デフォルト:5、低0~5高) |
--time-scale=<TIME_SCALE> | タイムスケール(デフォルト:20) |
--target-frame-rate=<TARGET_FRAME_RATE> | ターゲットフレームレート(デフォルト:60) |
| --no-graphics | 画面表示なし |
PyTorch関連のコマンドライン
| コマンドライン引数 | 説明 |
|---|---|
--torch-device=<DEVICE> | torch.deviceの設定("cpu"、"cuda"、"cuda:0"など) |