メインコンテンツまでスキップ

3-6 mlagents-learn

学習を実行するコマンド「mlagents-learn」について見ていく。

mlagents-learnでの学習の実行

「Unity ML-Agents」では、「mlagents-learn」を使って、エージェントの学習を行います。「mlagents-learn」は、「」と「」のパラメータで、学習方法を設定します。

mlagents-learn <学習設定ファイルのパス> --env=<Unityアプリのパス> --run-id=<実行ID>


## mlagents-learnのコマンドライン引数

基本のコマンドライン引数は、次のとおりです。

コマンドライン引数説明
-h,--helpヘルプの表示
--env=<ENV-PATH>Unityアプリのパス(デフォルト:Unityエディタ)
--run-id=<RUN_ID>学習結果を識別するための実行ID(デフォルト:ppo)

※デフォルト名はppoだが、強化学習アルゴリズムとは関係なく、フォルダ名の設定になる
--num-envs=<NUM_ENVS>Unityインスタンスの起動数(デフォルト:1)
--results-dir=<RESULTS_DIR>出力フォルダ(デフォルト:results)
--seed=<SEED>乱数シード(デフォルト:-1)
--base-port=<BASE_PORT>ベースポート(デフォルト:5005)
--debugデバッグ出力
--env-args=<ARGS>環境引数(デフォルト:None)


既存モデルが存在する時のコマンドライン引数は、次のとおりです。

コマンドライン引数説明
--resume既存モデルの学習再開
--inference既存モデルの推論実行
--force既存モデルを上書きして、新規に学習開始
--initialize-form=<RUN_ID>既存モデルを初期値にして、新規に学習開始


画面表示関連のコマンドライン引数は、次のとおりです。

コマンドライン引数説明
--width = <WIDTH>画面幅(デフォルト:84)
--height = <HEIGHT>画面高さ(デフォルト:84)
--quality-level=<QUALITY_LEVEL>品質レベル(デフォルト:5、低0~5高)
--time-scale=<TIME_SCALE>タイムスケール(デフォルト:20)
--target-frame-rate=<TARGET_FRAME_RATE>ターゲットフレームレート(デフォルト:60)
--no-graphics画面表示なし


PyTorch関連のコマンドライン

コマンドライン引数説明
--torch-device=<DEVICE>torch.deviceの設定("cpu"、"cuda"、"cuda:0"など)