3-6 mlagents-learn

学習を実行するコマンド「mlagents-learn」について見ていく。

mlagents-learnでの学習の実行

「Unity ML-Agents」では、「mlagents-learn」を使って、エージェントの学習を行います。「mlagents-learn」は、「」と「」のパラメータで、学習方法を設定します。

mlagents-learn <学習設定ファイルのパス> --env=<Unityアプリのパス> --run-id=<実行ID>

##　mlagents-learnのコマンドライン引数

基本のコマンドライン引数は、次のとおりです。

コマンドライン引数	説明
-h,--help	ヘルプの表示
--env=`<ENV-PATH>`	Unityアプリのパス（デフォルト：Unityエディタ）
--run-id=`<RUN_ID>`	学習結果を識別するための実行ID（デフォルト：ppo） ※デフォルト名はppoだが、強化学習アルゴリズムとは関係なく、フォルダ名の設定になる
--num-envs=`<NUM_ENVS>`	Unityインスタンスの起動数（デフォルト：1）
--results-dir=`<RESULTS_DIR>`	出力フォルダ(デフォルト：results)
--seed=`<SEED>`	乱数シード(デフォルト：-1)
--base-port=`<BASE_PORT>`	ベースポート(デフォルト：5005)
--debug	デバッグ出力
--env-args=`<ARGS>`	環境引数（デフォルト：None）

既存モデルが存在する時のコマンドライン引数は、次のとおりです。

画面表示関連のコマンドライン引数は、次のとおりです。

コマンドライン引数	説明
--width = `<WIDTH>`	画面幅（デフォルト：84）
--height = `<HEIGHT>`	画面高さ（デフォルト：84）
--quality-level=`<QUALITY_LEVEL>`	品質レベル（デフォルト：5、低0~5高）
--time-scale=`<TIME_SCALE>`	タイムスケール（デフォルト：20）
--target-frame-rate=`<TARGET_FRAME_RATE>`	ターゲットフレームレート（デフォルト：60）
--no-graphics	画面表示なし

PyTorch関連のコマンドライン

コマンドライン引数	説明
--torch-device=`<DEVICE>`	torch.deviceの設定（"cpu"、"cuda"、"cuda:0"など）