Trainsによる実験管理 ~初期設定編~
こんにちは
前回という実験管理ツールの立ち上げについてまとめました。
今回はその初期設定方法と簡単な使い方についてまとめます。
初期設定
1. 認証情報の登録
まず認証情報の登録が必要になります。
http://localhost:8080にアクセスし、
右上のPROFILE → Create new credentials
をクリック
すると、アクセスキーとシークレットキーが生成されます。
このアクセスキーとシークレットキーを後ほど使うため、Copy to clipboard
をクリックしコピーしておきましょう。
2. trains-init
Trainsのconfig設定はtrains-init
コマンドを実行することで対話的に設定していきます。
このコマンドを使えるようにTrainsをインストールします。
pip install trains
trains-init
を実行すると認証情報を聞かれるので、さきほどコピーしておいた認証情報をペーストします。
続いて、web, api, file hostのURLを聞かれるので入力していきます。
WEB Host configured to: http//localhost:8000 API Host configured to: http://localhost:8008 File Store Host configured to: http://localhost:8081
以上で設定は完了です。
~/trains.conf
に設定情報が保存されています。
デフォルトでは~/trains.conf
が読み込まれますが、環境変数TRAINS_CONFIG_FILE
にパスを設定することで好きな場所からconfigを読み込めるようになります。
使い方
Trainsをインストールしてわずか2行の追加だけで使えちゃいます。
from trains import Task task = Task.init(project_name="my project", task_name="my task")
これだけでtensorflowではtensorboardでのログ、モデルのsaveなどを自動でキャッチしてTrains Serverに保存していってくれます。
exampleに関しては
trains/examples at master · allegroai/trains · GitHub
にあり、exampleのファイル名とダッシュボードのexampleとが一致しているため、ダッシュボードのデモを見てどんなことができるかを確認するといいと思います。
モデルの保存先設定
モデルやその他ファイルなどの保存先(ローカル、リモートストレージなど)を手動で設定することができます。
デフォルトではローカルに設定される(ダウンロードリンクがローカルパスとなる)ため、ダッシュボードからでは学習を実行した同一PC以外からはダウンロードできなくなります。そのためtrains file serverに設定することをオススメします。
task = Task.init( project_name="my project", task_name="my task", output_uri="http://localhost:8081" )
output_uri
に保存先を指定します。
まとめ
認証情報設定と簡単な使い方についてまとめました。
特にモデルの保存先設定はデフォルトではなくfile serverを指定するようオススメします。