0.5から始める機械学習

Machine Learning, Deep Learning, Computer Vision に関する備忘録

Trainsによる実験管理 ~初期設定編~

こんにちは

前回という実験管理ツールの立ち上げについてまとめました。

nodaki.hatenablog.com

今回はその初期設定方法と簡単な使い方についてまとめます。

初期設定

1. 認証情報の登録

まず認証情報の登録が必要になります。

http://localhost:8080にアクセスし、

右上のPROFILE → Create new credentials をクリック

すると、アクセスキーとシークレットキーが生成されます。

このアクセスキーとシークレットキーを後ほど使うため、Copy to clipboardをクリックしコピーしておきましょう。

2. trains-init

Trainsのconfig設定はtrains-initコマンドを実行することで対話的に設定していきます。

このコマンドを使えるようにTrainsをインストールします。

pip install trains

trains-initを実行すると認証情報を聞かれるので、さきほどコピーしておいた認証情報をペーストします。

続いて、web, api, file hostのURLを聞かれるので入力していきます。

WEB Host configured to: http//localhost:8000
API Host configured to: http://localhost:8008
File Store Host configured to: http://localhost:8081

以上で設定は完了です。

~/trains.confに設定情報が保存されています。

デフォルトでは~/trains.confが読み込まれますが、環境変数TRAINS_CONFIG_FILEにパスを設定することで好きな場所からconfigを読み込めるようになります。

使い方

Trainsをインストールしてわずか2行の追加だけで使えちゃいます。

from trains import Task
task = Task.init(project_name="my project", task_name="my task")

これだけでtensorflowではtensorboardでのログ、モデルのsaveなどを自動でキャッチしてTrains Serverに保存していってくれます。

exampleに関しては

trains/examples at master · allegroai/trains · GitHub

にあり、exampleのファイル名とダッシュボードのexampleとが一致しているため、ダッシュボードのデモを見てどんなことができるかを確認するといいと思います。

モデルの保存先設定

モデルやその他ファイルなどの保存先(ローカル、リモートストレージなど)を手動で設定することができます。

デフォルトではローカルに設定される(ダウンロードリンクがローカルパスとなる)ため、ダッシュボードからでは学習を実行した同一PC以外からはダウンロードできなくなります。そのためtrains file serverに設定することをオススメします。

task = Task.init(
    project_name="my project", 
    task_name="my task",
     output_uri="http://localhost:8081"
)

output_uriに保存先を指定します。

まとめ

認証情報設定と簡単な使い方についてまとめました。

特にモデルの保存先設定はデフォルトではなくfile serverを指定するようオススメします。