0.5から始める機械学習

Machine Learning, Deep Learning, Computer Vision に関する備忘録

2020-01-01から1年間の記事一覧

【kubernetes】Podのshared memory sizeを変更する

こんにちは 今日はkubernetesにおいてPodのshared memory size(shm)を変更する方法についてまとめます。

Trainsによる実験管理 ~初期設定編~

こんにちは 前回という実験管理ツールの立ち上げについてまとめました。 nodaki.hatenablog.com 今回はその初期設定方法と簡単な使い方についてまとめます。

Trainsによる実験管理 ~サーバー立ち上げ編~

こんにちは みなさんは機械学習/Deep Learningにおいてどのように実験管理をしていますでしょうか? ハイパーパラメーター テスト結果 学習済みモデル ソースコードのバージョン etc. 挙げ始めるときりがないですが、様々な項目を管理する必要があると思いま…

deepopsを使ったGPUクラスター(kubernetes)の構築

今日は学習基盤となるGPUクラスター(kubernetes)をdeepopsを使って簡単に構築する方法についてまとめます。 特に企業勤めでproxy周りの設定が必要なことを想定して、そのあたりの設定についても詳しく書いて行きたいと思います。 deepops deepopsは、NVIDIA…