Trainerクラスの実装 #33

Geson-anko · 2023-01-22T07:24:27Z

タスク内容

学習用の設定で初期化され、Dreamerクラスを受け取って学習させるTrainerクラスを実装します。

提案内容

Note 2023/1/27: 途中まで作りかけているtrainerに書き足します。

コンストラクタ__init__では、Trainerの設定に関わる項目を受け取る。
- 学習ループに関わる変数(episode数や経験を集めるインターバル数など)
- 任意のモデルの学習に関わる変数(gradient_clip_valなど)
- 演算デバイスや精度に関わる変数(device, dtype)
- tensorboardへのロガー
- モデルの保存に関わる項目 (checkpoint, checkpointを記録する変数など)
- hydraのDictConfigオブジェクト
学習フローの実装メソッドfit(env,model) -> log_metricsの実装
学習対象のDreamerの内部処理に必要な属性(device, dtype, tensorboard logger)を付与するメソッドの実装
checkpointを保存するメソッド及びロードするメソッド。

達成条件

コンストラクタが実装された
fitメソッドが実装された。
学習対象のモデルに属性を付与するメソッドが実装された
checkpointを保存するメソッドが実装された
checkpointを読み込むメソッドが実装された。
Dreamerの学習が実行できる。
Tensorboardでその学習結果を見ることができる
学習の途中経過をコンソールに出力できる
学習済のモデルを読み込んで評価関数を呼び出すメソッドが存在する。

参考

pytorch-lightningのTrainerクラス

疑似コード

class Trainer:
    def __init__(self, setting1: int = 1, setting2:str = "abc", ...):
        self.__dict__.update(locals()) # これによって引数を全て属性に付与できる
        
    def save_checkpoint(model) -> None:
        """モデルを保存するメソッド"""
    def load_checkpoint(model) -> None:
        """パラメータをロードするメソッド"""
    def set_attributes_to_model(model):
        """モデルに属性を付与するメソッド"""
    
    def fit(env, replay_buffer, model) -> log_metrics:
        self.set_attributes_to_model(model)
        
        model.to(self.device, self.dtype)
        
        self.load_checkpoint(model) # checkpointがあればロード
        
        world_optimizer, controller_optimizer = model.configure_optimizer()
        
        for episode in range(self.num_episodes):
            model.collect_experiences(model, world_optimizer, controller_optimizer)
            
            for interval in range(self.collect_interval):
                experiences = replay_buffer.sample()
                
                loss_dict, experiences = model.world_training_step(experiences)
                # Update world model by returned loss
                # log loss_dict to console.
                
                loss_dict, experiences = model.controller_training_step(experiences)
                # Update controller model by returned loss
                # log loss_dict to console.
                
                if current_step % self.evaluation_interval == 0:
                    loss_dict = model.evaluation_step(env)
                    # log loss_dict to console
                    
                if current_step % self.model_saving_interval == 0:
                    self.save_checkpoint(model)
        metric_dict = model.evaluation_step(env)
        self.save_checkpoint(model)
        return metric_dict

    def evaluation(self, env, model) -> metric_dict:
        """このメソッドは評価のみを実行したいときに使用します。"""
        self.load_checkpoint(model)
        return model.evaluation_step(env)

The text was updated successfully, but these errors were encountered:

Geson-anko · 2023-01-27T12:47:54Z

プログレスバーとしてtqdmを使用する

Geson-anko self-assigned this Jan 22, 2023

Geson-anko added the enhancement New feature or request label Jan 22, 2023

Geson-anko modified the milestones: 実験を行う, 問題設定が明確である, 実験準備が整う Jan 22, 2023

Geson-anko mentioned this issue Jan 25, 2023

Dreamerクラスの実装 #47

Merged

5 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Trainerクラスの実装 #33

Trainerクラスの実装 #33

Geson-anko commented Jan 22, 2023 •

edited

Loading

Geson-anko commented Jan 27, 2023

Trainerクラスの実装 #33

Trainerクラスの実装 #33

Comments

Geson-anko commented Jan 22, 2023 • edited Loading

タスク内容

提案内容

達成条件

参考

疑似コード

Geson-anko commented Jan 27, 2023

Geson-anko commented Jan 22, 2023 •

edited

Loading