update nsga2 search with pymoo_v0.50

open-mmlab · Dec 2, 2022 · b3a0069 · b3a0069
1 parent bbb58f1
commit b3a0069
Show file tree

Hide file tree

Showing 22 changed files with 2,675 additions and 4 deletions.
diff --git a/configs/nas/mmcls/spos/spos_shufflenet_search_nsga2_predictor_8xb128_in1k.py b/configs/nas/mmcls/spos/spos_shufflenet_search_nsga2_predictor_8xb128_in1k.py
@@ -0,0 +1,22 @@
+_base_ = ['./spos_shufflenet_supernet_8xb128_in1k.py']
+
+model = dict(norm_training=True)
+
+train_cfg = dict(
+    _delete_=True,
+    type='mmrazor.NSGA2SearchLoop',
+    dataloader=_base_.val_dataloader,
+    evaluator=_base_.val_evaluator,
+    max_epochs=20,
+    num_candidates=50,
+    top_k=10,
+    num_mutation=25,
+    num_crossover=25,
+    mutate_prob=0.1,
+    constraints_range=dict(flops=(0., 360.)),
+    predictor_cfg=dict(
+        type='mmrazor.MetricPredictor',
+        encoding_type='normal',
+        train_samples=2,
+        handler_cfg=dict(type='mmrazor.GaussProcessHandler')),
+)
diff --git a/mmrazor/engine/__init__.py b/mmrazor/engine/__init__.py
@@ -4,12 +4,13 @@
 from .runner import (AutoSlimValLoop, DartsEpochBasedTrainLoop,
                      DartsIterBasedTrainLoop, EvolutionSearchLoop,
                      GreedySamplerTrainLoop, SelfDistillValLoop,
-                     SingleTeacherDistillValLoop, SlimmableValLoop)
+                     SingleTeacherDistillValLoop, SlimmableValLoop,
+                     NSGA2SearchLoop)
 
 __all__ = [
     'SeparateOptimWrapperConstructor', 'DumpSubnetHook',
     'SingleTeacherDistillValLoop', 'DartsEpochBasedTrainLoop',
     'DartsIterBasedTrainLoop', 'SlimmableValLoop', 'EvolutionSearchLoop',
     'GreedySamplerTrainLoop', 'AutoSlimValLoop', 'EstimateResourcesHook',
-    'SelfDistillValLoop'
+    'SelfDistillValLoop', 'NSGA2SearchLoop'
 ]
diff --git a/mmrazor/engine/runner/__init__.py b/mmrazor/engine/runner/__init__.py
@@ -3,11 +3,13 @@
 from .darts_loop import DartsEpochBasedTrainLoop, DartsIterBasedTrainLoop
 from .distill_val_loop import SelfDistillValLoop, SingleTeacherDistillValLoop
 from .evolution_search_loop import EvolutionSearchLoop
+from .nsganetv2_search_loop import NSGA2SearchLoop
 from .slimmable_val_loop import SlimmableValLoop
 from .subnet_sampler_loop import GreedySamplerTrainLoop
 
 __all__ = [
     'SingleTeacherDistillValLoop', 'DartsEpochBasedTrainLoop',
     'DartsIterBasedTrainLoop', 'SlimmableValLoop', 'EvolutionSearchLoop',
-    'GreedySamplerTrainLoop', 'AutoSlimValLoop', 'SelfDistillValLoop'
+    'GreedySamplerTrainLoop', 'AutoSlimValLoop', 'SelfDistillValLoop',
+    'NSGA2SearchLoop'
 ]
diff --git a/mmrazor/engine/runner/attentive_search_loop.py b/mmrazor/engine/runner/attentive_search_loop.py
@@ -0,0 +1,56 @@
+# Copyright (c) OpenMMLab. All rights reserved.
+from mmrazor.registry import LOOPS
+from .evolution_search_loop import EvolutionSearchLoop
+
+
+@LOOPS.register_module()
+class AttentiveSearchLoop(EvolutionSearchLoop):
+    """Loop for evolution searching with attentive tricks from AttentiveNAS.
+
+    Args:
+        runner (Runner): A reference of runner.
+        dataloader (Dataloader or dict): A dataloader object or a dict to
+            build a dataloader.
+        evaluator (Evaluator or dict or list): Used for computing metrics.
+        max_epochs (int): Total searching epochs. Defaults to 20.
+        max_keep_ckpts (int): The maximum checkpoints of searcher to keep.
+            Defaults to 3.
+        resume_from (str, optional): Specify the path of saved .pkl file for
+            resuming searching.
+        num_candidates (int): The length of candidate pool. Defaults to 50.
+        top_k (int): Specify top k candidates based on scores. Defaults to 10.
+        num_mutation (int): The number of candidates got by mutation.
+            Defaults to 25.
+        num_crossover (int): The number of candidates got by crossover.
+            Defaults to 25.
+        mutate_prob (float): The probability of mutation. Defaults to 0.1.
+        flops_range (tuple, optional): It is used for screening candidates.
+        resource_estimator_cfg (dict): The config for building estimator, which
+            is be used to estimate the flops of sampled subnet. Defaults to
+            None, which means default config is used.
+        score_key (str): Specify one metric in evaluation results to score
+            candidates. Defaults to 'accuracy_top-1'.
+        init_candidates (str, optional): The candidates file path, which is
+            used to init `self.candidates`. Its format is usually in .yaml
+            format. Defaults to None.
+    """
+
+    def _init_pareto(self):
+        # TODO (gaoyang): Fix apis with mmrazor2.0
+        for k, v in self.constraints.items():
+            if not isinstance(v, (list, tuple)):
+                self.constraints[k] = (0, v)
+
+        assert len(self.constraints) == 1, 'Only accept one kind constrain.'
+        self.pareto_candidates = dict()
+        constraints = list(self.constraints.items())[0]
+        discretize_step = self.pareto_mode['discretize_step']
+        ds = discretize_step
+        # find the left bound
+        while ds + 0.5 * discretize_step < constraints[1][0]:
+            ds += discretize_step
+        self.pareto_candidates[ds] = []
+        # find the right bound
+        while ds - 0.5 * discretize_step < constraints[1][1]:
+            self.pareto_candidates[ds] = []
+            ds += discretize_step
diff --git a/mmrazor/engine/runner/evolution_search_loop.py b/mmrazor/engine/runner/evolution_search_loop.py
@@ -96,6 +96,7 @@ def __init__(self,
         self.crossover_prob = crossover_prob
         self.max_keep_ckpts = max_keep_ckpts
         self.resume_from = resume_from
+        self.trade_off = dict(max_score_key=40)
 
         if init_candidates is None:
             self.candidates = Candidates()

diff --git a/mmrazor/engine/runner/nsganetv2_search_loop.py b/mmrazor/engine/runner/nsganetv2_search_loop.py
@@ -0,0 +1,253 @@
+# Copyright (c) OpenMMLab. All rights reserved.
+import os.path as osp
+from copy import deepcopy
+
+import numpy as np
+from mmengine import fileio
+from pymoo.util.nds.non_dominated_sorting import NonDominatedSorting
+
+from mmrazor.models.task_modules import (GeneticOptimizer,
+                                         NSGA2Optimizer,
+                                         AuxiliarySingleLevelProblem,
+                                         SubsetProblem)
+from mmrazor.registry import LOOPS
+from mmrazor.structures import Candidates, export_fix_subnet
+from .attentive_search_loop import AttentiveSearchLoop
+from .utils.high_tradeoff_points import HighTradeoffPoints
+
+# from pymoo.algorithms.moo.nsga2 import NSGA2 as NSGA2Optimizer
+# from pymoo.algorithms.soo.nonconvex.ga import GA as GeneticOptimizer
+# from pymoo.optimize import minimize
+
+
+@LOOPS.register_module()
+class NSGA2SearchLoop(AttentiveSearchLoop):
+    """Evolution search loop with NSGA2 optimizer."""
+
+    def run_epoch(self) -> None:
+        """Iterate one epoch.
+
+        Steps:
+            0. Collect archives and predictor.
+            1. Sample some new candidates from the supernet.Then Append them
+                to the candidates, Thus make its number equal to the specified
+                number.
+            2. Validate these candidates(step 1) and update their scores.
+            3. Pick the top k candidates based on the scores(step 2), which
+                will be used in mutation and crossover.
+            4. Implement Mutation and crossover, generate better candidates.
+        """
+        archive = Candidates()
+        for subnet, score, flops in zip(self.candidates.subnets,
+                                        self.candidates.scores,
+                                        self.candidates.resources('flops')):
+            if self.trade_off['max_score_key'] != 0:
+                score = self.trade_off['max_score_key'] - score
+            archive.append(subnet)
+            archive.set_score(-1, score)
+            archive.set_resource(-1, flops, 'flops')
+
+        self.sample_candidates(random=(self._epoch == 0), archive=archive)
+        self.update_candidates_scores()
+
+        scores_before = self.top_k_candidates.scores
+        self.runner.logger.info(f'top k scores before update: '
+                                f'{scores_before}')
+
+        self.candidates.extend(self.top_k_candidates)
+        self.sort_candidates()
+        self.top_k_candidates = Candidates(self.candidates[:self.top_k])
+
+        scores_after = self.top_k_candidates.scores
+        self.runner.logger.info(f'top k scores after update: '
+                                f'{scores_after}')
+
+        mutation_candidates = self.gen_mutation_candidates()
+        self.candidates_mutator_crossover = Candidates(mutation_candidates)
+        crossover_candidates = self.gen_crossover_candidates()
+        self.candidates_mutator_crossover.extend(crossover_candidates)
+
+        assert len(self.candidates_mutator_crossover
+                   ) <= self.num_candidates, 'Total of mutation and \
+            crossover should be less than the number of candidates.'
+
+        self.candidates = self.candidates_mutator_crossover
+        self._epoch += 1
+
+    def sample_candidates(self, random: bool = True, archive=None) -> None:
+        if random:
+            super().sample_candidates()
+        else:
+            candidates = self.sample_candidates_with_nsga2(
+                archive, self.num_candidates)
+            new_candidates = []
+            candidates_resources = []
+            for candidate in candidates:
+                is_pass, result = self._check_constraints(candidate)
+                if is_pass:
+                    new_candidates.append(candidate)
+                    candidates_resources.append(result)
+            self.candidates = Candidates(new_candidates)
+
+            if len(candidates_resources) > 0:
+                self.candidates.update_resources(
+                    candidates_resources,
+                    start=len(self.candidates.data)-len(candidates_resources))
+
+    def sample_candidates_with_nsga2(self, archive: Candidates, num_candidates):
+        """Searching for candidates with high-fidelity evaluation."""
+        F = np.column_stack((archive.scores, archive.resources('flops')))
+        front_index = NonDominatedSorting().do(F, only_non_dominated_front=True)
+
+        fronts = np.array(archive.subnets)[front_index]
+        fronts = np.array([self.predictor.model2vector(cand) for cand in fronts])
+        fronts = self.predictor.preprocess(fronts)
+
+        # initialize the candidate finding optimization problem
+        problem = AuxiliarySingleLevelProblem(self, len(fronts[0]))
+
+        # initiate a multi-objective solver to optimize the problem
+        method = NSGA2Optimizer(
+            pop_size=4,
+            sampling=fronts,  # initialize with current nd archs
+            eliminate_duplicates=True,
+            logger=self.runner.logger)
+
+        # # kick-off the search
+        method.initialize(problem, n_gen=2, verbose=True)
+        result = method.solve()
+
+        # check for duplicates
+        check_list = []
+        for x in result['pop'].get('X'):
+            assert x is not None
+            check_list.append(self.predictor.vector2model(x))
+
+        not_duplicate = np.logical_not(
+            [x in archive.subnets for x in check_list])
+
+        # extra process after nsga2 search
+        sub_problem = SubsetProblem(result['pop'][not_duplicate].get('F')[:, 1],
+                                    F[front_index, 1],
+                                    num_candidates)
+        sub_method = GeneticOptimizer(pop_size=num_candidates,
+                                      eliminate_duplicates=True)
+        sub_method.initialize(sub_problem, n_gen=4, verbose=False)
+        indices = sub_method.solve()['X']
+
+        candidates = Candidates()
+        pop = result['pop'][not_duplicate][indices]
+        for x in pop.get('X'):
+            candidates.append(self.predictor.vector2model(x))
+
+        return candidates
+
+    def sort_candidates(self) -> None:
+        """Support sort candidates in single and multiple-obj optimization."""
+        assert self.trade_off is not None, (
+            '`self.trade_off` is required when sorting candidates in '
+            'NSGA2SearchLoop. Got self.trade_off is None.')
+        ratio = self.trade_off.get('ratio', 1)
+        multiple_obj_score = []
+        for score, flops in zip(self.candidates.scores,
+                                self.candidates.resources('flops')):
+            multiple_obj_score.append((score, flops))
+        multiple_obj_score = np.array(multiple_obj_score)
+        max_score_key = self.trade_off.get('max_score_key', 100)
+        if max_score_key != 0:
+            multiple_obj_score[:, 0] = \
+                max_score_key - multiple_obj_score[:, 0]
+        sort_idx = np.argsort(multiple_obj_score[:, 0])
+        F = multiple_obj_score[sort_idx]
+        dm = HighTradeoffPoints(ratio, n_survive=len(multiple_obj_score))
+        candidate_index = dm.do(F)
+        candidate_index = sort_idx[candidate_index]
+        self.candidates = [self.candidates[idx] for idx in candidate_index]
+
+    def _save_searcher_ckpt(self, archive=[]):
+        """Save searcher ckpt, which is different from common ckpt.
+
+        It mainly contains the candicate pool, the top-k candicates with scores
+        and the current epoch.
+        """
+        if self.runner.rank == 0:
+            rmse, rho, tau = 0, 0, 0
+            if len(archive) > 0:
+                top1_err_pred = self.fit_predictor(archive)
+                rmse, rho, tau = self.predictor.get_correlation(
+                    top1_err_pred, np.array([x[1] for x in archive]))
+
+            save_for_resume = dict()
+            save_for_resume['_epoch'] = self._epoch
+            for k in ['candidates', 'top_k_candidates']:
+                save_for_resume[k] = getattr(self, k)
+            fileio.dump(
+                save_for_resume,
+                osp.join(self.runner.work_dir,
+                         f'search_epoch_{self._epoch}.pkl'))
+
+            correlation_str = 'fitting '
+            # correlation_str += f'{self.predictor.type}: '
+            correlation_str += f'RMSE = {rmse:.4f}, '
+            correlation_str += f'Spearmans Rho = {rho:.4f}, '
+            correlation_str += f'num_candidatesendalls Tau = {tau:.4f}'
+
+            self.pareto_mode = False
+            if self.pareto_mode:
+                step_str = '\n'
+                for step, candidates in self.pareto_candidates.items():
+                    if len(candidates) > 0:
+                        step_str += f'step: {step}: '
+                        step_str += f'{candidates[0][self.score_key]}\n'
+                self.runner.logger.info(
+                    f'Epoch:[{self._epoch + 1}/{self._max_epochs}], '
+                    f'top1_score: {step_str} '
+                    f'{correlation_str}')
+            else:
+                self.runner.logger.info(
+                    f'Epoch:[{self._epoch + 1}/{self._max_epochs}], '
+                    f'top1_score: {self.top_k_candidates.scores[0]} '
+                    f'{correlation_str}')
+
+    def fit_predictor(self, candidates):
+        """anticipate testfn training(err rate)."""
+        inputs = [export_fix_subnet(x) for x in candidates.subnets]
+        inputs = np.array([self.predictor.model2vector(x) for x in inputs])
+
+        targets = np.array([x[1] for x in candidates])
+
+        if not self.predictor.pretrained:
+            self.predictor.fit(inputs, targets)
+
+        metrics = self.predictor.predict(inputs)
+        if self.max_score_key != 0:
+            for i in range(len(metrics)):
+                metrics[i] = self.max_score_key - metrics[i]
+        return metrics
+
+    def finetune_step(self, model):
+        """fintune before candidates evaluation."""
+        # TODO (gaoyang): update with 2.0 version.
+        self.runner.logger.info('start finetuning...')
+        model.train()
+        while self._fintune_epoch < self._max_finetune_epochs:
+            self.runner.call_hook('before_train_epoch')
+            for idx, data_batch in enumerate(self.dataloader):
+                self.runner.call_hook(
+                    'before_train_iter',
+                    batch_idx=idx,
+                    data_batch=data_batch)
+
+                outputs = model.train_step(
+                    data_batch, optim_wrapper=self.optim_wrapper)
+
+                self.runner.call_hook(
+                    'after_train_iter',
+                    batch_idx=idx,
+                    data_batch=data_batch,
+                    outputs=outputs)
+
+            self.runner.call_hook('after_train_epoch')
+            self._finetune_epoch += 1
+
+        model.eval()