Implementation of Lookahead optimizer and RAdam.

Lookahead Optimizer

Pytorch implementation of Lookahead Optimizer

RAdam Optimizer

Lookahead

from Lookahead import Lookahead
optim = torch.optim.Adam(model.parameters(), lr=0.001 )
optimizer = Lookahead( optim, alpha= 0.6 , k = 10)

RAdam

from RAdam import RAdam
optim = RAdam(model.parameters(), lr=1e-3, weight_decay=1e-4)

Seed / Optimizer	SGD	Adamw	Lookahead with SGD	RAdam	Lookahead with Radam
42	93.31	92.78	93.34	93.01	93.21
17	93.30	92.77	93.36	93.02	93.20
11	93.33	92.78	93.40	93.03	93.14