-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
code #2
Comments
@songbohui 你好,感谢关注LaDiC! 关于对于超参数的调整,我们有以下建议:
感谢您的建议!我们后续也会更新一版config.py |
我已经尝试修改了,我输出了每个batch后的loss。发现在15轮之后,loss基本就固定10左右,不变化了,分数也稳定在20+左右,请问您遇到过吗?或者怎么解决它?感谢! |
你好! loss为10是相对正常的,我们的模型大概为8-9左右。尽管loss相对平稳了,也建议您继续训练下去,可以参考diffusion model的loss下降趋势是什么样的? - 小胖的AI图像复原的回答 - 知乎。建议至少训练60个epoch,考虑到不同batch size以及learning rate的影响可以尝试增多训练epoch数如120。 此外,我们也更新了一些代码中的训练和测试超参默认值,你可以check一下。 |
感谢您的回答!我看您更新了config.py和coco_eval.py文件,我再次尝试一下。 |
我现在想复现您在论文中基于COCO2014数据集的图像描述任务,我发现您提供的config.py文件,epoch与seqlen分别是10和80,这好像是拓展任务段落描述的参数,请问,我想实现基于COCO2014数据集的图像描述任务,都需要修改那些地方?
实验过程:我直接将config.py文件中的epoch和seqlen分别修改为论文中提到的的60和24,最后B-4结果只有24.9%。可能还需要修改其他地方,我并不知道,希望你看到能回复一下,谢谢!
The text was updated successfully, but these errors were encountered: