拿大蒙特利尔的两所大学的工作,主要是验证继续预训练中,如何warmup你的模型。 写在notion上了,懒得搬运。链接如下(可能需要翻墙) https://daffodil-square-501.notion.site/Continual-Pre-Training-of-Large-Language-Models-How-to-re-warm-up-your-model-69877d14c7884c3a903205da90b0695a?pvs=4 分类: 论文 0 条评论 发表回复 取消回复您的电子邮箱地址不会被公开。 必填项已用 * 标注 名称 * 电子邮件 * 网站 在想些什么? 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。 Δ
0 条评论