预训练模型的finetune技巧
目录
权重冻结
在使用预训练语言模型进行下游任务的微调时,有时数据量难以使得其收敛,此时我们可以选择固定住某些层的参数,使其仍然保持在预训练语料上的知识积累(通常是编码器),而仅对如分类层等进行微调。
做法如下
|
|
参考链接
如果你觉得这篇文章对你有所帮助,欢迎赞赏~
赞赏在使用预训练语言模型进行下游任务的微调时,有时数据量难以使得其收敛,此时我们可以选择固定住某些层的参数,使其仍然保持在预训练语料上的知识积累(通常是编码器),而仅对如分类层等进行微调。
做法如下
|
|
如果你觉得这篇文章对你有所帮助,欢迎赞赏~
赞赏