|
学习周报
姓名 | 马硕天 | 时间范围 | 20250414-20250420 | |
周次 | 第二十七周 | 研究方向 | 大模型数据高效微调 | |
本周完成工作 | 1. 完成以llama3.2-1B作为代理模型的代码,并完成了对梯度的归一化处理代码,实现对短response数据的抑制。 2. 完成了毕设论文算法原理章节3.1和3.2.1、3.2.2内容的编写。 | |||
本周 问题汇报 | 1. 修改代理模型后性能在一定程度上有所改善,但对短文本的偏好仍然明显,现在完成了梯度的归一化处理,实现了对短response数据的抑制,目前在评测效果。 | |||
下周工作计划 | 1. 细化梯度归一化处理部分,最好形成具体的数学推理过程。 2. 完成毕设论文第三章和第四章内容的编写。 | |||
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-26 09:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社