马硕天
学习周报-马硕天-20250414-20250420
2025-4-20 18:33
阅读:551

                                    学习周报

姓名

马硕天

时间范围

20250414-20250420

周次

第二十七周

研究方向

大模型数据高效微调

本周完成工作

1.      完成以llama3.2-1B作为代理模型的代码,并完成了对梯度的归一化处理代码,实现对短response数据的抑制。

2.      完成了毕设论文算法原理章节3.13.2.13.2.2内容的编写。

本周

问题汇报

1.      修改代理模型后性能在一定程度上有所改善,但对短文本的偏好仍然明显,现在完成了梯度的归一化处理,实现了对短response数据的抑制,目前在评测效果。

下周工作计划

1.      细化梯度归一化处理部分,最好形成具体的数学推理过程。

2.      完成毕设论文第三章和第四章内容的编写。

 

转载本文请联系原作者获取授权,同时请注明本文来自马硕天科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3623255-1482719.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?