mashuotian的个人博客分享 http://blog.sciencenet.cn/u/mashuotian

博文

学习周报-马硕天-20250414-20250420

已有 528 次阅读 2025-4-20 18:33 |系统分类:科研笔记

                                    学习周报

姓名

马硕天

时间范围

20250414-20250420

周次

第二十七周

研究方向

大模型数据高效微调

本周完成工作

1.      完成以llama3.2-1B作为代理模型的代码,并完成了对梯度的归一化处理代码,实现对短response数据的抑制。

2.      完成了毕设论文算法原理章节3.13.2.13.2.2内容的编写。

本周

问题汇报

1.      修改代理模型后性能在一定程度上有所改善,但对短文本的偏好仍然明显,现在完成了梯度的归一化处理,实现了对短response数据的抑制,目前在评测效果。

下周工作计划

1.      细化梯度归一化处理部分,最好形成具体的数学推理过程。

2.      完成毕设论文第三章和第四章内容的编写。

 



https://wap.sciencenet.cn/blog-3623255-1482719.html

上一篇:学习周报-马硕天-20250407-20250413
收藏 IP: 210.30.104.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-26 09:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部