mashuotian的个人博客分享 http://blog.sciencenet.cn/u/mashuotian

博文

学习周报-马硕天-20250421-20250427

已有 540 次阅读 2025-4-27 19:29 |系统分类:科研笔记

                                    学习周报

姓名

马硕天

时间范围

20250421-20250427

周次

第二十八周

研究方向

大模型数据高效微调

本周完成工作

1.      编写依据回复长度进行二次采样的代码,目前服务器资源紧张,尚未评测效果。

2.      完成毕设论文第三章和第四章内容的初稿,完善了部分第二章内容。

本周

问题汇报

方法在部分数据集上效果仍然不理想,响应长度的分布直方图和其与影响力分数的散点图如下

 

因此决定依照响应长度进行分层,并且每层的采样数量与该层原始数据量成比例,再在层内依据影响力分数进行采样

下周工作计划

1.      完成分层采样部分的实验

2.      完成毕设论文初稿编写

 



https://wap.sciencenet.cn/blog-3623255-1483667.html

上一篇:学习周报-马硕天-20250414-20250420
收藏 IP: 210.30.107.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-5-5 10:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部