马硕天
学习周报-马硕天-20250929-20251005
2025-10-8 15:49
阅读:462

                                      学习周报

姓名

马硕天

时间范围

20250929-20251005

周次

第五周

研究方向

大模型数据高效微调

本周完成工作

1.       智能比价,完成了所有比价反馈问题的修复,完成了通过libreofficesheet xls文件向csv文件的转化。

2.       完成idea的进一步改进,改进后实验效果更好。

本周

问题汇报

目前序列长度仅支持4096以下,8192会爆显存,而现有推理数据集中长度在4096以下的序列占比仅为三分之二,4096-8192之间的数据占据了其余三分之一的相当一部分,应当被纳入实验中。

下周工作计划

1.       继续进行减少算法显存开销的技术研究应用(如acceleratorcpu   offloaddeepspeed技术),目前已经进行了一部分实验,但仍未完全解决问题。

 

转载本文请联系原作者获取授权,同时请注明本文来自马硕天科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3623255-1505076.html?mobile=1

收藏

下一篇
当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?