学习周报-马硕天-20250929-20251005
2025-10-8 15:49
阅读:462
学习周报
姓名 | 马硕天 | 时间范围 | 20250929-20251005 | |
周次 | 第五周 | 研究方向 | 大模型数据高效微调 | |
本周完成工作 | 1. 智能比价,完成了所有比价反馈问题的修复,完成了通过libreoffice多sheet xls文件向csv文件的转化。 2. 完成idea的进一步改进,改进后实验效果更好。 | |||
本周 问题汇报 | 目前序列长度仅支持4096以下,8192会爆显存,而现有推理数据集中长度在4096以下的序列占比仅为三分之二,4096-8192之间的数据占据了其余三分之一的相当一部分,应当被纳入实验中。 | |||
下周工作计划 | 1. 继续进行减少算法显存开销的技术研究应用(如accelerator的cpu offload和deepspeed技术),目前已经进行了一部分实验,但仍未完全解决问题。 | |||
转载本文请联系原作者获取授权,同时请注明本文来自马硕天科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3623255-1505076.html?mobile=1
收藏
下一篇
当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论