学习周报-马硕天-20250407-20250413
2025-4-14 00:18
阅读:300
学习周报
姓名 | 马硕天 | 时间范围 | 20250407-20250413 | |
周次 | 第二十六周 | 研究方向 | 大模型数据高效微调 | |
本周完成工作 | 1. 继续修改以llama3.2-1B作为代理模型的代码 2. 完成了毕设论文文献综述部分,并完成了中期检查所需要的资料 3. 完成了使用Qwen大模型对来单进行层级划分的代码,面对表格长度过长需要切片的问题,采取在每次输入时提供当前处理片段缺省的前序层级信息,避免每个片段都重新开始层级划分。 | |||
本周 问题汇报 | 1. 以llama3.2-1B作为代理模型仍然存在异常的显存溢出问题,需要继续修改代码 2. 使用大模型完成层级划分存在一些问题,目前处理优先级较高的问题为如果一个表格片段的第一行就是W层级,可能会出现无视提供的前序C级W级信息而划分为C级,并且C级直接下属R级内容 | |||
下周工作计划 | 1. 继续更正代码存在的问题 2. 处理层级划分的错误问题 | |||
转载本文请联系原作者获取授权,同时请注明本文来自马硕天科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3623255-1481871.html?mobile=1
收藏
当前推荐数:0
推荐到博客首页
网友评论0 条评论