|
学习周报
姓名 | 马硕天 | 时间范围 | 20250407-20250413 | |
周次 | 第二十六周 | 研究方向 | 大模型数据高效微调 | |
本周完成工作 | 1. 继续修改以llama3.2-1B作为代理模型的代码 2. 完成了毕设论文文献综述部分,并完成了中期检查所需要的资料 3. 完成了使用Qwen大模型对来单进行层级划分的代码,面对表格长度过长需要切片的问题,采取在每次输入时提供当前处理片段缺省的前序层级信息,避免每个片段都重新开始层级划分。 | |||
本周 问题汇报 | 1. 以llama3.2-1B作为代理模型仍然存在异常的显存溢出问题,需要继续修改代码 2. 使用大模型完成层级划分存在一些问题,目前处理优先级较高的问题为如果一个表格片段的第一行就是W层级,可能会出现无视提供的前序C级W级信息而划分为C级,并且C级直接下属R级内容 | |||
下周工作计划 | 1. 继续更正代码存在的问题 2. 处理层级划分的错误问题 | |||
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-28 14:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社