mashuotian的个人博客分享 http://blog.sciencenet.cn/u/mashuotian

博文

学习周报-马硕天-20250407-20250413

已有 293 次阅读 2025-4-14 00:18 |系统分类:科研笔记

                                    学习周报

姓名

马硕天

时间范围

20250407-20250413

周次

第二十六周

研究方向

大模型数据高效微调

本周完成工作

1.      继续修改以llama3.2-1B作为代理模型的代码

2.      完成了毕设论文文献综述部分,并完成了中期检查所需要的资料

3.      完成了使用Qwen大模型对来单进行层级划分的代码,面对表格长度过长需要切片的问题,采取在每次输入时提供当前处理片段缺省的前序层级信息,避免每个片段都重新开始层级划分。

本周

问题汇报

1.      llama3.2-1B作为代理模型仍然存在异常的显存溢出问题,需要继续修改代码

2.      使用大模型完成层级划分存在一些问题,目前处理优先级较高的问题为如果一个表格片段的第一行就是W层级,可能会出现无视提供的前序CW级信息而划分为C级,并且C级直接下属R级内容

下周工作计划

1.      继续更正代码存在的问题

2.      处理层级划分的错误问题

 



https://wap.sciencenet.cn/blog-3623255-1481871.html

上一篇:学习周报-马硕天-20250331-20250406
下一篇:学习周报-马硕天-20250414-20250420
收藏 IP: 210.30.104.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-28 14:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部