|
学习周报
姓名 | 马硕天 | 时间范围 | 20250324-20250330 | |
周次 | 第二十四周 | 研究方向 | 大模型数据高效微调 | |
本周完成工作 | 1. 完成了OpenLLM LeaderBoard上所有六个评测任务在我的方法、随机选择、完整数据集和superfilter方法得到的模型上的评测结果,我的方法在三个子任务上超越了基线模型,在其余三个子任务上略逊于基线模型。 2. 完成了我的方法和superfilter方法的结合,采用混合排名与多样性采样的方法,目前正在评测模型效果。 3. 完成多智能体综述阅读:Multi-Agent Collaboration Mechanisms A Survey of LLMs。 | |||
本周 问题汇报 | 1. OpenLLM LeaderBoard排行榜在十几天前被Huggingface官方宣布弃用不再更新,后续数据评测基准还是需要参考领域内论文常用的评测数据集。 2. 2025年的文章许多是在Llama3上进行的实验,目前为了方便和去年的文章作比较还是用Llama2做的实验,后续需要考虑新的模型。 | |||
下周工作计划 | 1. 修改数据评分代码,尝试在不影响选择效果的情况下加快数据选择速度。 2. 根据混合方法得到的模型效果推进下一步实验。 | |||
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-29 11:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社