博文

学习周报-马硕天-20250324-20250330

已有 946 次阅读 2025-3-30 20:27 |系统分类:科研笔记

学习周报

姓名		马硕天	时间范围	20250324-20250330
周次		第二十四周	研究方向	大模型数据高效微调
本周完成工作	1. 完成了OpenLLM LeaderBoard上所有六个评测任务在我的方法、随机选择、完整数据集和superfilter方法得到的模型上的评测结果，我的方法在三个子任务上超越了基线模型，在其余三个子任务上略逊于基线模型。 2. 完成了我的方法和superfilter方法的结合，采用混合排名与多样性采样的方法，目前正在评测模型效果。 3. 完成多智能体综述阅读：Multi-Agent Collaboration Mechanisms A Survey of LLMs。
本周问题汇报	1. OpenLLM LeaderBoard排行榜在十几天前被Huggingface官方宣布弃用不再更新，后续数据评测基准还是需要参考领域内论文常用的评测数据集。 2. 2025年的文章许多是在Llama3上进行的实验，目前为了方便和去年的文章作比较还是用Llama2做的实验，后续需要考虑新的模型。
下周工作计划	1. 修改数据评分代码，尝试在不影响选择效果的情况下加快数据选择速度。 2. 根据混合方法得到的模型效果推进下一步实验。

转载本文请联系原作者获取授权，同时请注明本文来自马硕天科学网博客。
链接地址：https://wap.sciencenet.cn/blog-3623255-1479977.html

上一篇：学习周报-马硕天-20250317-20250323
下一篇：学习周报-马硕天-20250331-20250406

收藏 IP: 210.30.104.*| 热度|

数据加载中...

返回顶部

扫一扫，分享此博文