mashuotian的个人博客分享 http://blog.sciencenet.cn/u/mashuotian

博文

学习周报-马硕天-20250324-20250330

已有 602 次阅读 2025-3-30 20:27 |系统分类:科研笔记

                                    学习周报

姓名

马硕天

时间范围

20250324-20250330

周次

第二十四周

研究方向

大模型数据高效微调

本周完成工作

1.      完成了OpenLLM LeaderBoard上所有六个评测任务在我的方法、随机选择、完整数据集和superfilter方法得到的模型上的评测结果,我的方法在三个子任务上超越了基线模型,在其余三个子任务上略逊于基线模型。

2.      完成了我的方法和superfilter方法的结合,采用混合排名与多样性采样的方法,目前正在评测模型效果。

3.      完成多智能体综述阅读:Multi-Agent Collaboration Mechanisms A   Survey of LLMs

本周

问题汇报

1.      OpenLLM   LeaderBoard排行榜在十几天前被Huggingface官方宣布弃用不再更新,后续数据评测基准还是需要参考领域内论文常用的评测数据集。

2.      2025年的文章许多是在Llama3上进行的实验,目前为了方便和去年的文章作比较还是用Llama2做的实验,后续需要考虑新的模型。

下周工作计划

1.      修改数据评分代码,尝试在不影响选择效果的情况下加快数据选择速度。

2.      根据混合方法得到的模型效果推进下一步实验。

 



https://wap.sciencenet.cn/blog-3623255-1479977.html

上一篇:学习周报-马硕天-20250317-20250323
下一篇:学习周报-马硕天-20250331-20250406
收藏 IP: 210.30.104.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-29 11:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部