博文

6.30-7.6周报

已有 1120 次阅读 2025-7-17 14:58 |系统分类:科研笔记

科研方面：

读两篇论文。

SUMMAC: Re-Visiting NLI-based Models for Inconsistency Detection in Summarization

该文章也是对忠诚型幻觉的检测，使用的方法是分类器。该分类器是基于自然语言推理（NLI）对摘要和原文进行不同粒度的一对一分类，其中效果最好的是按照句子对句子的粒度进行分类。除了方法上的贡献外，文章引入了一个新的基准测试，称为SUMMAC Benchmark，它包含了六个最大的摘要一致性数据集，这些数据集被标准化为使用相同的分类任务。

Multi-Dimensional Evaluation of Text Summarization with In-Context Learning

该文章是利用现有的大模型如gpt-4o对摘要任务进行一个“多维度”的评判。该文章使用上下文学习的方式，为大模型输入不同的prompt使大模型对不同的维度进行评判。

项目方面：

改进生成工作流的prompt使其更加简洁直接，学习git以便更方便的获取最新代码并创建自己的分支，防止新加入的代码和其他人改进的代码起冲突。

下周任务：继续读论文，将改进后的代码上传到自己的分支。

转载本文请联系原作者获取授权，同时请注明本文来自赵宇翱科学网博客。
链接地址：https://wap.sciencenet.cn/blog-3631097-1494090.html

上一篇：5.19-5.25周报

收藏 IP: 210.30.106.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

赵宇翱

扫一扫，分享此博文

YuaoZhao的个人博客分享 http://blog.sciencenet.cn/u/YuaoZhao

博文

6.30-7.6周报

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

赵宇翱

全部精选博文导读

YuaoZhao的个人博客分享 http://blog.sciencenet.cn/u/YuaoZhao

博文

6.30-7.6周报

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

赵宇翱

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)