YuaoZhao的个人博客分享 http://blog.sciencenet.cn/u/YuaoZhao

博文

6.30-7.6周报

已有 303 次阅读 2025-7-17 14:58 |系统分类:科研笔记

科研方面:

读两篇论文。

SUMMAC: Re-Visiting NLI-based Models for  Inconsistency Detection in Summarization

该文章也是对忠诚型幻觉的检测,使用的方法是分类器。该分类器是基于自然语言推理(NLI)对摘要和原文进行不同粒度的一对一分类,其中效果最好的是按照句子对句子的粒度进行分类。除了方法上的贡献外,文章引入了一个新的基准测试,称为SUMMAC Benchmark,它包含了六个最大的摘要一致性数据集,这些数据集被标准化为使用相同的分类任务。

Multi-Dimensional Evaluation of Text Summarization with In-Context Learning

该文章是利用现有的大模型如gpt-4o对摘要任务进行一个“多维度”的评判。该文章使用上下文学习的方式,为大模型输入不同的prompt使大模型对不同的维度进行评判。

项目方面:

改进生成工作流的prompt使其更加简洁直接,学习git以便更方便的获取最新代码并创建自己的分支,防止新加入的代码和其他人改进的代码起冲突。

下周任务:继续读论文,将改进后的代码上传到自己的分支。



https://wap.sciencenet.cn/blog-3631097-1494090.html

上一篇:5.19-5.25周报
收藏 IP: 210.30.106.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-8-8 14:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部