|
科研方面:
读两篇论文。
SUMMAC: Re-Visiting NLI-based Models for Inconsistency Detection in Summarization
该文章也是对忠诚型幻觉的检测,使用的方法是分类器。该分类器是基于自然语言推理(NLI)对摘要和原文进行不同粒度的一对一分类,其中效果最好的是按照句子对句子的粒度进行分类。除了方法上的贡献外,文章引入了一个新的基准测试,称为SUMMAC Benchmark,它包含了六个最大的摘要一致性数据集,这些数据集被标准化为使用相同的分类任务。
Multi-Dimensional Evaluation of Text Summarization with In-Context Learning
该文章是利用现有的大模型如gpt-4o对摘要任务进行一个“多维度”的评判。该文章使用上下文学习的方式,为大模型输入不同的prompt使大模型对不同的维度进行评判。
项目方面:
改进生成工作流的prompt使其更加简洁直接,学习git以便更方便的获取最新代码并创建自己的分支,防止新加入的代码和其他人改进的代码起冲突。
下周任务:继续读论文,将改进后的代码上传到自己的分支。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-8-8 14:56
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社