基于文章SNIFFER: Multimodal Large Language Model for Explainable Out-of-Context Misinformation Detection,跑通了代码(本来寒假在家时候就跑过,但是当时因为各种原因没跑通),这次经过修正成功了。
代码地址https://github.com/MischaQI/Sniffer,但是我跑出来的结果和文章里差了接近五个点(文章里是88.4,我这边是83.7),下周看看是什么问题。
这周找了一些新数据集,补充用,在这记录一下:
MCFEND(Multi-Source Chinese Fake News Detection Benchmark)数据集,由香港浸会大学、香港中文大学等机构联合构建,包含来自社交平台、消息应用程序和传统在线新闻媒体等不同来源的23,974条经过核实的新闻
LTCR(Long-Text Chinese Rumor Detection)
数据集,它专注于识别谣言验证背景下的误导信息。该数据集包含1,729条真实新闻和500条假新闻,真假新闻的平均长度分别约为230和152个字符
https://github.com/yeren66/ChineseRumorDataset/tree/main?tab=readme-ov-file
https://www.kaggle.com/datasets/yangzhou32/weibo-version-1multimodel-supplement/code
https://www.kaggle.com/datasets/yangzhou32/socialnet-weibo-version-1?resource=download
背前端和产品的题,优化简历,投简历(最近两周比较多时间用在了这个上,后续会多把时间放在科研上,争取暑期之前把自己的实验做完)
看论文方面,这几周没有什么这个方向的论文发表,我就在看自己之前整理的论文什么的(之前写过总结),并找图文一致性检测方向自己没看过的论文,争取对这个方向更了解。
转载本文请联系原作者获取授权,同时请注明本文来自冯琳舒科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3622942-1479993.html?mobile=1
收藏