|
首先代码部分,我做实验发现训练准确率不够高的问题,是文本分类准确率不够高,所以我自己写了个项目,把主流的几个文本分类模型都跑了一下,包括
TextCNN.py
TextRNN.py
TextRCNN.py
FastText.py
DPCNN.py
TextRNN_Att.py
数据集用的是清华大学的 THUCNews 的中文新闻数据分类数据集,结果是TextRNN_Att和DPCNN的效果好一点,都超过了92。下周准备处理一下英文的分类,然后再测试一下实验结果。
(我知道这几个模型效果很差,只是用来测试一下我写的分类好不好用,下周后续会换到主流模型上)
论文部位,这周精读了两篇论文。
第一篇是2023ICMR的一篇Multi-modal Fake News Detection on Social Media via Multi-grained Information Fusion。讲的是多粒度多模态融合网络(MMFN),通过结合细粒度和粗粒度的文本与图像特征,实现更全面的语义理解。解决多粒度信息利用不足的问题,因为大多数方法只在整体层面进行模态融合,忽略了细节层级的交互,导致信息利用不充分。
第二篇是2023AAAI的一篇See How You Read? Multi-Reading Habits Fusion Reasoning for Multi-Modal Fake News Detection。
提出了一种新的多模态假新闻检测方法——多阅读习惯融合推理网络(MRHFR)。该方法通过引入人类的多模态新闻阅读习惯来优化多模态特征的深度融合,并通过捕捉不同模态之间的不一致性,进一步提升假新闻的检测精度。灵感来源于人类对多模态新闻的不同阅读习惯。该层主要分为三个阅读习惯:看文本&瞥图像、瞥文本&看图像、看文本&看图像。每种习惯代表不同的注意力分配模式。还挺新颖的。
然后论文具体的方法和实验我已经分享在群里了。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-4-29 14:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社