Automated-Fact-Checking-Resources

562 62 困难 1 次阅读 5天前MIT数据工具语言模型其他开发框架

AI 解读由 AI 自动生成，仅供参考

Automated-Fact-Checking-Resources 是一个专注于自动化事实核查（AFC）领域的开源资源库，旨在为研究人员和开发者提供全面、最新的学术文献与工具索引。面对虚假信息泛滥的挑战，该资源库系统性地梳理了从“主张检测”、“证据检索”到“真实性验证”的完整技术链路，帮助用户快速定位高质量的研究成果。

它主要解决了该领域文献分散、分类标准不一以及多模态核查资源难以获取的痛点。通过整合 TACL 2022 和 EMNLP 2023 的两篇权威综述，它将海量论文按任务类型（如自然/人工主张分类、上下文外检测）、数据集、共享任务及模型架构进行了精细化分类。其独特亮点在于紧跟技术前沿，持续更新包括大语言模型（LLM）事实性、LLM 生成文本检测以及多模态事实核查在内的最新研究（涵盖 2024 年顶会论文），并提供了清晰的任务定义框架图。

无论是从事自然语言处理算法研究的学者、需要构建反谣言系统的工程师，还是希望深入了解虚假信息检测机制的学生，都能从中高效获取所需的核心资料。它不仅是一份文献列表，更是一个动态演进的知识图谱，助力社区共同推动事实核查技术的发展。

使用场景

某新闻科技公司的算法团队正致力于研发新一代多模态假新闻检测系统，需要快速构建从“观点提取”到“证据检索”再到“真伪判定”的全流程模型。

没有 Automated-Fact-Checking-Resources 时

文献搜集效率低下：研究人员需手动在 ACL、EMNLP 等各大会议中筛选论文，耗时数周仍难以覆盖最新的 LLM 幻觉检测或多模态核查成果。
数据标准不统一：面对分散的自然观点与人工构造观点数据集，团队难以界定任务边界，导致训练数据清洗和标注规范反复返工。
技术选型盲目：缺乏对现有模型（如观点检测、理由生成）的系统性对比，容易重复造轮子或选用已过时的基线模型。
框架认知模糊：团队成员对自动化事实核查的三阶段流程理解不一，尤其在处理图文混合证据时，难以形成统一的技术架构。

使用 Automated-Fact-Checking-Resources 后

前沿资源一键获取：直接利用仓库中更新的 2024 年 NeurIPS、WWW 等顶会论文列表，迅速掌握大模型事实性及多模态核查的最新进展。
数据集分类清晰：依托仓库对“观点检测”、“真伪分类”及“脱离语境分类”等数据集的细致划分，快速锁定适配业务场景的高质量数据。
模型路线明确：参考仓库整理的各类任务 SOTA 模型与共享任务成果，直接复用成熟的基线代码，将研发启动时间缩短 60%。
架构设计标准化：基于仓库提供的统一 NLP 框架图示，团队迅速对齐了从多模态观点提取到理由生成的全流程定义，减少了沟通成本。

Automated-Fact-Checking-Resources 通过提供结构化、实时更新的全景式资源地图，将原本碎片化的研究路径转化为高效的工程落地指南。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个资源列表（文献、数据集、任务、模型链接的集合），而非一个可直接运行的软件工具或代码库。README 中未包含任何关于安装、环境配置、依赖库或硬件需求的技术说明。用户需根据列表中链接到的具体论文或子项目（如特定的 GitHub 模型仓库）去查询各自的运行环境需求。

python未说明

Automated-Fact-Checking-Resources hero image

快速开始

自动化事实核查资源

更新：

2024年12月：新增了LLM中的事实性部分。添加了EMNLP和NeurIPS 2024的论文。
2024年8月：添加了WWW、IJCAI和ACL 2024的论文。
2024年6月：新增了相关任务中LLM生成文本的部分。添加了EACL、NAACL、AAAI、ICLR 2024的论文。

概述

本仓库包含了我们发表在TACL 2022上的综述论文《自动化事实核查综述》（A Survey on Automated Fact-Checking）以及后续发表在EMNLP 2023上的多模态综述论文《多模态自动化事实核查综述》（Multimodal Automated Fact-Checking: A Survey）中的相关资源。在这些综述中，我们全面且最新地回顾了文本及其他模态下的自动化事实核查（AFC），并将先前研究中提出的各种组件和定义统一到一个通用框架中。随着自动化事实核查研究的不断发展，我们将及时更新综述内容及本仓库。

任务定义
数据集
- 声明检测与提取数据集
- 判决预测数据集
共享任务
模型
相关综述
相关任务
教程

任务定义

下图展示了一个基于文本的自动化事实核查（AFC）的NLP框架，包含三个阶段：

声明检测：识别需要验证的声明；
证据检索：寻找支持或反驳该声明的来源；
声明验证：根据检索到的证据评估声明的真实性。

有时，证据检索和声明验证会被合并为一个称为事实验证的任务，而声明检测则通常单独处理。声明验证可以进一步分解为两个部分，既可以分别处理，也可以联合进行：判决预测，即为声明分配真实性标签；以及理由生成，即为判决提供解释。

在后续的多模态综述中，我们将第一阶段扩展为声明提取步骤，并将第三阶段推广至涵盖多模态自动化事实核查的相关任务：

声明检测与提取：在此阶段，可能需要多种模态来理解和提取声明。仅仅检测误导性内容往往是不够的——必须先提取出声明，才能在后续阶段进行事实核查。
证据检索：与基于文本的事实核查类似，多模态事实核查同样依赖于证据来进行判断。
判决预测与理由生成：这一阶段被细分为三个任务，以应对多模态虚假信息常见的传播方式：
- 操纵分类：对包含操纵内容的虚假声明，或伴随操纵内容的正确声明进行分类。
- 语境外分类：检测来自不同上下文但内容未改变的信息。
- 真实性分类：根据检索到的证据，对文本声明的真实性进行分类。

数据集

声称检测与提取数据集

MR2：社交媒体中多模态检索增强型谣言检测基准（Hu 等，2023） [论文] [数据集]
FakeSV：短视频平台上虚假新闻检测的丰富社交背景多模态基准（Qi 等，2023） [论文] [数据集]
SciTweets - 用于检测科学在线话语的数据集与标注框架（Hafid 等，2022） [论文] [数据集]
助力事实核查者！Twitter 上声称片段的自动识别（Sundriyal 等，2022） [论文] [数据集]
Stanceosaurus：多语言虚假信息立场分类（Zheng 等，2022） [论文] [数据集]
信息操纵检测中的挑战与机遇：对战时俄罗斯媒体的考察（Park 等，2022） [论文]
CoVERT：经事实核查的生物医学 COVID-19 推文语料库（Mohr 等，2022） [论文] [数据集]
MuMiN：大规模多语言多模态经事实核查的虚假信息社交网络数据集（Nielsen 等，2022） [论文] [数据集]
STANKER：基于层次粒度注意力掩码 BERT 的堆叠网络，用于社交媒体上的谣言检测（Rao 等，2021） [论文] [数据集]
抗击 COVID-19 信息疫情：建模记者、事实核查员、社交媒体平台、政策制定者和社会各界的观点（Alam 等，2021） [论文] [数据集]
向自动化事实核查迈进：开发一致的自动化声称检测标注方案和基准（Konstantinovskiy 等，2021） [论文]
CLEF-2021 CheckThat! 实验室：检测值得核查的 claims、先前已被事实核查的 claims 和假新闻（Nakov 等，2021） [论文] [数据集]
基于双情感挖掘的虚假新闻检测（Zhang 等，2021） [论文] [数据集]
CheckThat! 2020 概述：社交媒体中 claims 的自动识别与验证（Barrón-Cedeño 等，2020） [论文] [数据集]
需要引用：维基百科可验证性的分类与算法评估（Redi 等，2019） [论文] [数据集]
SemEval-2019 任务 7：RumourEval，确定谣言的真实性及对谣言的支持（Gorrell 等，2019） [论文] [数据集]
谣言立场与真实性的联合评估（Lillie 等，2019） [论文] [数据集]
CLEF-2018 CheckThat! 实验室概述：政治 claims 的自动识别与验证。任务 1：是否值得核查（Atanasova 等，2018） [论文] [数据集]
区分事实与虚构：用于分类 Twitter 上可疑与可信新闻帖的语言模型（Volkova 等，2017） [论文] [数据集]
政治辩论中检测值得核查 claims 的上下文感知方法（Gencheva 等，2017） [论文] [数据集]
使用循环神经网络进行多模态融合以检测微博上的谣言（Jin 等，2017） [论文]
SemEval-2017 任务 8：RumourEval：确定谣言的真实性和对谣言的支持（Derczynski 等，2017） [论文] [数据集]
使用循环神经网络从微博中检测谣言（Ma 等，2016） [论文] [数据集]
通过对话线程分析人们在社交媒体中如何对待并传播谣言（Zubiaga 等，2016） [论文] [数据集]
CREDBANK：带有相关可信度标注的大规模社交媒体语料库（Mitra 和 Gilbert，2015） [论文] [数据集]
在总统辩论中检测值得核查的事实 claims （Hassan 等，2015） [论文]

判决预测数据集

真实性分类数据集

自然陈述

大型语言模型了解事实吗？（Xu 等，2024） [论文] [数据集] [代码]
ESCNet：用于多模态事实核查的实体增强与立场检测网络（Zhang 等，2024） [论文] [代码]
MCFEND：面向中文假新闻检测的多源基准数据集（Li 等，2024） [论文] [数据集]
什么使医学声明可（不可）验证？基于实体和关系属性的事实验证分析（Wührl 等，2024） [论文] [数据集]
AVeriTeC：包含网络证据的真实世界声明验证数据集（Schlichtkrull 等，2023） [论文] [数据集] [共享任务]
COVID-VTS：短视频平台上的事实提取与验证（Liu 等，2023） [论文] [数据集] [代码]
端到端多模态事实核查与解释生成：一个具有挑战性的数据集及模型（Yao 等，2023） [论文] [数据集]
基于语义匹配释义建模科学传播中的信息变化（Wright 等，2022） [论文] [数据集] [代码]
为复杂声明生成字面与隐含子问题以进行事实核查（Chen 等，2022） [论文] [数据集]
SciFact-Open：迈向开放域科学声明验证（Wadden 等，2022） [论文] [数据集]
CHEF：一个用于循证事实核查的试点中文数据集（Hu 等，2022） [论文] [数据集]
WatClaimCheck：一个新的声明蕴涵与推理数据集（Khan 等，2022） [论文] [数据集]
基于在线资源对脱离上下文图像进行开放域、内容驱动的多模态事实核查（Abdelnabi 等，2022） [论文] [数据集]
MMM：一种考虑情绪与新颖性的多语言多模态虚假信息检测方法（Gupta 等，2022） [论文] [数据集]
FactDrill：用于研究印度假新闻事件的事实核查社交媒体内容数据仓库（Singhal 等，2022） [论文]
基于证据的健康相关声明事实核查（Sarrouti 等，2021） [论文] [数据集]
COVID-Fact：针对新冠疫情真实世界声明的事实提取与验证（Saakyan 等，2021） [论文] [数据集]
编辑媒体理解框架：关于视觉虚假信息意图与影响的推理（Da 等，2021） [论文] [代码]
通过合理化事实核查结构化虚假信息故事（Jiang 等，2021） [论文] [数据集]
X-FACT：一个新的多语言事实核查基准数据集（Gupta 和 Srikumar，2021） [论文] [数据集]
LUX（语言学方面探究）：用于自动假新闻分类的话语分析（Azevedo 等，2021） [论文] [代码]
面向真相：利用客观事实与主观观点实现可解释的谣言检测（Li 等，2021） [论文]
公共卫生声明的可解释自动化事实核查（Kotonya 和 Toni，2020b） [论文] [数据集]
事实还是虚构：科学声明的验证（Wadden 等，2020）。 [论文] [数据集]
AnswerFact：产品问答中的事实核查（Zhang 等，2020） [论文] [数据集]
公共卫生声明的可解释自动化事实核查（Kotonya 和 Toni，2020）。 [论文] [数据集]
r/Fakeddit：一个新的细粒度假新闻检测多模态基准数据集（Nakamura 等，2020）。 [论文] [数据集]
CLIMATE-FEVER：用于验证现实气候声明的数据集（Diggelmann 等，2020） [论文] [数据集]
FakeCovid——针对COVID-19的多语言跨领域事实核查新闻数据集（Shahi 和 Nandini，2020）。 [论文] [数据集]
FakeNewsNet：包含新闻内容、社交背景及时空信息的数据仓库，用于研究社交媒体上的假新闻（Shu 等，2020）。 [论文] [数据集]
用于自动化事实核查不同任务的丰富标注语料库（Hanselowski 等，2019）。 [论文] [代码] [数据集]
MultiFC：一个现实世界的多领域证据导向声明事实核查数据集（Augenstein 等，2019）。 [论文] [数据集]
事实核查与伪造摄影：图像相关声明的验证（Zlatkova 等，2019） [论文] [数据集]
FA-KES：围绕叙利亚战争的假新闻数据集（Salem 等，2019） [论文] [数据集]
社区论坛中的事实核查（Mihaylova 等，2018） [论文] [数据集]
EANN：用于多模态假新闻检测的事件对抗神经网络 [论文] [数据集]
CLEF-2018 CheckThat! 实验室关于政治声明自动识别与验证的概述。任务2：真实性（Barrón-Cedeño 等，2018） [论文] [数据集]
将立场检测与事实核查整合到统一语料库中（Baly 等，2018）。 [论文] [数据集]
对极端党派性和假新闻的文体学探究（Potthast 等，2018） [论文] [数据集]
包含Facebook用户评论与个人视角的新闻真实性数据集（Santia 和 Williams，2018） [论文]] [数据集]
抽样新闻生产者：用于研究复杂媒体格局的大型新闻与专题数据集（Horne 等，2018） [论文] [数据集]
不同层次的真实性：假新闻与政治事实核查中的语言分析（Rashkin 等，2017）。 [论文] [数据集]
“说谎者，说谎者，裤子着火了”：一个新的假新闻检测基准数据集（Wang，2017）。 [论文] [数据集]
网络文本声明的可信度评估（Popat 等，2016） [论文] [数据集]
Emergent：一个新的立场分类数据集（Ferreira 和 Vlachos，2016） [论文] [数据集]
假新闻还是真相？利用讽刺线索检测潜在误导性新闻（Rubin 等，2016） [论文]
简单统计属性相关声明的识别与验证（Vlachos 和 Riedel，2015） [论文] [数据集]
质量检查：任务定义与数据集构建（Vlachos 和 Riedel，2014） [论文] [数据集]
民事与刑事叙事中基于语言的欺骗指标的验证与实施（Bachenko 等，2008） [论文]

人工标注数据集

EX-FEVER：用于多跳可解释事实核查的数据集（Ma 等，2024） [论文] [代码]
CFEVER：中文事实提取与验证数据集（Lin 等，2024） [论文] [数据集]
FACTKG：基于知识图谱推理的事实核查（Kim 等，2023） [论文] [代码] [数据集]
为真实假新闻检测而伪造假新闻：宣传导向训练数据生成（Huang 等，2023） [论文] [代码] [数据集]
FACTIFY-5WQA：基于 5W 要素的问题回答式事实核查（Rani 等，2023） [论文]
基于图表图像的阅读与推理用于证据驱动的自动化事实核查（Akhtar 等，2023） [论文] [数据集]
虚假信息反应框架：关于读者对新闻标题反应的推理（Gabriel 等，2022） [论文] [数据集]
DialFact：对话中事实核查的基准测试（Gupta 等，2022） [论文] [数据集]
FAVIQ：从信息查询问题进行事实核查（Park 等，2022） [论文] [数据集]
FEVEROUS：面向非结构化与结构化信息的事实提取与验证（Aly 等，2021）
[论文] [数据集] [代码]
使用表格进行陈述验证与证据发现（SEM-TAB-FACT）（Wang 等，2021） [数据集]
补充你的维生素 C！利用对比证据进行稳健的事实核查（Schuster 等，2021） [论文] [数据集]
ParsFEVER：波斯语事实提取与验证数据集（Zarharan 等，2021） [论文] [数据集]
DanFEVER：丹麦语声明验证数据集（Nørregaard 和 Derczynski，2021） [论文] [数据集]
HoVer：用于多跳事实提取与声明验证的数据集（Jiang 等，2020） [论文] [数据集]
INFOTABS：将表格作为半结构化数据进行推理（Gupta 等，2020） [论文] [数据集]
TabFact：大规模基于表格的事实核查数据集（Chen 等，2020） [论文] [数据集]
基于知识图谱中正负证据路径加权的无监督事实核查（Kim 和 Choi，2020） [论文]
立场预测与声明验证：阿拉伯视角（Khouja，2020） [论文] [数据集]
自动核查维基百科中的声明（Sathe 等，2020）。 [论文] [数据集]
FEVER：大规模事实提取与验证数据集（Thorne 等，2018）。 [论文] [数据集]
自动检测虚假新闻（Pérez-Rosas 等，2018） [论文] [数据集]
撒谎检测器：自动识别欺骗性语言的探索（Mihalcea 和 Strapparava，2009） [论文]
在知识图谱中寻找支持事实核查的路径（Shiralkar 等，2017） [论文] [数据集]
面向知识图谱事实核查的判别式谓词路径挖掘（Shi 和 Weninger，2016） [论文]
基于知识网络的计算事实核查（Ciampaglia 等，2015） [论文]

操控分类数据集

“图片，告诉我你的故事！”预测视觉虚假信息的原始元上下文（Tonglet 等，2024） [论文] [代码]
跨领域音频深度伪造检测：数据集与分析（Li 等，2024） [论文] [数据集]
DF-Platter：多人脸异构深度伪造数据集（Narayan 等，2023） [论文] [数据集]
检测与定位多模态媒体操纵。（Shao 等，2023） [论文] [数据集]
FakeAVCeleb：一种新型音视频多模态深度伪造数据集（Khalid 等，2021） [论文] [数据集]
半真半假：部分伪造音频检测数据集（Yi 等，2021） [论文]
KoDF：大规模韩语深度伪造检测数据集（Kwon 等，2021） [论文] [数据集]
Celeb-DF：用于深度伪造取证的大规模挑战性数据集（Li 等，2020） [论文] [数据集]
DeeperForensics-1.0：用于现实世界人脸伪造检测的大规模数据集（Jiang 等，2020） [论文] [数据集]
DeepSonar：迈向高效且稳健的AI合成虚假语音检测（Wang 等，2020） [论文]
FoR：用于合成语音检测的数据集（Reimao 等，2019） [论文]
Phonespoof：用于电话信道欺骗攻击检测的新数据集（Lavrentyeva 等，2019） [论文]
深度伪造检测挑战赛（DFDC）预览数据集（Dolhansky 等，2019） [论文] [数据集]
PS-Battles 数据集——用于图像操纵检测的图像集合（Heller 等，2018） [论文] [数据集]
FaceForensics：用于人脸伪造检测的大规模视频数据集（Rossler 等，2018） [论文] [数据集]

脱离上下文分类数据集

并非所有假新闻都是文字形式：误导性视频标题的数据集与分析（Sung 等，2023） [论文] [数据集]
COSMOS：利用自监督学习捕捉脱离上下文的虚假信息（Aneja 等，2023） [论文] [代码] [数据集]
Factify 2：多模态假新闻与讽刺新闻数据集（Suryavardan 等，2023） [论文] [数据集]
InfoSurgeon：跨媒体细粒度信息一致性检查用于假新闻检测（Fung 等，2021） [论文] [数据集]
NewsCLIPpings：自动生成功能脱离上下文的多模态媒体（Luo 等，2021） [论文] [数据集]
检测跨模态不一致以防御神经网络生成的假新闻（Tan 等，2020） [论文] [数据集]
利用跨模态实体一致性指标对真实世界新闻进行多模态分析（Müller-Budack 等，2020） [论文] [数据集]
深度多模态图像再利用检测（Sabir 等，2018） [论文] [数据集]
利用图像与文本联合嵌入评估多媒体语义完整性（Jaiswal 等，2017） [论文]

共享任务

AVeriTec 共享任务 [第7届 FEVER 研讨会]
事实提取与验证（FEVER）共享任务 [第5届 FEVER 研讨会]
带有表格的语句验证与证据查找（SEM-TAB-FACT）[Wang 等，2021年]
SciFact 主张验证 [Wadden 等，2020年]
Fakeddit 多模态假新闻检测挑战赛 [Nakamura 等，2020年]
SemEval-2019 任务7：RumourEval，确定谣言的真实性及对谣言的支持度 [Gorrell 等，2019年]
SemEval-2019 任务8：社区问答论坛中的事实核查 [Mihaylova 等，2019年]
对假新闻挑战赛立场检测任务的回顾性分析 [Hanselowski 等，2018年]
事实提取与验证（FEVER）共享任务 [Thorne 等，2018年]
SemEval-2017 任务8：RumourEval：确定谣言的真实性及对谣言的支持度 [Derczynski 等，2017年]
假新闻挑战赛（FNC-1）[Pomerleau 和 Rao，2017年]

模型

声称检测与提取

破解谣言：一种意图感知的层次化对比学习多任务学习方法（Yang等，2024） [论文]
基于大语言模型增强语义挖掘的假新闻检测（Ma等，2024） [论文]
面向事实核查的文档级声称提取与去情境化（Deng等，2024） [论文]
基于强化微调的大语言模型联合立场检测与谣言辟谣（Yang等，2024） [论文] [代码]
通过提示与扩散揭示观点演变以进行短视频假新闻检测（Zong等，2024） [论文]
从怀疑到接受：模拟对假新闻的态度动态（Liu等，2024） [论文]
用于假新闻检测的异构子图Transformer（Zhang等，2024） [论文]
语义演化增强的图自编码器用于谣言检测（Tao等，2024） [论文]
T³RD：社交媒体上谣言检测的测试时训练（Zhang等，2024） [论文] [代码]
结合合成过采样的双图网络用于社交媒体上的不平衡谣言检测（Lu等，2024） [论文]
基于深度强化学习的社会网络谣言缓解（Su等，2024） [论文]
适应大语言模型时代的假新闻检测（Su等，2024） [论文] [代码]
新闻媒体来源画像的交互式框架（Mehta等，2024） [论文] [代码]
CMA-R：用于解释谣言检测的因果中介分析（Tian等，2024） [论文] [代码]
Style-News：结合风格化新闻生成与对抗验证的神经网络假新闻检测（Wang等，2024） [论文]
用于多模态假新闻检测的强化自适应知识学习（Zhang等，2024） [论文]
基于神经符号推理揭示多模态假新闻中的隐性欺骗模式（Dong等，2024） [论文] [代码]
传播树并不深：用于谣言检测的自适应图对比学习方法（Cui等，2024） [论文]
频谱在多模态表征与融合中更有效：一种多模态频谱谣言检测器（Lao等，2024） [论文] [代码]
GAMC：一种基于掩码图自编码器的无监督假新闻检测方法（Yin等，2024） [论文]
利用网络效应缓解假新闻：通过自我模仿学习选择辟谣者（Xu等，2024） [论文] [代码]
恶意行为者，良师益友：探索大语言模型在假新闻检测中的作用（Hu等，2024） [论文] [代码]
基于逻辑推理的可解释多模态虚假信息检测（Liu等，2023） [论文] [代码]
两个脑袋胜过一个：通过与邻居相关联提升假新闻视频检测效果（Qi等，2023） [论文] [代码]
从过去学习，为未来进化：预测时间趋势以辅助假新闻检测（Hu等，2023） [论文] [代码]
多模态假新闻检测中的因果干预与反事实推理（Chen等，2023） [论文]
MetaAdapt：基于元学习的领域自适应少样本虚假信息检测（Yue等，2023） [论文] [代码]
基于传播结构的零样本谣言检测（Lin等，2023） [论文]
基于对比学习和交叉注意力的无监督跨域谣言检测（Ran等，2023） [论文]
拉远视角观察：面向假新闻检测的新闻环境感知（Sheng等，2022） [论文] [代码]
DDGCN：用于社交媒体上谣言检测的双动态图卷积网络（Sun等，2022） [论文]
基于声明引导的层次化图注意力网络在Twitter上的谣言检测（Lin等，2021） [论文]
STANKER：基于层级粒度注意力掩码BERT的堆叠网络用于社交媒体上的谣言检测（Rao等，2021） [论文] [代码]
不一致性很重要：一种知识引导的双不一致性网络用于多模态谣言检测（Sun等，2021） [论文] [代码]
社交媒体上谣言识别的主动学习（Farinneya等，2021） [论文]
朝着传播不确定性迈进：边缘增强的贝叶斯图卷积网络用于谣言检测（Wei等，2021） [论文] [代码]
具有对抗意识的谣言检测（Song等，2021） [论文] [代码]
学习解耦潜在主题以对Twitter上的谣言真实性进行分类（Dougrez-Lewis等，2021） [论文] [代码]
为假新闻检测挖掘双重情感（Zhang等，2021） [论文] [代码]
将值得核查的声明检测视为正类未标注学习（Wright和Augenstein，2021） [论文] [代码]
利用微博对话结构检测谣言（Li等，2020） [论文]
使用树形Transformer在Twitter上辟谣（Ma等，2020） [论文]
VRoC：基于文本的变分自编码器辅助多任务谣言分类器（Cheng等，2020） [论文] [代码]
基于图结构对抗学习的社交媒体谣言检测（Yang等，2020） [论文]
通过关注用户互动实现微博中可解释的谣言检测（Khoo等，2020） [论文] [代码]
基于双向图卷积网络的社交媒体谣言检测（Bian等，2020） [论文] [代码]
假新闻早期检测：一种理论驱动的模型（Zhou等，2020） [论文]
MVAE：用于假新闻检测的多模态变分自编码器（Khattar等，2019） [论文] [代码]
使用几何深度学习检测社交媒体上的假新闻（Monti等，2019） [论文]
基于树状递归神经网络在Twitter上检测谣言（Ma等，2018） [论文] [代码]
基于层次社交注意力网络的谣言检测（Guo等，2018） [论文]
一种结合启发式方法和监督学习的混合识别系统，用于检测值得核查的声明（Zuo等，2018） [论文]
用于谣言分析的简单开放式立场分类（Aker等，2017） [论文]
NileTMRG参加SemEval-2017任务8：确定Twitter上谣言及其真实性支持（Enayet和El-Beltagy，2017） [论文]
Turing参加SemEval-2017任务8：使用分支LSTM的顺序方法进行谣言立场分类（Kochkina等，2017） [论文]
自动识别热门Twitter话题中的假新闻（Buntain和Golbeck，2017） [论文]
使用循环神经网络从微博中检测谣言（Ma等，2016） [论文] [数据集]

判决预测

真实性分类

我们需要针对特定语言的事实核查模型吗？以中文为例（张等，2024） [论文] [代码]
FinDVer: 面向长篇且混合内容金融文档的可解释性事实核查（Zhao 等，2024） [论文] [代码]
MiniCheck: 基于基础文档的高效大语言模型事实核查（Tang 等，2024） [论文] [代码]
基于多阶段重排序的事实核查证据检索（Malviya 等，2024） [论文]
ChartCheck: 面向真实图表图像的可解释性事实核查（Akhtar 等，2024） [论文] [代码]
证据检索几乎是事实核查的全部所需（Zheng 等，2024） [论文]
通过合成对比性论据进行检索增强的事实核查（Yue 等，2024） [论文] [代码]
MetaSumPerceiver: 面向事实核查的多模态多文档证据摘要（等，2024） [论文]
VeraCT Scan: 基于检索的、具有可解释推理的假新闻检测（Niu 等，2024） [论文] [演示]
Event-Radar: 事件驱动的多视角学习用于多模态假新闻检测（等，2024） [论文]
用于假新闻检测的统一证据增强推理框架（Wu 等，2024） [论文]
以自然语言为中心的推理网络用于多模态假新闻检测（Zhang 等，2024） [论文]
从生成到澄清：ChatGPT 在假新闻泥潭中的历程（Huang 等，2024） [论文]
MSynFD: 多跳语法感知的假新闻检测（Liang 等，2024） [论文]
应对新发危机中的假新闻：以新冠肺炎为例（Yang 等，2024） [论文] [代码]
Self-Checker: 用于大型语言模型事实核查的即插即用模块（Li 等，2024） [论文]
超出训练集范围的事实核查（Karisani 等，2024） [论文] [代码]
语言模型会幻觉，但可能擅长事实核查（Guan 等，2024） [论文] [代码]
使用野外检索证据进行复杂主张核查（Chen 等，2024） [论文] [代码]
MAPLE: 少样本主张核查的成对语言演化微观分析（Zeng 等，2024） [论文] [代码]
重新思考事实核查的损失函数（Mukobara 等，2024） [论文] [代码]
对比知识源用于开放域科学主张核查（Vladika 等，2024） [论文] [代码]
因果漫步：利用前门调整去偏多跳事实核查（Zhang 等，2024） [论文] [代码]
面向文本和表格的事实核查的异构图推理（Gong 等，2024） [论文] [代码]
对话中的自动化事实核查：是否需要专用模型？（Chamoun 等，2023） [论文]
DECKER: 利用异质知识双重检查常识性事实核查（Zou 等，2023） [论文] [代码]
Check-COVID: 利用科学证据核查新冠肺炎新闻主张（Wang 等，2023） [论文] [代码]
Claim-Dissector: 具有联合重排序和真实性预测的可解释事实核查系统（Fajcik 等，2023） [论文] [代码]
提示一致性优于自我一致性？基于预训练语言模型的少样本和零样本事实核查（Zeng 等，2023） [论文] [代码]
反事实去偏用于事实核查（Xu 等，2023） [论文]
利用程序引导推理核查复杂主张（Pan 等，2023） [论文] [代码]
自举式多视图表示用于假新闻检测（Ying 等，2023） [论文]
变焦问题生成用于事实核查（Ousidhoum 等，2022） [论文]
ProoFVer: 基于自然逻辑定理证明的事实核查（Krishna 等，2022） [论文]
MultiVerS: 利用弱监督和全文上下文改进科学主张核查（Wadden 等，2022） [论文] [代码]
为零样本科学事实核查生成科学主张（Wright 等，2022） [论文] [代码]
利用事实知识自动检测实体操纵文本（Jawahar 等，2022） [论文] [代码]
LOREN: 用于可解释事实核查的逻辑正则化推理（Chen 等，2022） [论文] [代码]
向细粒度推理迈进：用于假新闻检测（Jin 等，2022） [论文]
针对自动化事实核查系统的合成虚假信息攻击（Du 等，2021） [论文] [代码]
编辑语言模型中的事实知识（De Cao 等，2021） [论文] [代码]
面向基于表格的事实核查的逻辑级证据检索与基于图的验证网络（Shi 等，2021） [论文] [代码]
一起学习的学生学得更好：关于集体知识蒸馏在事实核查领域迁移中的重要性（Mithun 等，2021） [论文]
摘要、理由、立场：用于科学主张核查的联合模型（Zhang 等，2021） [论文] [代码]
基于表格的事实核查与显著性感知学习（Wang 等，2021） [论文] [代码]
探索分解法用于基于表格的事实核查（Yang 等，2021） [论文] [代码]
面向表格的开放式事实核查的联合验证与重排序（Schlichtkrull 等，2021） [论文] [代码]
面向知识密集型任务的多任务检索（Maillard 等，2021） [论文]
面向事实核查的主题感知证据推理与立场感知聚合（Si 等，2021） [论文] [代码]
基于DQN的方法寻找精确证据用于事实核查（Wan 等，2021） [论文] [代码]
统一双重视角认知模型用于可解释主张核查（Wu 等，2021） [论文]
与知识比较：基于外部知识的图神经网络假新闻检测（Hu 等，2021） [论文] [代码]
自动假新闻检测：模型是否正在学习推理？（Hansen 等，2021） [论文] [代码]
探索使用T5进行列表式证据推理用于事实核查（Jiang 等，2021） [论文]
多模态融合与协同注意力网络用于假新闻检测（Wu 等，2021） [论文]
用于基于证据的事实核查的多级注意力模型（Kruengkrai 等，2021） [论文] [代码]
强大而轻量的基线模型用于事实核查联合推理（Tymoshenko 等，2021） [论文] [代码]
面向知识密集型NLP任务的检索增强生成（Lewis 等，2020）。 [论文] [代码]
语言模型能充当事实核查员吗？（Lee 等，2020）。 [论文]
用于自动化事实提取和核查的层次化证据集建模（Subramanian 等，2020） [论文] [代码]
利用言语化和图注意力网络进行程序增强的事实核查（Yang 等，2020）。 [论文] [代码]
通过中间预训练理解表格（Eisenschlos 等，2020）。 [论文] [代码]
利用内核图注意力网络进行细粒度事实核查（Liu 等，2020）。 [论文] [代码]
基于语义级图进行事实核查的推理（Zhong 等，2020）。 [论文]
LogicalFactChecker: 利用逻辑运算结合图模块网络进行事实核查（Zhong 等，2020）。 [论文]
Scrutinizer: 一种混合式大规模数据驱动主张核查方法（Karagiannis 等，2020） [论文] [代码]
无监督问答用于事实核查（Jobanputra，2019）。 [论文] [代码]
GEAR: 基于图的证据聚合与推理用于事实核查（Zhou 等，2019）。 [论文] [代码]]
结合事实提取与核查的神经语义匹配网络（Nie 等，2019）。 [论文] [代码]
Team DOMLIN: 利用证据增强参加FEVER共享任务（Stammbach和Neumann，2019）。 [论文] [代码]
句子级证据嵌入用于主张核查与层次化注意力网络（Ma 等，2019）。 [论文]
BERT用于证据检索和主张核查（Soleimani等，2019） [论文] [代码]
TwoWingOS: 一种双翼优化策略用于证据主张核查（Yin和Roth，2018）。 [论文] [代码]
UKP-Athene: 多句文本蕴含用于主张核查（Hanselowski等，2018）。 [论文] [代码]
Team Papelo: FEVER中的Transformer网络（Malon，2018）。 [论文] [代码]
QED: 一个用于FEVER共享任务的事实核查系统（Luken等，2018）。 [论文] [代码]
UCL机器阅读小组：四因素框架用于事实发现（HexaF）（Yoneda等，2018）。 [论文] [代码]
仅凭谣言立场能否预测真实性？（Dungs等，2018）。 [论文]
不同色调：分析假新闻与政治事实核查中的语言（Rashkin等，2017）。 [论文]

操控分类

[论文] [数据集]

脱离上下文分类

基于多模态大语言模型从合成数据中学习的多模态虚假信息检测（Zeng 等，2024） [论文]
SNIFFER：用于可解释脱离上下文虚假信息检测的多模态大型语言模型（Qi 等，2024） [论文] [数据集]
利用模态特异性特征进行多模态操控检测与定位（Wang 等，2024） [论文]

理由生成

TELLER：一种可解释、可泛化且可控的可信假新闻检测框架（Liu 等，2024） [论文] [代码]
基于竞争智慧防御的大语言模型可解释假新闻检测（Wang 等，2024） [论文] [代码]
事实核查解释生成的基准测试（Russo 等，2023） [论文] [代码]
“为什么这是误导性的？”：通过解释检测新闻标题幻觉（Shen 等，2023） [论文]
基于显著性感知图学习探索多跳事实核查的忠实理由（Si 等，2023） [论文]
面向公共卫生声明的可解释自动化事实核查（Kotonya 和 Toni，2020）。 [论文] [代码] [数据集]
事实核查解释的生成（Atanasova 等，2020）。 [论文]
GCAN：面向社交媒体上可解释假新闻检测的图感知协同注意力网络（Lu 和 Li，2020）。 [论文] [代码]
DTCA：基于决策树的协同注意力网络用于可解释主张验证（Wu 等，2020）。 [论文]
ExFaKT：一个用于在知识图谱和文本上解释事实的框架（Gad-Elrab 等，2019） [论文] [代码]
dEFEND：可解释假新闻检测（Shu 等，2019）。 [论文]
基于概率答案集编程的可解释事实核查 [论文] [代码]
你的证据在哪里：通过理由建模改进事实核查（Alhindi 等，2018）。 [论文] [代码]
DeClarE：利用证据感知深度学习揭穿假新闻和虚假主张（Popat 等，2018）。 [论文]

教程

防范与检测大型语言模型生成的虚假信息 [Liu 等，SIGIR 2024]
事实核查、假新闻、宣传与媒体偏见：后真相时代的求真之旅 [Nakov 和 Da San Martino，EMNLP 2020]。
利用 NLP 检测与化解谣言和虚假信息 [Derczynski 和 Zubiaga，COLING 2020] [幻灯片]。
事实核查：理论与实践 [Dong 等，KDD 2018]。

⭐ 星标历史

Automated-Fact-Checking-Resources 快速上手指南

项目简介： Automated-Fact-Checking-Resources 并非一个可直接安装的软件包或 Python 库，而是一个** curated（精选）的资源仓库**。它汇总了自动化事实核查（AFC）领域的学术论文、数据集、共享任务、模型代码链接及相关综述。本指南将指导开发者如何高效利用该仓库获取研究所需的核心资源。

1. 环境准备

由于本项目主要是资源索引，无需特定的运行时环境。但为了使用仓库中链接到的具体模型和数据集，建议准备以下基础开发环境：

操作系统：Linux (推荐), macOS, 或 Windows
版本控制：Git
编程语言：Python 3.8+ (大多数关联模型依赖)
深度学习框架：PyTorch 或 TensorFlow (根据具体引用的模型而定)
网络环境：由于部分资源托管在 GitHub、Hugging Face 或学术网站，国内用户建议配置科学上网环境或使用代理加速下载。

2. 安装步骤（获取资源）

本项目无需通过 pip 或 conda 安装。请直接克隆仓库到本地以获取完整的资源列表和论文索引。

# 克隆仓库
git clone https://github.com/Cartus/Automated-Fact-Checking-Literature.git

# 进入目录
cd Automated-Fact-Checking-Literature

提示：如果直接克隆速度较慢，可使用国内镜像源加速（如 Gitee 镜像，若有）或通过代理设置：
git clone https://ghproxy.com/https://github.com/Cartus/Automated-Fact-Checking-Literature.git

3. 基本使用

本仓库的核心价值在于其结构化的分类索引。以下是获取特定资源的标准流程：

3.1 浏览任务定义与框架

打开根目录下的 README.md 文件，查看 Task Definition 部分。该部分定义了自动化事实核查的三大核心阶段：

Claim Detection (主张检测)
Evidence Retrieval (证据检索)
Verdict Prediction (结论预测)

3.2 查找并获取数据集

根据您的需求，在 README.md 的 Datasets 章节查找对应子类别。

示例：获取用于“主张检测”的多模态数据集

定位到 Claim Detection and Extraction Dataset 小节。
找到目标项目，例如 MR2 (Multimodal Retrieval-Augmented Rumor Detection)。
点击对应的 [[Dataset]] 链接（通常指向 GitHub 仓库）。
执行下载命令（以 MR2 为例）：

# 示例：克隆 MR2 数据集仓库
git clone https://github.com/THU-BPM/MR2.git

3.3 查找模型代码

在 Models 章节，您可以找到复现论文结果的官方代码链接。

示例：寻找“真实性分类”模型

定位到 Models -> Verdict Prediction -> Veracity Classification。
选择感兴趣的论文条目，点击其代码仓库链接。
按照该独立仓库中的 README 进行具体的模型训练和推理。

3.4 追踪最新进展

关注 README.md 顶部的 Updates 部分，该项目定期更新顶级会议（如 EMNLP, NeurIPS, ACL, WWW）的最新论文。

2024.12 更新：增加了大语言模型（LLM）事实性章节及 EMNLP/NeurIPS 2024 论文。
2024.06 更新：增加了 LLM 生成文本检测及相关任务。

注意：本仓库本身不包含可执行代码。所有具体的安装、训练和评估步骤，请参考您从本仓库链接跳转到的各个子项目（论文官方代码库）的说明文档。

常见问题

Vlachos & Riedel (2014) 事实核查数据集的原始链接失效了，在哪里可以找到该数据集？

HOVER 数据集的标签（verdict）应该定义为几类？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 159.3k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|1周前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架