[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-safe-graph--GNN-FakeNews":3,"tool-safe-graph--GNN-FakeNews":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",140436,2,"2026-04-05T23:32:43",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":80,"owner_location":80,"owner_email":81,"owner_twitter":80,"owner_website":82,"owner_url":83,"languages":84,"stars":89,"forks":90,"last_commit_at":91,"license":92,"difficulty_score":10,"env_os":93,"env_gpu":94,"env_ram":95,"env_deps":96,"category_tags":103,"github_topics":104,"view_count":10,"oss_zip_url":80,"oss_zip_packed_at":80,"status":16,"created_at":113,"updated_at":114,"faqs":115,"releases":155},872,"safe-graph\u002FGNN-FakeNews","GNN-FakeNews","A collection of GNN-based fake news detection models.","GNN-FakeNews 是一个基于图神经网络（GNN）的假新闻检测开源工具集，提供了多种用于识别虚假信息的模型实现。它主要解决了在社交媒体等复杂信息传播环境中，自动化、精准地检测假新闻的难题。通过将新闻传播过程建模为图结构（其中节点代表用户或新闻，边代表互动关系），工具能够深入挖掘用户偏好与传播模式中的深层特征，从而提升检测的准确性。\n\n该项目基于用户偏好感知的假新闻检测（UPFD）框架，将假新闻检测任务转化为图分类问题，并已在 PyTorch Geometric 和 DGL 两大主流图神经网络库中集成，便于直接调用。其包含的数据集（如 Politifact 和 GossipCop）提供了真实的推特传播网络数据，支持模型训练与评估。\n\nGNN-FakeNews 主要面向人工智能、自然语言处理或图神经网络领域的研究人员与开发者。适合那些希望复现或改进假新闻检测模型、进行相关学术实验，或需要利用图结构数据进行内容安全分析的技术团队使用。对于初学者，项目也提供了在 Code Ocean 上一键复现的云端环境，降低了配置门槛。\n\n技术亮点在于其采用的 UPFD 框架能有效融合新闻内容与用户社","GNN-FakeNews 是一个基于图神经网络（GNN）的假新闻检测开源工具集，提供了多种用于识别虚假信息的模型实现。它主要解决了在社交媒体等复杂信息传播环境中，自动化、精准地检测假新闻的难题。通过将新闻传播过程建模为图结构（其中节点代表用户或新闻，边代表互动关系），工具能够深入挖掘用户偏好与传播模式中的深层特征，从而提升检测的准确性。\n\n该项目基于用户偏好感知的假新闻检测（UPFD）框架，将假新闻检测任务转化为图分类问题，并已在 PyTorch Geometric 和 DGL 两大主流图神经网络库中集成，便于直接调用。其包含的数据集（如 Politifact 和 GossipCop）提供了真实的推特传播网络数据，支持模型训练与评估。\n\nGNN-FakeNews 主要面向人工智能、自然语言处理或图神经网络领域的研究人员与开发者。适合那些希望复现或改进假新闻检测模型、进行相关学术实验，或需要利用图结构数据进行内容安全分析的技术团队使用。对于初学者，项目也提供了在 Code Ocean 上一键复现的云端环境，降低了配置门槛。\n\n技术亮点在于其采用的 UPFD 框架能有效融合新闻内容与用户社交行为，且代码与数据集均已开源并经过良好封装，具备较强的可扩展性与可复现性。如果你在研究中使用了该项目，请引用其相关的 SIGIR 2021 论文。","# GNN-based Fake News Detection\n[![Open in Code Ocean](https:\u002F\u002Fcodeocean.com\u002Fcodeocean-assets\u002Fbadge\u002Fopen-in-code-ocean.svg)](https:\u002F\u002Fcodeocean.com\u002Fcapsule\u002F7305473\u002Ftree)\n\n\n[Installation](#installation) | [Datasets](#datasets) | [Models](#models) |  [PyG Example](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Fexamples\u002Fupfd.py)  | [DGL Example](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl\u002Fblob\u002Fmaster\u002Fpython\u002Fdgl\u002Fdata\u002Ffakenews.py)   | [Benchmark](https:\u002F\u002Fpaperswithcode.com\u002Fdataset\u002Fupfd) | [Intro Video](https:\u002F\u002Fyoutu.be\u002FQAIVFr24FrA) | [How to Contribute](#how-to-contribute)\n\n\nThis repo includes the Pytorch-Geometric implementation of a series of Graph Neural Network (GNN) based fake news detection models.\nAll [GNN models](#user-guide) are implemented and evaluated under the User Preference-aware Fake News Detection ([UPFD](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2104.12259.pdf)) framework.\nThe fake news detection problem is instantiated as a graph classification task under the UPFD framework. \n\nYou can make reproducible run on [CodeOcean](https:\u002F\u002Fcodeocean.com\u002Fcapsule\u002F7305473\u002Ftree) without manual configuration.\n\nThe UPFD dataset and its example usage is also available at the PyTorch-Geometric official repo\n\nWe welcome contributions of results of existing models and the SOTA results of new models based on our dataset.\nYou can check the [benchmark](https:\u002F\u002Fpaperswithcode.com\u002Fdataset\u002Fupfd) hosted by PaperWithCode for SOTA models and their performances.\n\nIf you use the code in your project, please cite the following paper:\n\nSIGIR'21 ([PDF](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2104.12259.pdf))\n```bibtex\n@inproceedings{dou2021user,\n  title={User Preference-aware Fake News Detection},\n  author={Dou, Yingtong and Shu, Kai and Xia, Congying and Yu, Philip S. and Sun, Lichao},\n  booktitle={Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval},\n  year={2021}\n}\n```\n\n## Installation\n\n### Install via PyG\n\nOur [dataset](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Ftorch_geometric\u002Fdatasets\u002Fupfd.py) has been integrated with the official PyTorch-Geometric library. Please follow the installation instructions of [PyTorch-Geometric](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric) to install the latest version of PyG and check the [code example](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Fexamples\u002Fupfd.py) for dataset usage.\n\n\n### Install via DGL\n\nOur [dataset](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl\u002Fblob\u002Fmaster\u002Fpython\u002Fdgl\u002Fdata\u002Ffakenews.py) has been integrated with the official [Deep Graph library](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl)(DGL). Please follow the installation instructions of [DGL](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl) to install the latest version of DGL and check the [docstring](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl\u002Fblob\u002Fmaster\u002Fpython\u002Fdgl\u002Fdata\u002Ffakenews.py) of the dataset class for dataset usage.\n\n### Manually Install\n\nTo run the code in this repo, you need to have `Python>=3.6`, `PyTorch>=1.6`, and `PyTorch-Geometric>=1.6.1`.\nPlease follow the installation instructions of [PyTorch-Geometric](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric) to install PyG.\n\nOther dependencies can be installed using the following commands:\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews.git\ncd GNN-FakeNews\npip install -r requirements.txt\n```\n\n## Datasets\n\nIf you have installed the latest version of PyG or DGL, you can use their built-in dataloaders to download and load the UPFD dataset.\n\nIf you install the project manually, you need to download the dataset (1.2GB) \nvia the links below and\nunzip the corresponding data under the `\\data\\{dataset_name}\\raw\\` directory, \nthe `dataset_name` is `politifact` or `gossipcop`.\n\nGoogle Drive: https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1OslTX91kLEYIi2WBnwuFtXsVz5SS_XeR?usp=sharing\n\nBaidu Disk: https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1NFtuwzmpAezNcJzlSlduSw Password: fj43\n\nThe dataset includes fake&real news propagation networks on Twitter built according to fact-check information from\n[Politifact](https:\u002F\u002Fwww.politifact.com\u002F) and [Gossipcop](https:\u002F\u002Fwww.gossipcop.com\u002F).\nThe news retweet graphs were originally extracted by [FakeNewsNet](https:\u002F\u002Fgithub.com\u002FKaiDMML\u002FFakeNewsNet).\nWe crawled near 20 million historical tweets from users who participated in fake news propagation in FakeNewsNet to\ngenerate node features in the dataset.\n\nThe statistics of the dataset is shown below:\n\n| Data  | #Graphs  | #Fake News| #Total Nodes  | #Total Edges  | #Avg. Nodes per Graph  |\n|-------|--------|--------|--------|--------|--------|\n| Politifact | 314   |   157    |  41,054  | 40,740 |  131 |\n| Gossipcop |  5464  |   2732   |  314,262  | 308,798  |  58  |\n\n\nDue to the Twitter policy, we could not release the crawled user historical tweets publicly.\nTo get the corresponding Twitter user information, you can refer to news lists and the node_id-twitter_id mappings under `\\data`.\nTwo `xxx_id_twitter_mapping.pkl` files include the dictionaries with the keys as the node_ids in the datasets and the values represent corresponding Twitter user_ids.\nFor the news node, its value represents news id in the [FakeNewsNet](https:\u002F\u002Fgithub.com\u002FKaiDMML\u002FFakeNewsNet) datasets.\nSimilarly, two `xxx_id_time_mapping.pkl` files include the node_id to its corresponding Tweet timestamp mappings.\nNote that the timestamp is in UNIX timestamp format. The news node doesn’t contain timestamp even in the original FakeNewsNet dataset, you can either retrieve it on Twitter or use its most recent retweet time as an approximation.\nIn the UPFD project, we use [Tweepy](https:\u002F\u002Fwww.tweepy.org\u002F) and [Twitter Developer API](https:\u002F\u002Fdeveloper.twitter.com\u002Fen) to get the user information, the crawler code can be found at [\\utils\\twitter_crawler.py](https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fblob\u002Fmain\u002Futils\u002Ftwitter_crawler.py).\n\nWe incorporate four node feature types in the dataset, the 768-dimensional `bert` and 300-dimensional `spacy` features \nare encoded using pretrained [BERT](https:\u002F\u002Fgithub.com\u002Fhanxiao\u002Fbert-as-service) and [spaCy](https:\u002F\u002Fspacy.io\u002Fmodels\u002Fen#en_core_web_lg) word2vec, respectively.\nThe 10-dimensional `profile` feature is obtained from a Twitter account's profile.\nYou can refer to [profile_feature.py](https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fblob\u002Fmaster\u002Futils\u002Fprofile_feature.py) for profile feature extraction.\nThe 310-dimensional `content` feature is composed of a 300-dimensional user comment word2vec (spaCy) embedding\nplus a 10-dimensional profile feature.\n\nEach graph is a hierarchical tree-structured graph where the root node represents the news, the leaf nodes are Twitter users who retweeted the root news.\nA user node has an edge to the news node if he\u002Fshe retweeted the news tweet. Two user nodes have an edge if one user retweeted the news tweet from the other user.\nThe following figure shows the UPFD framework including the dataset construction details \nYou can refer to the [paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2005.00625.pdf) for more details about the dataset.\n\n\u003Cp align=\"center\">\n    \u003Cbr>\n    \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsafe-graph_GNN-FakeNews_readme_8bae01a241f4.png\" width=\"1000\"\u002F>\n    \u003C\u002Fa>\n    \u003Cbr>\n\u003Cp>\n\n## Models\n\nAll GNN-based fake news detection models are under the `\\gnn_model` directory.\nYou can fine-tune each model according to arguments specified in the argparser of each model.\nThe implemented models are as follows:\n\n* **[GNN-CL](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2007.03316.pdf)**: Han, Yi, Shanika Karunasekera, and Christopher Leckie. \"Graph neural networks with continual learning for fake news detection from social media.\" arXiv preprint arXiv:2007.03316 (2020).\n* **[GCNFN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1902.06673.pdf)**: Monti, Federico, Fabrizio Frasca, Davide Eynard, Damon Mannion, and Michael M. Bronstein. \"Fake news detection on social media using geometric deep learning.\" arXiv preprint arXiv:1902.06673 (2019).\n* **[BiGCN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2001.06362.pdf)**: Bian, Tian, Xi Xiao, Tingyang Xu, Peilin Zhao, Wenbing Huang, Yu Rong, and Junzhou Huang. \"Rumor detection on social media with bi-directional graph convolutional networks.\" In Proceedings of the AAAI Conference on Artificial Intelligence, vol. 34, no. 01, pp. 549-556. 2020.\n* **[UPFD-GCN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1609.02907.pdf)**: Kipf, Thomas N., and Max Welling. \"Semi-supervised classification with graph convolutional networks.\" arXiv preprint arXiv:1609.02907 (2016).\n* **[UPFD-GAT](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1710.10903.pdf)**: Veličković, Petar, Guillem Cucurull, Arantxa Casanova, Adriana Romero, Pietro Lio, and Yoshua Bengio. \"Graph attention networks.\" arXiv preprint arXiv:1710.10903 (2017).\n* **[UPFD-SAGE](https:\u002F\u002Fcs.stanford.edu\u002Fpeople\u002Fjure\u002Fpubs\u002Fgraphsage-nips17.pdf)**: Hamilton, William L., Rex Ying, and Jure Leskovec. \"Inductive representation learning on large graphs.\" arXiv preprint arXiv:1706.02216 (2017).\n\nSince the UPFD framework is built upon the [PyG](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric), you can easily try other graph classification models\nlike [GIN](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Fexamples\u002Fmutag_gin.py) and [HGP-SL](https:\u002F\u002Fgithub.com\u002Fcszhangzhen\u002FHGP-SL)\nunder our dataset.\n\n\n## How to Contribute\nYou are welcomed to submit your model code, hyper-parameters, and results to this repo via create a pull request.\nAfter verifying the results, your model will be added to the repo and the result will be updated to the [benchmark](https:\u002F\u002Fpaperswithcode.com\u002Fdataset\u002Fupfd).\nPlease email to [ytongdou@gmail.com](mailto:ytongdou@gmail.com) for other inquiries.\n","# 基于图神经网络（GNN）的假新闻检测\n[![在 Code Ocean 中打开](https:\u002F\u002Fcodeocean.com\u002Fcodeocean-assets\u002Fbadge\u002Fopen-in-code-ocean.svg)](https:\u002F\u002Fcodeocean.com\u002Fcapsule\u002F7305473\u002Ftree)\n\n[安装](#安装) | [数据集](#数据集) | [模型](#模型) | [PyG 示例](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Fexamples\u002Fupfd.py) | [DGL 示例](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl\u002Fblob\u002Fmaster\u002Fpython\u002Fdgl\u002Fdata\u002Ffakenews.py) | [基准测试](https:\u002F\u002Fpaperswithcode.com\u002Fdataset\u002Fupfd) | [介绍视频](https:\u002F\u002Fyoutu.be\u002FQAIVFr24FrA) | [如何贡献](#如何贡献)\n\n本仓库包含了一系列基于图神经网络（Graph Neural Network, GNN）的假新闻检测模型的 PyTorch-Geometric 实现。所有 [GNN 模型](#用户指南) 均在用户偏好感知的假新闻检测（User Preference-aware Fake News Detection, [UPFD](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2104.12259.pdf)）框架下实现和评估。在 UPFD 框架下，假新闻检测问题被实例化为一个图分类任务。\n\n您可以在 [CodeOcean](https:\u002F\u002Fcodeocean.com\u002Fcapsule\u002F7305473\u002Ftree) 上进行可复现的运行，无需手动配置。\n\nUPFD 数据集及其使用示例也可以在 PyTorch-Geometric 官方仓库中找到。\n\n我们欢迎基于我们数据集贡献现有模型的结果以及新模型的 SOTA（State-Of-The-Art）结果。您可以查看由 PaperWithCode 托管的 [基准测试](https:\u002F\u002Fpaperswithcode.com\u002Fdataset\u002Fupfd) 以了解 SOTA 模型及其性能。\n\n如果您在项目中使用此代码，请引用以下论文：\n\nSIGIR'21 ([PDF](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2104.12259.pdf))\n```bibtex\n@inproceedings{dou2021user,\n  title={User Preference-aware Fake News Detection},\n  author={Dou, Yingtong and Shu, Kai and Xia, Congying and Yu, Philip S. and Sun, Lichao},\n  booktitle={Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval},\n  year={2021}\n}\n```\n\n## 安装\n\n### 通过 PyG 安装\n\n我们的[数据集](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Ftorch_geometric\u002Fdatasets\u002Fupfd.py)已集成到官方的 PyTorch-Geometric 库中。请按照 [PyTorch-Geometric](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric) 的安装说明安装最新版本的 PyG，并查看[代码示例](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Fexamples\u002Fupfd.py)了解数据集的使用方法。\n\n### 通过 DGL 安装\n\n我们的[数据集](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl\u002Fblob\u002Fmaster\u002Fpython\u002Fdgl\u002Fdata\u002Ffakenews.py)已集成到官方的 [Deep Graph Library (DGL)](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl) 中。请按照 [DGL](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl) 的安装说明安装最新版本的 DGL，并查看数据集类的[文档字符串](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl\u002Fblob\u002Fmaster\u002Fpython\u002Fdgl\u002Fdata\u002Ffakenews.py)了解数据集的使用方法。\n\n### 手动安装\n\n要运行此仓库中的代码，您需要安装 `Python>=3.6`、`PyTorch>=1.6` 和 `PyTorch-Geometric>=1.6.1`。请按照 [PyTorch-Geometric](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric) 的安装说明安装 PyG。\n\n其他依赖项可以使用以下命令安装：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews.git\ncd GNN-FakeNews\npip install -r requirements.txt\n```\n\n## 数据集\n\n如果您已安装最新版本的 PyG 或 DGL，可以使用其内置的数据加载器来下载和加载 UPFD 数据集。\n\n如果手动安装本项目，您需要通过以下链接下载数据集（1.2GB），并将解压后的数据放置在 `\\data\\{dataset_name}\\raw\\` 目录下，其中 `dataset_name` 为 `politifact` 或 `gossipcop`。\n\nGoogle 云端硬盘：https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1OslTX91kLEYIi2WBnwuFtXsVz5SS_XeR?usp=sharing\n\n百度网盘：https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1NFtuwzmpAezNcJzlSlduSw 提取码：fj43\n\n该数据集包含了根据 [Politifact](https:\u002F\u002Fwww.politifact.com\u002F) 和 [Gossipcop](https:\u002F\u002Fwww.gossipcop.com\u002F) 的事实核查信息构建的 Twitter 虚假与真实新闻传播网络。新闻转发图最初由 [FakeNewsNet](https:\u002F\u002Fgithub.com\u002FKaiDMML\u002FFakeNewsNet) 提取。我们爬取了 FakeNewsNet 中参与虚假新闻传播用户的近 2000 万条历史推文，以生成数据集中的节点特征。\n\n数据集统计信息如下：\n\n| 数据 | #图数量 | #虚假新闻数量 | #总节点数 | #总边数 | #平均每图节点数 |\n|-------|--------|--------|--------|--------|--------|\n| Politifact | 314   |   157    |  41,054  | 40,740 |  131 |\n| Gossipcop |  5464  |   2732   |  314,262  | 308,798  |  58  |\n\n由于 Twitter 政策限制，我们无法公开分享爬取的用户历史推文。要获取相应的 Twitter 用户信息，您可以参考 `\\data` 目录下的新闻列表和 node_id-twitter_id 映射文件。两个 `xxx_id_twitter_mapping.pkl` 文件包含了字典，其键为数据集中的节点 ID，值代表对应的 Twitter 用户 ID。对于新闻节点，其值代表 [FakeNewsNet](https:\u002F\u002Fgithub.com\u002FKaiDMML\u002FFakeNewsNet) 数据集中的新闻 ID。类似地，两个 `xxx_id_time_mapping.pkl` 文件包含了节点 ID 到其对应推文时间戳的映射。请注意，时间戳为 UNIX 时间戳格式。新闻节点即使在原始的 FakeNewsNet 数据集中也不包含时间戳，您可以在 Twitter 上检索它，或使用其最近的转发时间作为近似值。在 UPFD 项目中，我们使用 [Tweepy](https:\u002F\u002Fwww.tweepy.org\u002F) 和 [Twitter 开发者 API](https:\u002F\u002Fdeveloper.twitter.com\u002Fen) 来获取用户信息，爬虫代码可以在 [\\utils\\twitter_crawler.py](https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fblob\u002Fmain\u002Futils\u002Ftwitter_crawler.py) 找到。\n\n我们在数据集中整合了四种节点特征类型，768 维的 `bert` 特征和 300 维的 `spacy` 特征分别使用预训练的 [BERT](https:\u002F\u002Fgithub.com\u002Fhanxiao\u002Fbert-as-service) 和 [spaCy](https:\u002F\u002Fspacy.io\u002Fmodels\u002Fen#en_core_web_lg) word2vec 编码得到。10 维的 `profile` 特征是从 Twitter 账户的个人资料中获取的。您可以参考 [profile_feature.py](https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fblob\u002Fmaster\u002Futils\u002Fprofile_feature.py) 了解个人资料特征的提取方法。310 维的 `content` 特征由 300 维的用户评论 word2vec（spaCy）嵌入加上 10 维的个人资料特征组成。\n\n每个图都是一个层次化的树状结构图，其中根节点代表新闻，叶节点是转发了该新闻的 Twitter 用户。如果用户转发了新闻推文，则用户节点与新闻节点之间有一条边。如果一个用户从另一个用户那里转发了新闻推文，则两个用户节点之间有一条边。下图展示了 UPFD 框架，包括数据集构建的详细信息。您可以参考[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2005.00625.pdf)获取关于数据集的更多细节。\n\n\u003Cp align=\"center\">\n    \u003Cbr>\n    \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\">\n        \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsafe-graph_GNN-FakeNews_readme_8bae01a241f4.png\" width=\"1000\"\u002F>\n    \u003C\u002Fa>\n    \u003Cbr>\n\u003Cp>\n\n## 模型\n\n所有基于 GNN（图神经网络）的虚假新闻检测模型都在 `\\gnn_model` 目录下。您可以根据每个模型的参数解析器中指定的参数对每个模型进行微调。已实现的模型如下：\n\n* **[GNN-CL](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2007.03316.pdf)**: Han, Yi, Shanika Karunasekera, and Christopher Leckie. \"Graph neural networks with continual learning for fake news detection from social media.\" arXiv preprint arXiv:2007.03316 (2020).\n* **[GCNFN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1902.06673.pdf)**: Monti, Federico, Fabrizio Frasca, Davide Eynard, Damon Mannion, and Michael M. Bronstein. \"Fake news detection on social media using geometric deep learning.\" arXiv preprint arXiv:1902.06673 (2019).\n* **[BiGCN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2001.06362.pdf)**: Bian, Tian, Xi Xiao, Tingyang Xu, Peilin Zhao, Wenbing Huang, Yu Rong, and Junzhou Huang. \"Rumor detection on social media with bi-directional graph convolutional networks.\" In Proceedings of the AAAI Conference on Artificial Intelligence, vol. 34, no. 01, pp. 549-556. 2020.\n* **[UPFD-GCN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1609.02907.pdf)**: Kipf, Thomas N., and Max Welling. \"Semi-supervised classification with graph convolutional networks.\" arXiv preprint arXiv:1609.02907 (2016).\n* **[UPFD-GAT](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1710.10903.pdf)**: Veličković, Petar, Guillem Cucurull, Arantxa Casanova, Adriana Romero, Pietro Lio, and Yoshua Bengio. \"Graph attention networks.\" arXiv preprint arXiv:1710.10903 (2017).\n* **[UPFD-SAGE](https:\u002F\u002Fcs.stanford.edu\u002Fpeople\u002Fjure\u002Fpubs\u002Fgraphsage-nips17.pdf)**: Hamilton, William L., Rex Ying, and Jure Leskovec. \"Inductive representation learning on large graphs.\" arXiv preprint arXiv:1706.02216 (2017).\n\n由于 UPFD 框架构建于 [PyG](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric) 之上，您可以轻松地在本数据集上尝试其他图分类模型，例如 [GIN](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Fexamples\u002Fmutag_gin.py) 和 [HGP-SL](https:\u002F\u002Fgithub.com\u002Fcszhangzhen\u002FHGP-SL)。\n\n## 如何贡献\n\n欢迎您通过创建拉取请求（Pull Request）向本仓库提交您的模型代码、超参数和结果。验证结果后，您的模型将被添加到仓库中，结果也将更新到[基准测试](https:\u002F\u002Fpaperswithcode.com\u002Fdataset\u002Fupfd)中。其他咨询请发送邮件至 [ytongdou@gmail.com](mailto:ytongdou@gmail.com)。","# GNN-FakeNews 快速上手指南\n\n## 环境准备\n\n- **操作系统**: Linux \u002F macOS \u002F Windows (建议使用 Linux 或 WSL)\n- **Python**: >= 3.6\n- **PyTorch**: >= 1.6\n- **PyTorch-Geometric (PyG)**: >= 1.6.1 (或 DGL 最新版)\n\n## 安装步骤\n\n### 方案一：通过 PyTorch-Geometric 安装（推荐）\n\n1.  按照官方指南安装 PyTorch 和 PyTorch-Geometric：\n    ```bash\n    # 首先安装 PyTorch (请根据您的 CUDA 版本选择对应命令)\n    # 例如，对于 CUDA 11.3:\n    pip install torch torchvision torchaudio --extra-index-url https:\u002F\u002Fdownload.pytorch.org\u002Fwhl\u002Fcu113\n\n    # 安装 PyTorch-Geometric 及其依赖\n    # 国内用户可使用清华镜像加速\n    pip install torch-scatter torch-sparse torch-cluster torch-spline-conv -f https:\u002F\u002Fdata.pyg.org\u002Fwhl\u002Ftorch-1.13.0+cu113.html\n    pip install torch-geometric\n    ```\n    详细安装说明请参考 [PyG 官方文档](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric)。\n\n2.  UPFD 数据集已集成在 PyG 中，可直接使用。示例代码位于 [upfd.py](https:\u002F\u002Fgithub.com\u002Frusty1s\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Fexamples\u002Fupfd.py)。\n\n### 方案二：通过 DGL 安装\n\n1.  按照官方指南安装 DGL：\n    ```bash\n    # 例如，对于 CUDA 11.3:\n    pip install dgl-cu113 dglgo -f https:\u002F\u002Fdata.dgl.ai\u002Fwheels\u002Frepo.html\n    ```\n    详细安装说明请参考 [DGL 官方文档](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl)。\n\n2.  UPFD 数据集也已集成在 DGL 中，使用说明见 [fakenews.py](https:\u002F\u002Fgithub.com\u002Fdmlc\u002Fdgl\u002Fblob\u002Fmaster\u002Fpython\u002Fdgl\u002Fdata\u002Ffakenews.py) 的文档字符串。\n\n### 方案三：手动安装（用于开发或运行本仓库代码）\n\n1.  克隆仓库并安装依赖：\n    ```bash\n    git clone https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews.git\n    cd GNN-FakeNews\n    pip install -r requirements.txt\n    ```\n\n2.  **（可选）下载数据集**：\n    如果您需要手动管理数据，可以从以下链接下载 UPFD 数据集（1.2GB），解压到 `.\u002Fdata\u002F{dataset_name}\u002Fraw\u002F` 目录下（`dataset_name` 为 `politifact` 或 `gossipcop`）。\n    - **Google Drive**: [链接](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1OslTX91kLEYIi2WBnwuFtXsVz5SS_XeR?usp=sharing)\n    - **百度网盘（国内推荐）**: [链接](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1NFtuwzmpAezNcJzlSlduSw) 密码: fj43\n\n## 基本使用\n\n以下是一个使用 PyG 加载数据集并训练一个简单 GCN 模型的**最简示例**：\n\n```python\nimport torch\nfrom torch_geometric.datasets import UPFD\nfrom torch_geometric.loader import DataLoader\nfrom gnn_model.upfd_gcn import GCN\n\n# 1. 加载数据集 (PyG 会自动下载)\ndataset = UPFD(root='.\u002Fdata', name='politifact', feature='bert', split='train')\nprint(f'Dataset: {dataset}')\nprint(f'Number of graphs: {len(dataset)}')\n\n# 2. 创建数据加载器\ntrain_loader = DataLoader(dataset, batch_size=32, shuffle=True)\n\n# 3. 初始化模型\ndevice = torch.device('cuda' if torch.cuda.is_available() else 'cpu')\nmodel = GCN(in_channels=768, hidden_channels=128, out_channels=2, num_layers=2).to(device)\noptimizer = torch.optim.Adam(model.parameters(), lr=0.001)\n\n# 4. 简单的训练循环示例\nmodel.train()\nfor data in train_loader:\n    data = data.to(device)\n    optimizer.zero_grad()\n    out = model(data.x, data.edge_index, data.batch)\n    loss = torch.nn.functional.cross_entropy(out, data.y)\n    loss.backward()\n    optimizer.step()\n    print(f'Batch Loss: {loss.item():.4f}')\n```\n\n**关键参数说明**：\n- `name`: 数据集名称，可选 `'politifact'` 或 `'gossipcop'`。\n- `feature`: 节点特征类型，可选 `'bert'` (768维), `'spacy'` (300维), `'profile'` (10维), `'content'` (310维)。\n- `split`: 数据划分，可选 `'train'`, `'val'`, `'test'`。\n\n要运行本仓库中提供的完整模型（如 `GCNFN`, `BiGCN` 等），请进入 `gnn_model` 目录，查看各模型文件顶部的参数解析器，并使用如下命令运行：\n```bash\ncd gnn_model\npython upfd_gcn.py --dataset politifact --feature bert --epochs 50\n```\n\n更多高级用法和模型细节，请参考仓库中的具体实现和论文。","**场景背景**：某社交媒体平台的内容审核团队需要实时识别平台上的虚假新闻，尤其是涉及公共卫生事件的谣言。团队由数据分析师和算法工程师组成，他们需要从海量用户转发、评论和社交关系中快速、准确地判断信息的真实性。\n\n### 没有 GNN-FakeNews 时\n- **依赖有限特征**：主要依靠文本关键词匹配和简单的用户信誉评分，难以识别经过修饰或伪装的内容，误报和漏报率高。\n- **忽略传播结构**：无法有效利用信息是如何通过用户网络（谁转发谁、评论关系）传播的，而这是虚假新闻传播模式的关键特征。\n- **模型开发周期长**：从收集图结构数据、构建图神经网络模型到训练评估，需要团队投入大量时间进行底层代码开发和调试，响应热点事件速度慢。\n- **缺乏可复现基准**：不同团队或实验使用的数据集、评估标准不一，难以横向比较模型效果，内部技术迭代效率低下。\n- **部署集成复杂**：自研的图模型与现有的内容处理流水线集成困难，需要大量适配工作，无法快速上线验证。\n\n### 使用 GNN-FakeNews 后\n- **利用多维图特征**：直接使用 GNN-FakeNews 提供的预建数据集（如 UPFD）和模型，能同时分析新闻文本、用户属性和复杂的传播网络图，显著提升识别精度。\n- **捕捉传播模式**：通过其集成的图神经网络模型，自动学习虚假新闻在社交网络中的扩散模式（如爆发性、特定社群聚集），更准确定位谣言源头和路径。\n- **快速建模与实验**：借助 PyG 或 DGL 的即用型数据加载器和预实现模型（如 GCN、GAT），团队能快速搭建、训练并评估检测系统，将开发重心从底层代码转移到业务调优上。\n- **统一评估标准**：使用其提供的标准化数据集和评估框架，团队内部及与学术界对比有了共同基准，能更客观地衡量模型进步并选择最优方案。\n- **便捷部署与扩展**：该工具与主流图学习框架深度集成，模型易于导出并嵌入到平台现有的实时内容分析流水线中，支持快速 A\u002FB 测试和模型迭代更新。\n\n**核心价值**：GNN-FakeNews 将基于图神经网络的虚假新闻检测从复杂的研究工程转化为可快速落地、持续迭代的业务解决方案，帮助平台在信息传播的早期更精准地遏制谣言。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsafe-graph_GNN-FakeNews_e5df1573.png","safe-graph","SafeGraph","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fsafe-graph_f8c42abc.png","Towards Secure Machine Learning on Graph Data",null,"bdscsafegraph@gmail.com","https:\u002F\u002Fbdsc.lab.uic.edu\u002FNSF1930941.html","https:\u002F\u002Fgithub.com\u002Fsafe-graph",[85],{"name":86,"color":87,"percentage":88},"Python","#3572A5",100,546,106,"2026-03-24T00:39:53","Apache-2.0","Linux, macOS, Windows","未明确要求，但建议使用支持CUDA的NVIDIA GPU以加速PyTorch和PyG训练。","未说明",{"notes":97,"python":98,"dependencies":99},"项目可通过PyG或DGL库直接安装使用其内置数据集。手动安装需下载约1.2GB数据集。使用twitter_crawler.py获取用户信息需Twitter开发者API密钥。",">=3.6",[100,101,102],"torch>=1.6","torch-geometric>=1.6.1","tweepy",[13,54],[105,106,107,108,109,110,111,112],"fakenewsdetection","misinformation","graphneuralnetwork","machine-learning","benchmarking","social-media","social-network-analysis","deep-learning","2026-03-27T02:49:30.150509","2026-04-06T08:41:36.220494",[116,121,126,131,136,141,146,151],{"id":117,"question_zh":118,"answer_zh":119,"source_url":120},3750,"如何运行论文《User Preference-aware Fake News Detection》中的模型？","您需要先按照论文第2.2节的方法，从Twitter上爬取新闻帖子和相关的推文，构建新闻传播图。然后，参考本仓库的 `data_loader.py` 文件，将收集到的数据（邻接矩阵、节点特征、新闻标签）转换为PyG数据格式。训练时保存性能最佳的模型变量，之后便可加载该模型对新收集的新闻进行分类。","https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fissues\u002F20",{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},3751,"运行代码时遇到错误 `'list' object is not callable` 如何解决？","这个错误通常出现在 `utils\u002Feval_helper.py` 文件的第15行 `data_size = len(loader.dataset.indices())`。解决方案是将 `dataset.indices()` 改为 `dataset.indices`。该问题可能与PyG数据加载器及其多GPU集成有关，请确保安装了正确配置的最新版PyG。如果仍有问题，请向PyG项目报告。","https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fissues\u002F9",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},3752,"运行 `gnn.py` 时遇到 `'tupleBatch' object has no attribute 'stores_as'` 错误怎么办？","此错误可能是由PyG数据加载器引起的。请确保正确安装了最新版本的PyG。您可以尝试运行PyG官方的UPFD示例代码（https:\u002F\u002Fgithub.com\u002Fpyg-team\u002Fpytorch_geometric\u002Fblob\u002Fmaster\u002Fexamples\u002Fupfd.py）来测试。如果问题依旧，请考虑安装PyG 1.6.1版本，而不是2.0+版本，或者将错误报告给PyG项目。","https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fissues\u002F10",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},3753,"spaCy word2vec嵌入的序列长度和词嵌入维度是多少？","我们使用spaCy的 `en_core_web_lg` 模型对文本进行编码，其嵌入维度为300。该模型通过预训练的word2vec向量对任意长度的序列进行编码。具体来说，句子嵌入是通过对句子中所有300维的词（token）的word2vec嵌入取平均得到的。","https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fissues\u002F16",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},3754,"如何用训练好的模型对未知数据进行分类（预测）？","首先，需要按照论文方法从Twitter收集新数据并构建新闻传播图。然后，参考 `data_loader.py` 将数据转换为PyG格式。在训练旧数据时，保存性能最佳模型的变量。之后，加载这个最佳模型，即可基于新收集新闻的传播图对其进行分类。这相当于机器学习中的“转换”（transform）步骤。","https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fissues\u002F2",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},3755,"能否提供原始数据（原始推文）？","由于Twitter的政策限制，我们无法分享来自Twitter的原始数据。原始推文包含用户个人信息，公开分享违反了Twitter的服务条款。我们提供的处理后的数据集（如 `new_bert_feature.npz`）是为了方便模型复现和研究。对于无法爬取的过时或已删除推文，建议尝试寻找其他公开的谣言检测数据集。","https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fissues\u002F18",{"id":147,"question_zh":148,"answer_zh":149,"source_url":150},3756,"数据集中的 `new_bert_feature.npz` 文件是做什么用的？","`new_bert_feature.npz` 文件包含了使用BERT模型提取的新闻文本特征。这些特征被用作图神经网络模型的节点输入特征之一，以帮助进行假新闻检测。它是我们提供的数据集的一部分，用于复现论文中的实验结果。","https:\u002F\u002Fgithub.com\u002Fsafe-graph\u002FGNN-FakeNews\u002Fissues\u002F23",{"id":152,"question_zh":153,"answer_zh":154,"source_url":150},3757,"在本地运行代码与在CodeOcean上运行结果差异很大，可能是什么原因？","这很可能是由于处理后的数据或PyG版本不一致导致的。建议您在本地机器上安装与CodeOcean.com上完全相同的PyG版本，以确保环境一致。如果性能仍然无法对齐，问题可能出在数据预处理步骤上。",[]]