[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-gabriben--awesome-generative-information-retrieval":3,"tool-gabriben--awesome-generative-information-retrieval":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",145895,2,"2026-04-08T11:32:59",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108111,"2026-04-08T11:23:26",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":65,"owner_company":75,"owner_location":76,"owner_email":65,"owner_twitter":65,"owner_website":65,"owner_url":77,"languages":65,"stars":78,"forks":79,"last_commit_at":80,"license":65,"difficulty_score":81,"env_os":82,"env_gpu":83,"env_ram":83,"env_deps":84,"category_tags":87,"github_topics":89,"view_count":32,"oss_zip_url":65,"oss_zip_packed_at":65,"status":17,"created_at":97,"updated_at":98,"faqs":99,"releases":100},5573,"gabriben\u002Fawesome-generative-information-retrieval","awesome-generative-information-retrieval",null,"awesome-generative-information-retrieval 是一个专注于“生成式信息检索”领域的开源资源合集。随着大语言模型开始具备联网搜索及为回答提供来源引用的能力，它们正逐渐演变为新型的信息检索引擎，甚至挑战传统搜索引擎的地位。该项目旨在系统性地梳理这一前沿领域，解决用户在面对海量分散技术文献时难以把握核心脉络的痛点。\n\n内容涵盖两大核心方向：一是“基于事实的回答生成”，包括检索增强生成（RAG）、LLM 记忆操控、自我修正及多模态检索等关键技术；二是“生成式文档检索”，涉及直接生成文档标识符等创新范式。此外，还收录了生成式推荐、知识图谱构建及相关数据集、评估方法和前沿博客文章。\n\n无论是希望深入探索 RAG 架构的研究人员，还是致力于构建企业级智能问答系统的开发者，都能从中找到极具价值的参考指引。其独特亮点在于不仅罗列工具，更从认识论角度对技术进行了科学分类，帮助从业者清晰理解从数据检索到可信生成的完整技术链路，是进入该领域的优质入门地图。","# awesome-generative-information-retrieval [![Awesome](https:\u002F\u002Fawesome.re\u002Fbadge-flat2.svg)](https:\u002F\u002Fawesome.re)\n\nConversational models started to be able to access the web or backup their claims with sources (a.k.a. attribution). These chatbots are thus arguably information retrieval machines, competing against or even substituing traditional search engines. We would like to dedicate a space to these models but also to the more general field of generative information retrieval. We tentatively devide the field in two main topics: **Grounded Answer Generation** and **Generative Document Retrieval**. We also include generative recommendation, generative grounded summarization etc.\n\nPull-requests welcome!\n\n# Table of Contents\n\n- [Blog Posts](#blog-posts)\n- [Datasets](#datasets)\n- [Tools](#tools)\n- [Evaluation](#evaluation)\n- [Workshops and Tutorials](#workshops-and-tutorials)\n- [Epistemology Papers](#epistemology-papers)\n- [Grounded Answer Generation](#grounded-answer-generation)\n  - [Retrieval Augmented Generation (RAG)](#retrieval-augmented-generation-rag)  (external grounding\u002Fretrieval at inference time)\n  - [LLM Memory Manipulation](#llm-memory-manipulation) (grounded in internal model weights at inference time)\n  - [Re-Ranking](#re-ranking)\n  - [Self-Correction](#self-correction)\n  - [Fact Uncertainty Estimates](#fact-uncertainty-estimates)\n  - [Constrained Generation](#constrained-generation)\n  - [Data Centric](#data-centric)\n  - [Utility Maximization](#utility-maximization)\n  - [Multimodal](#multimodal)\n  - [Prompting](#prompting)\n  - [Generate Code](#generate-code)\n  - [Query Generation](#query-generation)\n  - [Summarization and Document Rewriting](#summarization-and-document-rewriting)\n  - [Table QA](#table-qa)\n- [Generative Document Retrieval](#generative-document-retrieval)\n  - [Generate a Document ID as an identifier](#generate-a-document-id-as-an-identifier)\n  - [Generate a string as an identifier](#generate-a-string-as-an-identifier)\n  - [Continual Learning for Generative Retrieval](#continual-learning-for-generative-retrieval)  \n  - [Applications](#applications)\n- [Generative Recommendation](#generative-recommendation)\n- [Generative Knowledge Graphs](#generative-knowledge-graphs)\n- [Live Generative Retrieval](#live-generative-retrieval)\n\n## Blog Posts\n\n**Deterministic Quoting: Making LLMs Safer for Healthcare**  \n*Matt Yeung*  \nPersonal Blog – Apr 2024 [[link](https:\u002F\u002Fmattyyeung.github.io\u002Fdeterministic-quoting)]\n\n**Retrieval Augmented Generation Research: 2017-2024**  \n*Moritz Mallawitsch*  \nScaling Knowledge – Feb 2024 [[link](https:\u002F\u002Fscalingknowledge.substack.com\u002Fp\u002Frag)]\n\n**Mastering RAG: How To Architect An Enterprise RAG System**  \n*Pratik Bhavsar*  \nGalileo Labs – Jan 2024 [[link](https:\u002F\u002Fwww.rungalileo.io\u002Fblog\u002Fmastering-rag-how-to-architect-an-enterprise-rag-system#multi-tenancy)]\n\n**Running Mixtral 8x7 locally with LlamaIndex**  \n*LlamaIndex*  \nLlamaIndex Blog – Dec 2023 [[link](https:\u002F\u002Fblog.llamaindex.ai\u002Frunning-mixtral-8x7-locally-with-llamaindex-e6cebeabe0ab)]\n\n**Advanced RAG Techniques: An Illustrated Overview**  \n*Ivan Ilin*  \nTowards AI – Dec 2023 [[link](https:\u002F\u002Fpub.towardsai.net\u002Fadvanced-rag-techniques-an-illustrated-overview-04d193d8fec6)]\n\n**Multimodal RAG pipeline with LlamaIndex and Neo4j**  \n*Tomaz Bratanic*  \nLlamaIndex Blog – Dec 2023 [[link](https:\u002F\u002Fblog.llamaindex.ai\u002Fmultimodal-rag-pipeline-with-llamaindex-and-neo4j-a2c542eb0206)]\n\n**Benchmarking RAG on tables**  \n*LangChain*  \nLangChain Blog – Dec 2023 [[link](https:\u002F\u002Fblog.langchain.dev\u002Fbenchmarking-rag-on-tables\u002F)]\n\n**Advanced RAG 01: Small-to-Big Retrieval**  \n*Sophia Yang*  \nTowards Data Science – Nov 2023 [[link](https:\u002F\u002Ftowardsdatascience.com\u002Fadvanced-rag-01-small-to-big-retrieval-172181b396d4)]\n\n**Query Transformations**  \n*LangChain*  \nLangChain Blog – Oct 2023 [[link](https:\u002F\u002Fblog.langchain.dev\u002Fquery-transformations\u002F)]\n\n**What Makes a Dialog Agent Useful?**  \n*Nazneen Rajani, Nathan Lambert, Victor Sanh, Thomas Wolf*  \nHugging Face Blog – Jan 2023 [[link](https:\u002F\u002Fhuggingface.co\u002Fblog\u002Fdialog-agents)]\n\n**Forecasting potential misuses of language models for disinformation campaigns and how to reduce risk**  \n*Josh A. Goldstein, Girish Sastry, Micah Musser, Renée DiResta, Matthew Gentzel, Katerina Sedova*  \nOpenAI Blog – Jan 2023 [[link](https:\u002F\u002Fopenai.com\u002Fresearch\u002Fforecasting-misuse)]\n\n## Datasets\n\n**Fact, Fetch, And Reason: A Unified Evaluation Of Retrieval-Augmented Generation**\n*Satyapriya Krishna, Kalpesh Krishna, Anhad Mohananey, Steven Schwarcz, Adam Stambler, Shyam Upadhyay, Manaal Faruqui*\narXiv – Sep 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2409.12941)] [[data](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fgoogle\u002Fframes-benchmark)]\n\n**LitSearch: A Retrieval Benchmark for Scientific Literature Search**  \n*Anirudh Ajith, Mengzhou Xia, Alexis Chevalier, Tanya Goyal, Danqi Chen, Tianyu Gao*  \narXiv – Jul 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2407.18940)] [[data](https:\u002F\u002Fgithub.com\u002Fprinceton-nlp\u002FLitSearch)]\n\n**BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval**  \n*Hongjin Su, Howard Yen, Mengzhou Xia, Weijia Shi, Niklas Muennighoff, Han-yu Wang, Haisu Liu, Quan Shi, Zachary S. Siegel, Michael Tang, Ruoxi Sun, Jinsung Yoon, Sercan O. Arik, Danqi Chen, Tao Yu*  \narXiv – Oct 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2407.12883)] [[data](https:\u002F\u002Ft.co\u002FP3GyfcO0gO)] [[code](github.com\u002Fxlang-ai\u002FBRIGHT)]\n\n**FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation**  \n*Tu Vu, Mohit Iyyer, Xuezhi Wang, Noah Constant, Jerry Wei, Jason Wei, Chris Tar, Yun-Hsuan Sung, Denny Zhou, Quoc Le, Thang Luong*  \narXiv – Oct 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.03214)] [[code](https:\u002F\u002Fgithub.com\u002Ffreshllms\u002Ffreshqa)]\n\n**LegalBench: A Collaboratively Built Benchmark for Measuring Legal Reasoning in Large Language Models**  \n*Neel Guha, Julian Nyarko, Daniel E. Ho, Christopher Ré, Adam Chilton, Aditya Narayana, Alex Chohlas-Wood, Austin Peters, Brandon Waldon, Daniel N. Rockmore, Diego Zambrano, Dmitry Talisman, Enam Hoque, Faiz Surani, Frank Fagan, Galit Sarfaty, Gregory M. Dickinson, Haggai Porat, Jason Hegland, Jessica Wu, Joe Nudell, Joel Niklaus, John Nay, Jonathan H. Choi, Kevin Tobia, Margaret Hagan, Megan Ma, Michael Livermore, Nikon Rasumov-Rahe, Nils Holzenberger, Noam Kolt, Peter Henderson, Sean Rehaag, Sharad Goel, Shang Gao, Spencer Williams, Sunny Gandhi, Tom Zur, Varun Iyer, Zehua Li*  \narXiv – Aug 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.11462)] [[dataset](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fnguha\u002Flegalbench)]\n\n**OpenAssistant Conversations - Democratizing Large Language Model Alignment**  \n*Andreas Köpf, Yannic Kilcher, Dimitri von Rütte, Sotiris Anagnostidis, Zhi-Rui Tam, Keith Stevens, Abdullah Barhoum, Nguyen Minh Duc, Oliver Stanley, Richárd Nagyfi, Shahul ES, Sameer Suri, David Glushkov, Arnav Dantuluri, Andrew Maguire, Christoph Schuhmann, Huu Nguyen, Alexander Mattick*  \narXiv – April 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.07327)]\n\n**ChatGPT-RetrievalQA**  \n*Arian Askari, Mohammad Aliannejadi, Evangelos Kanoulas, Suzan Verberne*  \nGithub – Feb 2023 [[code](https:\u002F\u002Fgithub.com\u002Farian-askari\u002FChatGPT-RetrievalQA)]\n\n**KAMEL : Knowledge Analysis with Multitoken Entities in Language Models**  \n*Jan-Christoph Kalo, Leandra Fichtel*  \nAKBC 22 – [[paper](https:\u002F\u002Fwww.akbc.ws\u002F2022\u002Fassets\u002Fpdfs\u002F15_kamel_knowledge_analysis_with_.pdf)]\n\n**TruthfulQA: Measuring How Models Mimic Human Falsehoods**  \n*Stephanie Lin, Jacob Hilton, Owain Evans*  \narXiv – Sep 2021 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2109.07958.pdf)] [[code](https:\u002F\u002Fgithub.com\u002Fsylinrl\u002FTruthfulQA)]\n\n**Complex Answer Retrieval**  \n*Laura Dietz, Manisha Verma, Filip Radlinski, Nick Craswell, Ben Gamari, Jeff Dalton, John  Foley*  \nTREC – 2017-2019 [[link](http:\u002F\u002Ftrec-car.cs.unh.edu\u002F)]\n\n## Tools\n\n**GraphRAG**  \n*Jonathan Larson, Steven Truitt*  \nMicrosoft – Feb 2024 [[code](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fgraphrag)]\n\n**Narrowing the Knowledge Evaluation Gap: Open-Domain Question Answering with Multi-Granularity Answers**  \n*Gal Yona, Roee Aharoni, Mor Geva*  \narXiv – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.04695.pdf)]\n\n**DHS LLM Workshop - Module 6**  \n*Sourab Mangrulkar*  \nGitHub – Dec 2023 [[code](https:\u002F\u002Fgithub.com\u002Fpacman100\u002FDHS-LLM-Workshop\u002Ftree\u002Fmain\u002F6_Module)]\n\n**PrimeQA: The Prime Repository for State-of-the-Art Multilingual Question Answering Research and Development**  \n*Avirup Sil, Jaydeep Sen, Bhavani Iyer, Martin Franz, Kshitij Fadnis, Mihaela Bornea, Sara Rosenthal, Scott McCarley, Rong Zhang, Vishwajeet Kumar, Yulong Li, Md Arafat Sultan, Riyaz Bhat, Radu Florian, Salim Roukos*  \narXiv – Jan 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.09715)] [[code](https:\u002F\u002Fgithub.com\u002Fprimeqa\u002Fprimeqa)]\n\n**TRL: Transformer Reinforcement Learning**  \n*Leandro von Werra, Younes Belkada, Lewis Tunstall, Edward Beeching, Tristan Thrush, Nathan Lambert, Shengyi Huang*  \nGitHub – 2020 [[code](https:\u002F\u002Fgithub.com\u002Fhuggingface\u002Ftrl)]\n\n## Evaluation\n\n**FACTSCORE: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation**  \n*Sewon Min, Kalpesh Krishna, Xinxi Lyu, Mike Lewis, Wen-tau Yih, Pang Wei Koh, Mohit Iyyer, Luke Zettlemoyer, Hannaneh Hajishirzi*  \nPypi – May 2023 [[paper](https:\u002F\u002Fmartiansideofthemoon.github.io\u002Fassets\u002Ffactscore.pdf)] [[code](https:\u002F\u002Fpypi.org\u002Fproject\u002Ffactscore\u002F#description)]\n\n**FACTKB: Generalizable Factuality Evaluation using Language Models Enhanced with Factual Knowledge**  \n*Shangbin Feng, Vidhisha Balachandran, Yuyang Bai, Yulia Tsvetkov*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.08281)] [[code](https:\u002F\u002Fgithub.com\u002FBunsenFeng\u002FFactKB)]\n\n**Evaluating Verifiability in Generative Search Engines**  \n*Nelson F. Liu, Tianyi Zhang, Percy Liang*  \narXiv – April 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.09848)] [[code](https:\u002F\u002Fgithub.com\u002Fnelson-liu\u002Fevaluating-verifiability-in-generative-search-engines)]\n\n## Workshops and Tutorials\n\n**Workshop on Generative AI for Recommender Systems and Personalization**  \n*Narges Tabari, Aniket Deshmukh, Wang-Cheng Kang, Rashmi Gangadharaiah, Hamed Zamani, Julian McAuley, George Karypis*  \nKDD 24 – Aug 2024 [[link](https:\u002F\u002Fgenai-personalization.github.io\u002FGenAIRecP2024)]\n\n**Second Workshop on Generative Information Retrieval**  \n*Gabriel Bénédict, Ruqing Zhang, Donald Metzler, Andrew Yates, Ziyan Jiang*  \nSIGIR 24 – Jul 2024 [[link](https:\u002F\u002Fcoda.io\u002F@sigir\u002Fgen-ir-24)]\n\n**Personalized Generative AI**  \n*Zheng Chen, Ziyan Jiang, Fan Yang, Zhankui He, Yupeng Hou, Eunah Cho, Julian McAuley, Aram Galstyan, Xiaohua Hu, Jie Yang*  \nCIKM 23 – Oct 2023 [[link](https:\u002F\u002Fsites.google.com\u002Fview\u002Fpgai2023\u002Fhome)]\n\n**First Workshop on Recommendation with Generative Models**  \n*Wenjie Wang, Yong Liu, Yang Zhang, Weiwen Liu, Fuli Feng, Xiangnan He, Aixin Sun*  \nCIKM 23 – Oct 2023 [[link](https:\u002F\u002Frgm-cikm23.github.io\u002F)]\n\n**First Workshop on Generative Information Retrieval**  \n*Gabriel Bénédict, Ruqing Zhang, Donald Metzler*  \nSIGIR 23 – Jul 2023 [[link](https:\u002F\u002Fcoda.io\u002F@sigir\u002Fgen-ir)]\n\n**Retrieval-based Language Models and Applications**  \n*Akari Asai,\tSewon Min,\tZexuan Zhong,\tDanqi Chen*  \nACL 23 – Jul 2023 [[link](https:\u002F\u002Facl2023-retrieval-lm.github.io\u002F)]\n\n## Epistemology Papers\n\n**Agentic Information Retrieval**  \n*Weinan Zhang, Junwei Liao, Ning Li, Kounianhua Du*  \narXiv – Oct 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2410.09713)]\n\n**Recite, Reconstruct, Recollect: Memorization in LMs as a Multifaceted Phenomenon**  \n*USVSN Sai Prashanth, Alvin Deng, Kyle O'Brien, Jyothir S V, Mohammad Aflah Khan, Jaydeep Borkar, Christopher A. Choquette-Choo, Jacob Ray Fuehne, Stella Biderman, Tracy Ke, Katherine Lee, Naomi Saphra*  \narXiv – Jun 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2406.17746)]\n\n**ChatGPT is bullshit**  \n*Michael Townsen Hicks, James Humphries, Joe Slater*  \nEthics Inf Technol – Jun 2024 [[paper](https:\u002F\u002Flink.springer.com\u002Fepdf\u002F10.1007\u002Fs10676-024-09775-5?sharing_token=0CIhP_zo5-plierRq8kkDPe4RwlQNchNByi7wbcMAY77xTOWyddkW01qGFs1m5zuuoZGBctVlsJF8SbYqcxWi-XzgEYEPiw7xwWi4bMYXJ_1JARDrER9JGdWZOW-UGSkrk_tXPjPh-XWvFNoiFzNlnDUUUEBAztiX9PtP2p6jfI%3D)]\n\n**Hallucination of Multimodal Large Language Models: A Survey**  \n*Zechen Bai, Pichao Wang, Tianjun Xiao, Tong He, Zongbo Han, Zheng Zhang, Mike Zheng Shou*  \narXiv – Apr 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.18930)]\n\n**From Matching to Generation: A Survey on Generative Information Retrieval**  \n*Xiaoxi Li, Jiajie Jin, Yujia Zhou, Yuyao Zhang, Peitian Zhang, Yutao Zhu, and Zhicheng Dou*  \narXiv – Apr 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.14851)]\n\n**Knowledge Conflicts for LLMs: A Survey**  \n*Rongwu Xu, Zehan Qi, Cunxiang Wang, Hongru Wang, Yue Zhang, Wei Xu*  \narXiv – Mar 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2403.08319)]\n\n**Report on the 1st Workshop on Generative Information Retrieval (Gen-IR 2023) at SIGIR 2023**  \n*Gabriel Bénédict, Ruqing Zhang, Donald Metzler, Andrew Yates, Romain Deffayet, Philipp Hager, Sami Jullien*  \nSIGIR Forum – Dec 2023 [[paper](https:\u002F\u002Fsigir.org\u002Fwp-content\u002Fuploads\u002F2023\u002F12\u002Fp13.pdf)]\n\n**Report on the 1st Workshop on Task Focused IR in the Era of Generative AI**  \n*Chirag Shah, Ryen W. White*  \nSIGIR Forum – Dec 2023 [[paper](https:\u002F\u002Fsigir.org\u002Fwp-content\u002Fuploads\u002F2023\u002F12\u002Fp20.pdf)]\n\n**Towards Generative Search and Recommendation: A keynote at RecSys 2023**  \n*Tat-Seng Chua*  \nSIGIR Forum – Dec 2023 [[paper](https:\u002F\u002Fsigir.org\u002Fwp-content\u002Fuploads\u002F2023\u002F12\u002Fp05.pdf)]\n\n**Large Search Model: Redefining Search Stack in the Era of LLMs**  \n*Liang Wang, Nan Yang, Xiaolong Huang, Linjun Yang, Rangan Majumder, Furu Wei*  \nSIGIR Forum – Dec 2023 [[paper](https:\u002F\u002Fsigir.org\u002Fwp-content\u002Fuploads\u002F2023\u002F12\u002Fp23.pdf)]\n\n**Large Language Models for Generative Information Extraction: A Survey**  \n*Derong Xu, Wei Chen, Wenjun Peng, Chao Zhang, Tong Xu, Xiangyu Zhao, Xian Wu, Yefeng Zheng, Enhong Chen*  \narXiv – Dec 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2312.17617v1.pdf)]\n\n**Dense Text Retrieval based on Pretrained Language Models: A Survey**  \n*Wayne Xin Zhao, Jing Liu, Ruiyang Ren, Ji-Rong Wen*  \nTOIS – Dec 2023 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.1145\u002F3637870)]\n\n**Retrieval-Augmented Generation for Large Language Models: A Survey**  \n*Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi Bi, Yi Dai, Jiawei Sun, Haofen Wang*  \narXiv – Dec 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2312.10997v2.pdf)]\n\n**Calibrated Language Models Must Hallucinate**  \n*Adam Tauman Kalai, Santosh S. Vempala*  \narXiv – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2311.14648.pdf)]\n\n**Siren's Song in the AI Ocean: A Survey on Hallucination in Large Language Models**  \n*Yue Zhang, Yafu Li, Leyang Cui, Deng Cai, Lemao Liu, Tingchen Fu, Xinting Huang, Enbo Zhao, Yu Zhang, Yulong Chen, Longyue Wang, Anh Tuan Luu, Wei Bi, Freda Shi, Shuming Shi*  \narXiv – Sep 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2309.01219)]\n\n**The False Promise of Imitating Proprietary LLMs**  \n*Arnav Gudibande, Eric Wallace, Charlie Snell, Xinyang Geng, Hao Liu, Pieter Abbeel, Sergey Levine, Dawn Song*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.15717)]\n\n**Generative Recommendation: Towards Next-generation Recommender Paradigm**  \n*Fengji Zhang, Bei Chen, Yue Zhang, Jin Liu, Daoguang Zan, Yi Mao, Jian-Guang Lou, Weizhu Chen*  \narXiv – April 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2304.03516.pdf)]\n\n**Augmented Language Models: a Survey**  \n*Grégoire Mialon, Roberto Dessì, Maria Lomeli, Christoforos Nalmpantis, Ram Pasunuru, Roberta Raileanu, Baptiste Rozière, Timo Schick, Jane Dwivedi-Yu, Asli Celikyilmaz, Edouard Grave, Yann LeCun, Thomas Scialom*  \narXiv – Feb 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2302.07842.pdf)]\n\n**Generative Language Models and Automated Influence Operations: Emerging Threats and Potential Mitigations**  \n*Josh A. Goldstein, Girish Sastry, Micah Musser, Renee DiResta, Matthew Gentzel, Katerina Sedova*  \narXiv – Jan 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2301.04246.pdf)]\n\n**Conversational Information Seeking. An Introduction to Conversational Search, Recommendation, and Question Answering**  \n*Hamed Zamani, Johanne R. Trippas, Jeff Dalton and Filip Radlinski*  \narXiv – Jan 2023 [[paper](https:\u002F\u002Fwww.sciencedirect.com\u002Fscience\u002Farticle\u002Fpii\u002FS0956713521008355)]\n\n**Facts**  \n*Kevin Mulligan and Fabrice Correia*  \nThe Stanford Encyclopedia of Philosophy – Winter 2021 [[url](https:\u002F\u002Fplato.stanford.edu\u002Farchives\u002Fwin2021\u002Fentries\u002Ffacts\u002F)]\n\n**Truthful AI: Developing and governing AI that does not lie**  \n*Owain Evans, Owen Cotton-Barratt, Lukas Finnveden, Adam Bales, Avital Balwit, Peter Wills, Luca Righetti, William Saunders*  \narXiv – Oct 2021 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2110.06674.pdf)]\n\n**Rethinking Search: Making Domain Experts out of Dilettantes**  \n*Donald Metzler, Yi Tay, Dara Bahri, Marc Najork*  \nSIGIR Forum 2021 – May 2021 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2105.02274.pdf)]  \n\n## Grounded Answer Generation\n\n\n**Attributed Question Answering: Evaluation and Modeling for Attributed Large Language Models**  \n*Bernd Bohnet, Vinh Q. Tran, Pat Verga, Roee Aharoni, Daniel Andor, Livio Baldini Soares, Jacob Eisenstein, Kuzman Ganchev, Jonathan Herzig, Kai Hui, Tom Kwiatkowski, Ji Ma, Jianmo Ni, Tal Schuster, William W. Cohen, Michael Collins, Dipanjan Das, Donald Metzler, Slav Petrov, Kellie Webster*  \narXiv – Dec 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.08037)]\n\n\n### Retrieval Augmented Generation (RAG)\n\n> external grounding\u002Fretrieval at inference time\n\n**REFRAG: Rethinking RAG based Decoding**  \n*Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, Anshumali Shrivastava, Vijai Mohan*  \narXiv – Sep 2025 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2509.01092)]\n\n**RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval**  \n*Parth Sarthi, Salman Abdullah, Aditi Tuli, Shubh Khanna, Anna Goldie, Christopher D. Manning*  \nICLR 24 – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.18059.pdf)]\n\n**Corrective Retrieval Augmented Generation**  \n*Shi-Qi Yan, Jia-Chen Gu, Yun Zhu, Zhen-Hua Ling*  \narXiv – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.15884.pdf)]\n\n**It's About Time: Incorporating Temporality in Retrieval Augmented Language Models**  \n*Anoushka Gade, Jorjeta Jetcheva*  \narXiv – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.13222.pdf)]\n\n**RAG vs Fine-tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture**  \n*Angels Balaguer, Vinamra Benara, Renato Luiz de Freitas Cunha, Roberto de M. Estevão Filho, Todd Hendry, Daniel Holstein, Jennifer Marsman, Nick Mecklenburg, Sara Malvar, Leonardo O. Nunes, Rafael Padilha, Morris Sharp, Bruno Silva, Swati Sharma, Vijay Aski, Ranveer Chandra*  \narXiv – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.08406.pdf)]\n\n**Sequencing Ma\u001dtters: A Generate-Retrieve-Generate Model for Building Conversational Agents**  \n*Quinn Patwardhan, Grace Hui Yang*  \nTREC 23 – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.09513)]\n\n**Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=hSyW5go0v8)]\n\n**RA-DIT: Retrieval-Augmented Dual Instruction Tuning**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=22OTbutug9)]\n\n**In-Context Learning with Retrieval Augmented Encoder-Decoder Language Models**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=QXRScRrwNr)]\n\n**Making Retrieval-Augmented Language Models Robust to Irrelevant Context**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=ZS4m74kZpH)]\n\n**Retrieval meets Long Context Large Language Models**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=xw5nxFWMlo)]\n\n**Reformulating Domain Adaptation of Large Language Models as Adapt-Retrieve-Revise**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=3GunDQNKFJ)]\n\n**InstructRetro: Instruction Tuning post Retrieval-Augmented Pretraining**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=4stB7DFLp6)]\n\n**SuRe: Improving Open-domain Question Answering of LLMs via Summarized Retrieval**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=w4DW6qkRmt)]\n\n**RECOMP: Improving Retrieval-Augmented LMs with Context Compression and Selective Augmentation**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=ZdjKRbtrth)]\n\n**Retrieval is Accurate Generation**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=clU5xWyItb)]\n\n**PaperQA: Retrieval-Augmented Generative Agent for Scientific Research**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=clU5xWyItb)]\n\n**Understanding Retrieval Augmentation for Long-Form Question Answering**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=mCnWT9OVvK)]\n\n**Personalized Language Generation via Bayesian Metric Augmented Retrieval**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fpdf?id=n1LiKueC4F)]\n\n**DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines**  \n*Omar Khattab, Arnav Singhvi, Paridhi Maheshwari, Zhiyuan Zhang, Keshav Santhanam, Sri Vardhamanan, Saiful Haq, Ashutosh Sharma, Thomas T. Joshi, Hanna Moazam, Heather Miller, Matei Zaharia, Christopher Potts*  \narXiv – Oct 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.03714)] [[code](https:\u002F\u002Fgithub.com\u002Fstanfordnlp\u002Fdspy)]\n\n**RA-DIT: Retrieval-Augmented Dual Instruction Tuning**  \n*Xi Victoria Lin, Xilun Chen, Mingda Chen, Weijia Shi, Maria Lomeli, Rich James, Pedro Rodriguez, Jacob Kahn, Gergely Szilvasy, Mike Lewis, Luke Zettlemoyer, Scott Yih*  \narXiv – Aug 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.01352)]\n\n**Tool Documentation Enables Zero-Shot Tool-Usage with Large Language Models**  \n*Cheng-Yu Hsieh, Si-An Chen, Chun-Liang Li, Yasuhisa Fujii, Alexander Ratner, Chen-Yu Lee, Ranjay Krishna, Tomas Pfister*  \narXiv – Aug 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.00675)]\n\n**ReAugKD: Retrieval-Augmented Knowledge Distillation For Pre-trained Language Models**  \n*Jianyi Zhang, Aashiq Muhamed, Aditya Anantharaman, Guoyin Wang, Changyou Chen, Kai Zhong, Qingjun Cui, Yi Xu, Belinda Zeng, Trishul Chilimbi, Yiran Chen*  \nACL 23 – Jul 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.acl-short.97.pdf)]\n\n**Surface-Based Retrieval Reduces Perplexity of Retrieval-Augmented Language Models**  \n*Ehsan Doostmohammadi, Tobias Norlund, Marco Kuhlmann, Richard Johansson*  \nACL 23 – Jul 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.acl-short.45\u002F)]\n\n**Soft Prompt Tuning for Augmenting Dense Retrieval with Large Language Models**  \n*Zhiyuan Peng, Xuyang Wu, Yi Fang*  \narXiv – Jun 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2307.08303)]  \n\n**RETA-LLM: A Retrieval-Augmented Large Language Model Toolkit**  \n*Jiongnan Liu, Jiajie Jin, Zihan Wang, Jiehan Cheng, Zhicheng Dou, Ji-Rong Wen*  \narXiv – Jun 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.05212)]  \n\n**WebGLM: Towards An Efficient Web-Enhanced Question Answering System with Human Preferences**  \n*Xiao Liu, Hanyu Lai, Hao Yu, Yifan Xu, Aohan Zeng, Zhengxiao Du, Peng Zhang, Yuxiao Dong, Jie Tang*  \narXiv – Jun 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.07906)]\n\n**WikiChat: Stopping the Hallucination of Large Language Model Chatbots by Few-Shot Grounding on Wikipedia**  \n*Sina J. Semnani, Violet Z. Yao, Heidi C. Zhang, Monica S. Lam*  \nEMNLP Findings 2023 – May 2023 [[paper]](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.14292) [[code]](https:\u002F\u002Fgithub.com\u002Fstanford-oval\u002FWikiChat) [[demo]](https:\u002F\u002Fwikichat.genie.stanford.edu)\n\n**RET-LLM: Towards a General Read-Write Memory for Large Language Models**  \n*Ali Modarressi, Ayyoob Imani, MOhsen Fayyaz, Hinrich Schutze*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.14322)]\n\n**Gorilla: Large Language Model Connected with Massive APIs**  \n*Shishir G. Patil, Tianjun Zhang, Xin Wang, Joseph E. Gonzalez*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.15334)] [[code](https:\u002F\u002Fgithub.com\u002FShishirPatil\u002Fgorilla)]\n\n**Shall We Pretrain Autoregressive Language Models with Retrieval? A Comprehensive Study**  \n*Boxin Wang, Wei Ping, Peng Xu, Lawrence McAfee, Zihan Liu, Mohammad Shoeybi, Yi Dong, Oleksii Kuchaiev, Bo Li, Chaowei Xiao, Anima Anandkumar, Bryan Catanzaro*  \narXiv – Apr 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.06762)] [[code](https:\u002F\u002Fgithub.com\u002FNVIDIA\u002FMegatron-LM#retro)]\n\n**Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automated Feedback**  \n*Baolin Peng, Michel Galley, Pengcheng He, Hao Cheng, Yujia Xie, Yu Hu, Qiuyuan Huang, Lars Liden, Zhou Yu, Weizhu Chen, Jianfeng Gao*  \narXiv – Feb 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.12813)] [[code](https:\u002F\u002Fgithub.com\u002Fpengbaolin\u002FLLM-Augmenter)]\n\n**Toolformer: Language Models Can Teach Themselves to Use Tools**  \n*Timo Schick, Jane Dwivedi-Yu, Roberto Dessì, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, Thomas Scialom*  \narXiv – Feb 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.04761)]\n\n**REPLUG: Retrieval-Augmented Black-Box Language Models**  \n*Weijia Shi, Sewon Min, Michihiro Yasunaga, Minjoon Seo, Rich James, Mike Lewis, Luke Zettlemoyer, Wen-tau Yih*  \narXiv – Jan 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.12652)]\n\n**In-Context Retrieval-Augmented Language Models**  \n*Ori Ram, Yoav Levine, Itay Dalmedigos, Dor Muhlgay, Amnon Shashua, Kevin Leyton-Brown, Yoav Shoham*  \nAI21 Labs – Jan 2023 [[paper](https:\u002F\u002Fuploads-ssl.webflow.com\u002F60fd4503684b466578c0d307\u002F63c6c20dec4479564db21819_NEW_In_Context_Retrieval_Augmented_Language_Models.pdf)] [[code](https:\u002F\u002Fgithub.com\u002FAI21Labs\u002Fin-context-ralm)]\n\n**Recipes for Building an Open-Domain Chatbot**  \n*Stephen Roller, Emily Dinan, Naman Goyal, Da Ju, Mary Williamson, Yinhan Liu, Jing Xu, Myle Ott, Eric Michael Smith, Y-Lan Boureau, Jason Weston*  \nEACL 2021 – Apr 2021 [[paper](https:\u002F\u002Faclanthology.org\u002F2021.eacl-main.24.pdf)]\n\n**AtMan: Understanding Transformer Predictions Through Memory Efficient Attention Manipulation**  \n*Hamed Zamani, Johanne R. Trippas, Jeff Dalton and Filip Radlinski*  \narXiv – Jan 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2301.08110.pdf)]  \n\n**RetroMAE v2: Duplex Masked Auto-Encoder For Pre-Training Retrieval-Oriented Language Models**  \n*Shitao Xiao, Zheng Liu*  \narXiv – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.08769)]\n\n**Demonstrate-Search-Predict: Composing retrieval and language models for knowledge-intensive NLP**\n*Omar Khattab, Keshav Santhanam, Xiang Lisa Li, David Hall, Percy Liang, Christopher Potts, Matei Zaharia*  \narXiv – Dec 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2212.14024.pdf)]\n\n**Improving language models by retrieving from trillions of tokens**  \n*Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George van den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Casas, Aurelia Guy, Jacob Menick, Roman Ring, Tom Hennigan, Saffron Huang, Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osindero, Karen Simonyan, Jack W. Rae, Erich Elsen and Laurent Sifre*  \narXiv – Feb 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2112.04426.pdf)]\n\n**Improving language models by retrieving from trillions of tokens**  \n*Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George van den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark, Diego de Las Casas, Aurelia Guy, Jacob Menick, Roman Ring, Tom Hennigan, Saffron Huang, Loren Maggiore, Chris Jones, Albin Cassirer, Andy Brock, Michela Paganini, Geoffrey Irving, Oriol Vinyals, Simon Osindero, Karen Simonyan, Jack W. Rae, Erich Elsen, Laurent Sifre*  \narXiv – Dec 2021 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2112.04426)]\n\n**WebGPT: Browser-assisted question-answering with human feedback**  \n*Reiichiro Nakano, Jacob Hilton, Suchir Balaji, Jeff Wu, Long Ouyang, Christina Kim, Christopher Hesse, Shantanu Jain, Vineet Kosaraju, William Saunders, Xu Jiang, Karl Cobbe, Tyna Eloundou, Gretchen Krueger, Kevin Button, Matthew Knight, Benjamin Chess, John Schulman*  \narXiv – Dec 2021 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2112.09332)]\n\n**BERT-kNN: Adding a kNN Search Component to Pretrained Language Models for Better QA**  \n*Nora Kassner, Hinrich Schütze*  \nEMNLP 2020 – Nov 2020 [[paper](https:\u002F\u002Faclanthology.org\u002F2020.findings-emnlp.307.pdf)]\n\n**REALM: Retrieval-Augmented Language Model Pre-Training**  \n*Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang*  \nICML 2020 – Jul 2020 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2002.08909)]\n\n**A Hybrid Retrieval-Generation Neural Conversation Model**  \n*Liu Yang, Junjie Hu, Minghui Qiu, Chen Qu, Jianfeng Gao, W. Bruce Croft, Xiaodong Liu, Yelong Shen, Jingjing Liu*  \narXiv – Apr 2019 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F1904.09068)]\n\n### LLM Memory Manipulation \n\n> grounded in internal model weights at inference time\n\n**How Do Large Language Models Acquire Factual Knowledge During Pretraining?**  \n*Hoyeon Chang, Jinho Park, Seonghyeon Ye, Sohee Yang, Youngkyung Seo, Du-Seong Chang, Minjoon Seo*  \narXiv – Jun 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2406.11813)]\n\n**Fine-tuning Language Models for Factuality**  \n*Katherine Tian, Eric Mitchell, Huaxiu Yao, Christopher D. Manning, Chelsea Finn*  \narXiv – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.08401)]\n\n**R-Tuning: Teaching Large Language Models to Refuse Unknown Questions**  \n*Hanning Zhang, Shizhe Diao, Yong Lin, Yi R. Fung, Qing Lian, Xingyao Wang, Yangyi Chen, Heng Ji, Tong Zhang*  \narXiv – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.09677)]\n\n**EasyEdit: An Easy-to-use Knowledge Editing Framework for Large Language Models**  \n*Peng Wang, Ningyu Zhang, Xin Xie, Yunzhi Yao, Bozhong Tian, Mengru Wang, Zekun Xi, Siyuan Cheng, Kangwei Liu, Guozhou Zheng, Huajun Chen*  \narXiv – Aug 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2308.07269.pdf)]\n\n**Inspecting and Editing Knowledge Representations in Language Models**  \n*Evan Hernandez, Belinda Z. Li, Jacob Andreas*  \narXiv – Apr 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.00740)] [[code](https:\u002F\u002Fgithub.com\u002Fevandez\u002FREMEDI)]\n\n**Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering**  \n*Gautier Izacard, Edouard Grave*  \narXiv – Feb 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2007.01282.pdf)]\n\n**Discovering Latent Knowledge in Language Models Without Supervision**  \n*Collin Burns, Haotian Ye, Dan Klein, Jacob Steinhardt*  \nICLR 23 – Feb 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fpdf?id=ETKGuby0hcs)] [[code](https:\u002F\u002Fgithub.com\u002Fcollin-burns\u002Fdiscovering_latent_knowledge)]\n\n\u003Ca name=\"paper-galactica\">\u003C\u002Fa>\n**Galactica: A Large Language Model for Science**  \n*Ross Taylor, Marcin Kardas, Guillem Cucurull,\nThomas Scialom, Anthony Hartshorn, Elvis Saravia,\nAndrew Poulton, Viktor Kerkez, Robert Stojnic*  \nGalactica.org – 2022 [[paper](https:\u002F\u002Fgalactica.org\u002Fstatic\u002Fpaper.pdf)]\n\n\u003Ca name=\"paper-blenderbot\">\u003C\u002Fa>\n**BlenderBot 3: a deployed conversational agent that continually learns to responsibly engage**  \n*Kurt Shuster, Jing Xu, Mojtaba Komeili, Da Ju, Eric Michael Smith, Stephen Roller, Megan Ung, Moya Chen, Kushal Arora, Joshua Lane, Morteza Behrooz, William Ngan, Spencer Poff, Naman Goyal, Arthur Szlam, Y-Lan Boureau, Melanie Kambadur, Jason Weston*  \narXiv – Aug 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.03188)]\n\n**Generate rather than Retrieve: Large Language Models are Strong Context Generators**  \n*Wenhao Yu, Dan Iter, Shuohang Wang, Yichong Xu, Mingxuan Ju, Soumya Sanyal, Chenguang Zhu, Michael Zeng, Meng Jiang*  \nICLR 2023 – Sep 2022 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=fB0hRu9GZUS)]\n\n**Recitation-Augmented Language Models**  \n*Zhiqing Sun, Xuezhi Wang, Yi Tay, Yiming Yang, Denny Zhou*  \nICLR 2023 – Sep 2022 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=-cqvvvb-NkI)]\n\n\u003Ca name=\"paper-sparrow\">\u003C\u002Fa>\n**Improving alignment of dialogue agents via targeted human judgements**  \n*Amelia Glaese, Nat McAleese, Maja Trębacz, John Aslanides, Vlad Firoiu, Timo Ewalds, Maribeth Rauh, Laura Weidinger, Martin Chadwick, Phoebe Thacker, Lucy Campbell-Gillingham, Jonathan Uesato, Po-Sen Huang, Ramona Comanescu, Fan Yang, Abigail See, Sumanth Dathathri, Rory Greig, Charlie Chen, Doug Fritz, Jaume Sanchez Elias, Richard Green, Soňa Mokrá, Nicholas Fernando, Boxi Wu, Rachel Foley, Susannah Young, Iason Gabriel, William Isaac, John Mellor, Demis Hassabis, Koray Kavukcuoglu, Lisa Anne Hendricks, Geoffrey Irving*  \narXiv – Sep 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2209.14375.pdf)]\n\n**LaMDA: Language Models for Dialog Applications**  \n*Romal Thoppilan, Daniel De Freitas, Jamie Hall, Noam Shazeer, Apoorv Kulshreshtha, Heng-Tze Cheng, Alicia Jin, Taylor Bos, Leslie Baker, Yu Du, YaGuang Li, Hongrae Lee, Huaixiu Steven Zheng, Amin Ghafouri, Marcelo Menegali, Yanping Huang, Maxim Krikun, Dmitry Lepikhin, James Qin, Dehao Chen, Yuanzhong Xu, Zhifeng Chen, Adam Roberts, Maarten Bosma, Vincent Zhao, Yanqi Zhou, Chung-Ching Chang, Igor Krivokon, Will Rusch, Marc Pickett, Pranesh Srinivasan, Laichee Man, Kathleen Meier-Hellstern, Meredith Ringel Morris, Tulsee Doshi, Renelito Delos Santos, Toju Duke, Johnny Soraker, Ben Zevenbergen, Vinodkumar Prabhakaran, Mark Diaz, Ben Hutchinson, Kristen Olson, Alejandra Molina, Erin Hoffman-John, Josh Lee, Lora Aroyo, Ravi Rajakumar, Alena Butryna, Matthew Lamm, Viktoriya Kuzmina, Joe Fenton, Aaron Cohen, Rachel Bernstein, Ray Kurzweil, Blaise Aguera-Arcas, Claire Cui, Marian Croak, Ed Chi, Quoc Le*  \narXiv – Jan 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2201.08239)]\n\n**Language Models As or For Knowledge Bases**  \n*Simon Razniewski, Andrew Yates, Nora Kassner, Gerhard Weikum*  \nDL4KG 2021 – Oct 2021 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2110.04888.pdf)]\n\n**Generalization through Memorization: Nearest Neighbor Language Models**\\\n*Urvashi Khandelwal, Omer Levy, Dan Jurafsky, Luke Zettlemoyer, Mike Lewis*  \nICLR 2020 – Sep 2019 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=HklBjCEKvH)] [[code](https:\u002F\u002Fgithub.com\u002Furvashik\u002Fknnlm)]\n\n### Re-Ranking\n\n**Is ChatGPT Good at Search? Investigating Large Language Models as Re-Ranking Agents**  \n*Wenhao Yu, Hongming Zhang, Xiaoman Pan, Kaixin Ma, Hongwei Wang, Dong Yu*  \narXiv – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.09210)]\n\n**Instruction Distillation Makes Large Language Models Efficient Zero-shot Rankers**  \n*Weiwei Sun, Zheng Chen, Xinyu Ma, Lingyong Yan, Shuaiqiang Wang, Pengjie Ren, Zhumin Chen, Dawei Yin, Zhaochun Ren*  \narXiv 2023 – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2311.01555)]\n\n### Self-Correction\n\n**CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing**  \n*Zhibin Gou, Zhihong Shao, Yeyun Gong, yelong shen, Yujiu Yang, Nan Duan, Weizhu Chen*  \nICLR 2024 – Jan 2024 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=Sx038qxjek)]\n\n**A Stitch in Time Saves Nine: Detecting and Mitigating Hallucinations of LLMs by Validating Low-Confidence Generation**  \n*Neeraj Varshney, Wenlin Yao, Hongming Zhang, Jianshu Chen, Dong Yu*  \narXiv – Aug 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.06983)]\n\n**RARR: Researching and Revising What Language Models Say, Using Language Models**  \n*Luyu Gao, Zhuyun Dai, Panupong Pasupat, Anthony Chen, Arun Tejasvi Chaganty, Yicheng Fan, Vincent Zhao, Ni Lao, Hongrae Lee, Da-Cheng Juan, Kelvin Guu*  \nACL 2023 – Jul 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.acl-long.910\u002F)]\n\n**Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework**  \n*Ruochen Zhao, Xingxuan Li, Shafiq Joty, Chengwei Qin, Lidong Bing*  \nACL 2023 – Jul 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.acl-long.320\u002F)]\n\n**Active Retrieval Augmented Generation**  \n*Zhengbao Jiang, Frank F. Xu, Luyu Gao, Zhiqing Sun, Qian Liu, Jane Dwivedi-Yu, Yiming Yang, Jamie Callan, Graham Neubig*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.06983)] [[code](https:\u002F\u002Fgithub.com\u002Fjzbjyb\u002FFLARE)]\n\n**Improving Language Models via Plug-and-Play Retrieval Feedback**  \n*Wenhao Yu, Zhihan Zhang, Zhenwen Liang, Meng Jiang, Ashish Sabharwal*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.14002)]\n\n### Fact Uncertainty Estimates\n\n**Linguistic Calibration of Long-Form Generations**  \n*Neil Band, Xuechen Li, Tengyu Ma, Tatsunori Hashimoto*  \narXiv 2024 – Jun 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2404.00474)]\n\n**To Believe or Not to Believe Your LLM**  \n*Yasin Abbasi Yadkori, Ilja Kuzborskij, András György, Csaba Szepesvári*  \narXiv 2024 – Jun 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2406.02543)]\n\n**SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales**  \n*Tianyang Xu, Shujin Wu, Shizhe Diao, Xiaoze Liu, Xingyao Wang, Yangyi Chen, Jing Gao*  \narXiv 2024 – May 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.20974)]\n\n**Experts Don’t Cheat: Learning What You Don’t Know By Predicting Pairs**  \n*Daniel D. Johnson, Daniel Tarlow, David Duvenaud, Chris J. Maddison*  \narXiv 2024 – Feb 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2402.08733.pdf)]\n\n### Constrained Generation\n\n**Unlocking Anticipatory Text Generation: A Constrained Approach for Faithful Decoding with Large Language Models**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=774elYc5tw)]\n\n**DoLa: Decoding by Contrasting Layers Improves Factuality in Large Language Models**  \n*Yung-Sung Chuang, Yujia Xie, Hongyin Luo, Yoon Kim, James Glass, Pengcheng He*  \nICLR 24 – Sep 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2309.03883)]\n\n### Data Centric\n\n**A Data-Centric Approach To Generate Faithful and High Quality Patient Summaries with Large Language Models**  \n*Stefan Hegselmann, Shannon Zejiang Shen, Florian Gierse, Monica Agrawal, David Sontag, Xiaoyi Jiang*  \narXiv 24 – Feb 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2402.15422.pdf)]\n\n### Utility Maximization\n\n**Stochastic RAG: End-to-End Retrieval-Augmented Generation through Expected Utility Maximization**  \n*Hamed Zamani, Michael Bendersky*  \narXiv 24 – May 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2405.02816)]\n\n\u003Ca name=\"paper-constiutional-ai\">\u003C\u002Fa>\n**Constitutional AI: Harmlessness from AI Feedback**  \n*Yuntao Bai, Saurav Kadavath, Sandipan Kundu, Amanda Askell, Jackson Kernion,\nAndy Jones, Anna Chen, Anna Goldie, Azalia Mirhoseini, Cameron McKinnon,\nCarol Chen, Catherine Olsson, Christopher Olah, Danny Hernandez, Dawn Drain,\nDeep Ganguli, Dustin Li, Eli Tran-Johnson, Ethan Perez, Jamie Kerr, Jared Mueller,\nJeffrey Ladish, Joshua Landau, Kamal Ndousse, Kamile Lukosiute, Liane Lovitt,\nMichael Sellitto, Nelson Elhage, Nicholas Schiefer, Noemi Mercado, Nova DasSarma,\nRobert Lasenby, Robin Larson, Sam Ringer, Scott Johnston, Shauna Kravec,\nSheer El Showk, Stanislav Fort, Tamera Lanham, Timothy Telleen-Lawton, Tom Conerly,\nTom Henighan, Tristan Hume, Samuel R. Bowman, Zac Hatfield-Dodds, Ben Mann,\nDario Amodei, Nicholas Joseph, Sam McCandlish, Tom Brown, Jared Kaplan*\nAnthropic.com – Dec 2022 [[paper](https:\u002F\u002Fwww.anthropic.com\u002Fconstitutional.pdf)]\n\n\u003Ca name=\"paper-blenderbot-hf\">\u003C\u002Fa>\n**Learning New Skills after Deployment: Improving open-domain internet-driven dialogue with human feedback**  \n*Jing Xu, Megan Ung, Mojtaba Komeili, Kushal Arora, Y-Lan Boureau, Jason Weston*  \narXiv – Aug 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.03270)]\n\n### Multimodal\n\n**Retrieval-Augmented Multimodal Language Modeling**  \n*Michihiro Yasunaga, Armen Aghajanyan, Weijia Shi, Rich James, Jure Leskovec, Percy Liang, Mike Lewis, Luke Zettlemoyer, Wen-tau Yih*  \narXiv – Nov 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2211.12561.pdf)]\n\n**RAMM: Retrieval-augmented Biomedical Visual Question Answering with Multi-modal Pre-training**  \n*Zheng Yuan, Qiao Jin, Chuanqi Tan, Zhengyun Zhao, Hongyi Yuan, Fei Huang, Songfang Huang*  \narXiv – Mar 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.00534)]\n\n### Prompting\n\n**Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions**\n*Harsh Trivedi, Niranjan Balasubramanian, Tushar Khot and Ashish Sabharwal*\nACL 23 – Jul 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.acl-long.557.pdf)]\n\n**ReAct: Synergizing Reasoning and Acting in Language Models**  \n*Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao*  \narXiv – Oct 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.03629)]\n\n### Generate Code\n\n**RepoCoder: Repository-Level Code Completion Through Iterative Retrieval and Generation**  \n*Fengji Zhang, Bei Chen, Yue Zhang, Jin Liu, Daoguang Zan, Yi Mao, Jian-Guang Lou, Weizhu Chen*  \narXiv – Mar 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2303.12570.pdf)]\n\n**DocPrompting: Generating Code by Retrieving the Docs**  \n*Shuyan Zhou, Uri Alon, Frank F. Xu, Zhiruo Wang, Zhengbao Jiang, Graham Neubig*  \nICLR 23 – Jul 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2207.05987)] [[code](https:\u002F\u002Fgithub.com\u002Fshuyanzhou\u002Fdocprompting)] [[data](https:\u002F\u002Fgithub.com\u002Fshuyanzhou\u002Fdocprompting#data)]\n\n\n### Query Generation\n\n**Generalized Reinforcement Learning for Retriever-Specific Query Rewriter with Unstructured Real-World Documents**  \n*Sungguk Cha, DongWook Kim, Taeseung Hahn, Mintae Kim, Youngsub Han, Byoung-Ki Jeon*  \narXiv – Aug 2025 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2507.23242)]\n\n**Generate, Filter, and Fuse: Query Expansion via Multi-Step Keyword Generation for Zero-Shot Neural Rankers**  \n*Minghan Li, Honglei Zhuang, Kai Hui, Zhen Qin, Jimmy Lin, Rolf Jagerman, Xuanhui Wang, Michael Bendersky*  \narXiv – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2311.09175.pdf)]\n\n**Agent4Ranking: Semantic Robust Ranking via Personalized Query Rewriting Using Multi-agent LLM**  \n*Xiaopeng Li, Lixin Su, Pengyue Jia, Xiangyu Zhao, Suqi Cheng, Junfeng Wang, Dawei Yin*  \narXiv – Dec 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2209.05861)]\n\n**Unified Generative & Dense Retrieval for Query Rewriting in Sponsored Search**  \n*Akash Kumar Mohankumar, Bhargav Dodla, Gururaj K, Amit Singh*  \narXiv – Sep 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2209.05861)]\n\n\n### Summarization and Document Rewriting\n\n**Generating Factually Consistent Sport Highlights Narrations**  \n*Noah Sarfati, Ido Yerushalmy, Michael Chertok, Yosi Keller*  \nMMSports 2023 – Oct 23 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.1145\u002F3606038.3616157)]\n\n**Genetic Generative Information Retrieval**  \n*Hrishikesh Kulkarni, Zachary Young, Nazli Goharian, Ophir Frieder, Sean MacAvaney*  \nDocEng 23 – Aug 23 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002Fpdf\u002F10.1145\u002F3573128.3609340)]\n\n**Learning to summarize with human feedback**  \n*Nisan Stiennon, Long Ouyang, Jeff Wu, Daniel M. Ziegler, Ryan Lowe, Chelsea Voss, Alec Radford, Dario Amodei, Paul Christiano*  \nNeurIPS 2020 – Sep 2020 [[paper](https:\u002F\u002Fproceedings.neurips.cc\u002Fpaper\u002F2020\u002Ffile\u002F1f89885d556929e98d3ef9b86448f951-Paper.pdf)]\n\n**On Faithfulness and Factuality in Abstractive Summarization**  \n*Joshua Maynez, Shashi Narayan, Bernd Bohnet, Ryan McDonald*  \nACL 2020 – May 2020 [[paper](https:\u002F\u002Faclanthology.org\u002F2020.acl-main.173.pdf)]\n\n### Table QA\n\n**Augment before You Try: Knowledge-Enhanced Table Question Answering via Table Expansion**  \n*Yujian Liu, Jiabao Ji, Tong Yu, Ryan Rossi, Sungchul Kim, Handong Zhao, Ritwik Sinha, Yang Zhang, Shiyu Chang*  \narXiv – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.15555.pdf)]\n\n## Generative Document Retrieval\n\nWe jump-started this section by reusing the content of [awesome-generative-retrieval-models](https:\u002F\u002Fgithub.com\u002FChriskuei\u002Fawesome-generative-retrieval-models) and give full credit to [Chriskuei](https:\u002F\u002Fgithub.com\u002FChriskuei) for that! We now have added some content on top.\n\n### Generate a Document ID as an identifier\n\n**Lightweight and Direct Document Relevance Optimization for Generative Information Retrieval**  \n*Kidist Amde Mekonnen, Yubao Tang, Maarten de Rijke*  \nSIGIR 2025 – July 2025 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2504.05181)] [[Code](https:\u002F\u002Fgithub.com\u002Fkidist-amde\u002Fddro)]\n\n**Planning Ahead in Generative Retrieval: Guiding Autoregressive Generation through Simultaneous Decoding**  \n*Hansi Zeng ,Chen Luo ,Hamed Zamani*  \narXiv – Apr 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2404.14600.pdf)] [[Code](https:\u002F\u002Fgithub.com\u002FHansiZeng\u002FPAG)]\n\n**Bottleneck-Minimal Indexing for Generative Document Retrieval**  \n*Xin Du, Lixin Xiu, Kumiko Tanaka-Ishii*  \nICML 2024 Oral - July 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2405.10974)] [[Code](https:\u002F\u002Fgithub.com\u002Fkduxin\u002FBottleneck-Minimal-Indexing)]\n\n**NOVO: Learnable and Interpretable Document Identifiers for Model-Based IR**  \n*Zihan Wang, Yujia Zhou, Yiteng Tu, Zhicheng Dou*  \nCIKM 2023 - October 2023 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.1145\u002F3583780.3614993)]\n\n**De-DSI: Decentralised Differentiable Search Index**  \n*Petru Neague, Marcel Gregoriadis, Johan Pouwelse*  \nEuroMLSys 24 – Apr 2024 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002Fpdf\u002F10.1145\u002F3642970.3655837)]\n\n**Listwise Generative Retrieval Models via a Sequential Learning Process**  \n*Yubao Tang, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Xueqi Cheng*  \nTOIS 2024 – Mar 2024 [[Paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2403.12499v1)]\n\n**Distillation Enhanced Generative Retrieval**  \n*Yongqi Li, Zhen Zhang, Wenjie Wang, Liqiang Nie, Wenjie Li, Tat-Seng Chua*  \narXiv 2024 – Feb 2024 [[Paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2402.10769)]\n\n**Self-Retrieval: Building an Information Retrieval System with One Large Language Model**  \n*Qiaoyu Tang, Jiawei Chen, Bowen Yu, Yaojie Lu, Cheng Fu, Haiyang Yu, Hongyu Lin, Fei Huang, Ben He, Xianpei Han, Le Sun, Yongbin Li*  \narXiv 2024 – Feb 2024 [[Paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2403.00801)]\n\n**Generative Dense Retrieval: Memory Can Be a Burden**  \n*Peiwen Yuan, Xinglin Wang, Shaoxiong Feng, Boyuan Pan, Yiwei Li, Heda Wang, Xupeng Miao, Kan Li*  \nEACL 2024 - Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2401.10487)] [[code](https:\u002F\u002Fgithub.com\u002Fypw0102\u002FGDR)]\n\n**Auto Search Indexer for End-to-End Document Retrieval**  \n*Tianchi Yang, Minghui Song, Zihan Zhang, Haizhen Huang, Weiwei Deng, Feng Sun, Qi Zhang*  \nEMNLP 2023 - December 23 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.findings-emnlp.464.pdf)]\n\n**DiffusionRet: Diffusion-Enhanced Generative Retriever using Constrained Decoding**  \n*Shanbao Qiao, Xuebing Liu, Seung-Hoon Na*  \nEMNLP Findings 2023 – Dec 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.findings-emnlp.638.pdf)]\n\n**Scalable and Effective Generative Information Retrieval**  \n*Hansi Zeng, Chen Luo, Bowen Jin, Sheikh Muhammad Sarwar, Tianxin Wei, Hamed Zamani*  \nWWW 2024 - Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.09134)] [[code](https:\u002F\u002Fgithub.com\u002FHansiZeng\u002FRIPOR)]\n\n**Nonparametric Decoding for Generative Retrieval**  \n*Hyunji Lee, JaeYoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vladimir Karpukhin, Yi Lu, Minjoon Seo*  \nACL Findings 2023 – Jul 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.findings-acl.801.pdf)]\n\n**Model-enhanced Vector Index**  \n*Hailin Zhang, Yujing Wang, Qi Chen, Ruiheng Chang, Ting Zhang, Ziming Miao, Yingyan Hou, Yang Ding, Xupeng Miao, Haonan Wang, Bochen Pang, Yuefeng Zhan, Hao Sun, Weiwei Deng, Qi Zhang, Fan Yang, Xing Xie, Mao Yang, Bin Cui*  \nNeurIPS 2023 – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2309.13335)] [[code](https:\u002F\u002Fgithub.com\u002FHugoZHL\u002FMEVI)]\n\n**Learning to Rank in Generative Retrieval**  \n*Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li*  \narXiv – Jun 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.15222)]\n\n**Large Language Models are Built-in Autoregressive Search Engines**  \n*Noah Ziems, Wenhao Yu, Zhihan Zhang, Meng Jiang*  \nACL Findings 2023 – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.09612)]\n\n**Multiview Identifiers Enhanced Generative Retrieval**  \n*Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li*  \nACL 2023 – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.16675)]\n\n**How Does Generative Retrieval Scale to Millions of Passages?**  \n*Ronak Pradeep, Kai Hui, Jai Gupta, Adam D. Lelkes, Honglei Zhuang, Jimmy Lin, Donald Metzler, Vinh Q. Tran*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.11841)]\n\n**TOME: A Two-stage Approach for Model-based Retrieval**\u003Cbr> \n*Ruiyang Ren, Wayne Xin Zhao, Jing Liu, Hua Wu, Ji-Rong Wen, Haifeng Wang* \u003Cbr>\nACL 2023 - May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.11161)] \n\n**Understanding Differential Search Index for Text Retrieval**\u003Cbr> \n*Xiaoyang Chen, Yanjiang Liu, Ben He, Le Sun, Yingfei Sun* \u003Cbr>\nACL Findings 2023 - May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.02073)] \n\n**Learning to Tokenize for Generative Retrieval**  \n*Weiwei Sun, Lingyong Yan, Zheng Chen, Shuaiqiang Wang, Haichao Zhu, Pengjie Ren, Zhumin Chen, Dawei Yin, Maarten de Rijke, Zhaochun Ren*  \narXiv – Apr 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.04171)]\n\n**DynamicRetriever: A Pre-trained Model-based IR System Without an Explicit Index**  \n*Yu-Jia Zhou, Jing Yao, Zhi-Cheng Dou, Ledell Wu, Ji-Rong Wen*  \nMachine Intelligence Research – Jan 2023 [[paper](https:\u002F\u002Flink.springer.com\u002Farticle\u002F10.1007\u002Fs11633-022-1373-9)]\n\n**CodeDSI: Differentiable Code Search**  \n*Usama Nadeem, Noah Ziems, Shaoen Wu*  \narXiv – Oct 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.00328)]\n\n**Contextualized Generative Retrieval**  \n*Hyunji Lee, Jaeyoung Kim, Hoyeon Chang, Hanseok Oh, Sohee Yang, Vlad Karpukhin, Yi Lu, Minjoon Seo*  \narXiv – Oct 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2210.02068.pdf)]\n\n**Transformer Memory as a Differentiable Search Index**  \n*Yi Tay, Vinh Q. Tran, Mostafa Dehghani, Jianmo Ni, Dara Bahri, Harsh Mehta, Zhen Qin, Kai Hui, Zhe Zhao, Jai Gupta, Tal Schuster, William W. Cohen, Donald Metzler*  \nNeurips 2022 – Oct 2022 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=Vu-B0clPfq)] [[Video](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=qlB0TPBQ7YY)] [[third-party code](https:\u002F\u002Fgithub.com\u002FArvinZhuang\u002FDSI-transformers)]\n\n**A Neural Corpus Indexer for Document Retrieval**  \n*Wang et al.*  \nArxiv 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.02743)]\n\n**Bridging the Gap Between Indexing and Retrieval for Differentiable Search Index with Query Generation**  \n*Shengyao Zhuang, Houxing Ren, Linjun Shou, Jian Pei, Ming Gong, Guido Zuccon, and Daxin Jiang*  \nArxiv 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.10128)] [[Code](https:\u002F\u002Fgithub.com\u002FArvinZhuang\u002FDSI-transformers)]\n\n**DynamicRetriever: A Pre-training Model-based IR System with Neither Sparse nor Dense Index**  \n*Zhou et al*  \nArxiv 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2203.00537.pdf)]\n\n**Ultron: An Ultimate Retriever on Corpus with a Model-based Indexer**  \n*Zhou et al*  \nArxiv 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2208.09257.pdf)]\n\n### Generate a string as an identifier\n\n**Lightweight and Direct Document Relevance Optimization for Generative Information Retrieval**  \n*Kidist Amde Mekonnen, Yubao Tang, Maarten de Rijke*  \narXiv – Apr 2025 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2504.05181)] [[Code](https:\u002F\u002Fgithub.com\u002Fkidist-amde\u002Fddro)]\n\n**Planning Ahead in Generative Retrieval: Guiding Autoregressive Generation through Simultaneous Decoding**  \n*Hansi Zeng ,Chen Luo ,Hamed Zamani*  \narXiv – Apr 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2404.14600.pdf)] [[Code](https:\u002F\u002Fgithub.com\u002FHansiZeng\u002FPAG)]\n\n**Generative Retrieval as Multi-Vector Dense Retrieval**  \n*Shiguang Wu, Wenda Wei, Mengqi Zhang, Zhumin Chen, Jun Ma, Zhaochun Ren, Maarten de Rijke, Pengjie Ren*  \nSIGIR 2024 - Mar 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.00684)] [[Code](https:\u002F\u002Fgithub.com\u002FFuryton\u002FGR-as-MVDR)]\n\n**Re3val: Reinforced and Reranked Generative Retrieval**  \n*EuiYul Song, Sangryul Kim, Haeju Lee, Joonkee Kim, James Thorne*  \nEACL Findings 2023 – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.16979.pdf)]\n\n**GLEN: Generative Retrieval via Lexical Index Learning**  \n*Sunkyung Lee, Minjin Choi, Jongwuk Lee*  \nEMNLP 2023 - Dec 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.emnlp-main.477\u002F)] [[Code](https:\u002F\u002Fgithub.com\u002Fskleee\u002FGLEN)]\n\n**Enhancing Generative Retrieval with Reinforcement Learning from Relevance Feedback**  \n*Yujia Zhou, Zhicheng Dou, Ji-Rong Wen*  \nEMNLP 2023 - Dec 2023 [[paper](https:\u002F\u002Faclanthology.org\u002F2023.emnlp-main.768.pdf)]\n\n**NOVO: Learnable and Interpretable Document Identifiers for Model-Based IR**  \n*Zihan Wang, Yujia Zhou, Yiteng Tu, Zhicheng Dou*  \nCIKM 2023 - Oct 2023 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.1145\u002F3583780.3614993)]\n\n**Generative Retrieval with Large Language Models**  \n*Anonymous*  \nICLR 24 – Oct 2023 [[paper](https:\u002F\u002Fopenreview.net\u002Fforum?id=oXYZJXDdo7)]\n\n**Semantic-Enhanced Differentiable Search Index Inspired by Learning Strategies**  \n*Yubao Tang, Ruqing Zhang, Jiafeng Guo, Jiangui Chen, Zuowei Zhu, Shuaiqiang Wang, Dawei Yin, Xueqi Cheng*  \nKDD 2023 – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.15115)] \n\n**Term-Sets Can Be Strong Document Identifiers For Auto-Regressive Search Engines**  \n*Peitian Zhang, Zheng Liu, Yujia Zhou, Zhicheng Dou, Zhao Cao*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.13859)] [[Code](https:\u002F\u002Fgithub.com\u002Fnamespace-Pt\u002FAdon\u002Ftree\u002FAutoTSG)] \n\n**A Unified Generative Retriever for Knowledge-Intensive Language Tasks via Prompt Learning**  \n*Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Yiqun Liu, Yixing Fan, Xueqi Cheng*  \nSIGIR 2023 – Apr 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.14856)] [[Code](https:\u002F\u002Fgithub.com\u002Fict-bigdatalab\u002FUGR)] \n\n**CorpusBrain: Pre-train a Generative Retrieval Model for Knowledge-Intensive Language Tasks**  \n*Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yiqun Liu, Yixing Fan, Xueqi Cheng*  \nCIKM 2022 – Aug 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.07652)] [[Code](https:\u002F\u002Fgithub.com\u002Fict-bigdatalab\u002FCorpusBrain)] \n\n**Autoregressive Search Engines: Generating Substrings as Document Identifiers**  \n*Michele Bevilacqua, Giuseppe Ottaviano, Patrick Lewis, Wen-tau Yih, Sebastian Riedel, Fabio Petroni*  \narXiv – Apr 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2204.10628.pdf)] [[Code](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002FSEAL)]\n\n**Autoregressive Entity Retrieval**  \n*Nicola De Cao, Gautier Izacard, Sebastian Riedel, Fabio Petroni*  \nICLR 2021 – Oct 2020 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2010.00904.pdf)] [[Code](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002FGENRE)]\n\n### Continual Learning for Generative Retrieval\n\n**CLEVER: Continual Learning for Generative Retrieval over Dynamic Corpora​**  \n*Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Maarten de Rijke, Wei Chen, Yixing Fan, Xueqi Cheng*  \nCIKM 2023 - Aug 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.14968)]\n\n**DSI++: Updating Transformer Memory with New Documents**  \n*Sanket Vaibhav Mehta, Jai Gupta, Yi Tay, Mostafa Dehghani, Vinh Q. Tran, Jinfeng Rao, Marc Najork, Emma Strubell, Donald Metzler*  \narXiv – Dec 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.09744)]\n\n**IncDSI: Incrementally Updatable Document Retrieval​**\n*Varsha Kishore, Chao Wan, Justin Lovelace, Yoav Artzi, Kilian Q. Weinberger*\nICML'23 - Jul 2023 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.5555\u002F3618408.3619112)]\n\n**Exploring the Practicality of Generative Retrieval on Dynamic Corpora**\n*Chaeeun Kim, Soyoung Yoon, Hyunji Lee, Joel Jang, Sohee Yang, Minjoon Seo*\nEMNLP 24 - Nov 2024 [[paper](https:\u002F\u002Faclanthology.org\u002F2024.emnlp-main.755\u002F)]\n\n**Replication and Exploration of Generative Retrieval over Dynamic Corpora**\n*Zhen Zhang, Xinyu Ma, Weiwei Sun, Pengjie Ren, Zhumin Chen, Shuaiqiang Wang, Dawei Yin, Maarten de Rijke, Zhaochun Ren*\nSIGIR 2025 - Jul 2025 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2504.17519)]\n\n**CorpusBrain++: A Continual Generative Pre-Training Framework for Knowledge-Intensive Language Tasks​**\n*Jiafeng Guo, Changjiang Zhou, Ruqing Zhang, Jiangui Chen, Maarten de Rijke, Yixing Fan, Xueqi Cheng*\narXiv – Feb 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2402.16767)]\n\n### Applications\n\n**Data-Efficient Autoregressive Document Retrieval for Fact Verification**  \n*James Thorne*  \nSustaiNLP@EMNLP 2022 – Nov 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.09388)]\n\n**GERE: Generative Evidence Retrieval for Fact Verification**  \n*Jiangui Chen, Ruqing Zhang, Jiafeng Guo, Yixing Fan, Xueqi Cheng*  \nSIGIR 2022 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002Fpdf\u002F10.1145\u002F3477495.3531827)] [[Code](https:\u002F\u002Fgithub.com\u002FChriskuei\u002FGERE)]\n\n**Generative Multi-hop Retrieval**  \n*Hyunji Lee, Sohee Yang, Hanseok Oh, Minjoon Seo*  \narXiv – Apr 2022 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2312.15450.pdf)]\n\n## Generative Recommendation\n\n**Improving LLMs for Recommendation with Out-Of-Vocabulary Tokens**  \n*Ting-Ji Huang, Jia-Qi Yang, Chunxu Shen, Kai-Qi Liu, De-Chuan Zhan, Han-Jia Ye*  \narXiv – Jun 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2406.08477)]\n\n**Plug-in Diffusion Model for Sequential Recommendation**  \n*Haokai Ma, Ruobing Xie, Lei Meng, Xin Chen, Xu Zhang, Leyu Lin, Zhanhui Kang*  \narXiv – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.02913.pdf)]\n\n**Towards Graph-Aware Diffusion Modeling For Collaborative Filtering**\n*Yunqin Zhu1, Chao Wang, Hui Xiong*  \narXiv – Nov 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2311.08744.pdf)]\n\n**RecMind: Large Language Model Powered Agent For Recommendation**  \n*Yancheng Wang, Ziyan Jiang, Zheng Chen, Fan Yang, Yingxue Zhou, Eunah Cho, Xing Fan, Xiaojiang Huang, Yanbin Lu, Yingzhen Yang*  \narXiv – Aug 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.14296)]\n\n**Is ChatGPT Fair for Recommendation? Evaluating Fairness in Large Language Model Recommendation**  \n*Jizhi Zhang, Keqin Bao, Yang Zhang, Wenjie Wang, Fuli Feng, Xiangnan He*  \nRecsys 2023 – Jul 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2305.07609v2.pdf)]\n\n**RecFusion: A Binomial Diffusion Process for 1D Data for Recommendation**  \n*Gabriel Bénédict, Olivier Jeunen, Samuele Papa, Samarth Bhargav, Daan Odijk, Maarten de Rijke*  \narXiv – Jun 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.08947)]\n\n**A First Look at LLM-Powered Generative News Recommendation**  \n*Qijiong Liu, Nuo Chen, Tetsuya Sakai, Xiao-Ming Wu*  \narXiv – Jun 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2305.06566.pdf)]\n\n**Large Language Models as Zero-Shot Conversational Recommenders**  \n*Yupeng Hou, Junjie Zhang, Zihan Lin, Hongyu Lu, Ruobing Xie, Julian McAuley, Wayne Xin Zhao*  \narXiv – May 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2308.10053.pdf)]\n\n**DiffuRec: A Diffusion Model for Sequential Recommendation**  \n*Zihao Li, Aixin Sun, Chenliang Li*  \narXiv – Apr 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.00686)]\n\n**Diffusion Recommender Model**  \n*Wenjie Wang, Yiyan Xu, Fuli Feng, Xinyu Lin, Xiangnan He, Tat-Seng Chua*  \nSIGIR 2023 – Apr 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.04971)]\n\n**Blurring-Sharpening Process Models for Collaborative Filtering**  \n*Jeongwhan Choi, Seoyoung Hong, Noseong Park, Sung-Bae Cho*  \nSIGIR 2023 – Apr 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.09324)] [[code](https:\u002F\u002Fgithub.com\u002Fjeongwhanchoi\u002FBSPM)]\n\n**Recommender Systems with Generative Retrieval**  \n*Shashank Rajput, Nikhil Mehta, Anima Singh, Raghunandan Keshavan, Trung Vu, Lukasz Heldt, Lichan Hong, Yi Tay, Vinh Q. Tran, Jonah Samost, Maciej Kula, Ed H. Chi, Maheswaran Sathiamoorthy*  \nnon-archival – Mar 2023 [[paper](https:\u002F\u002Fshashankrajput.github.io\u002FGenerative.pdf)]\n\n**Pre-train, Prompt and Recommendation: A Comprehensive Survey of Language Modelling Paradigm Adaptations in Recommender Systems**  \n*Peng Liu, Lemei Zhang, Jon Atle Gulla*  \narXiv – Feb 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.03735)]\n\n**Generative Slate Recommendation with Reinforcement Learning**  \n*Romain Deffayet, Thibaut Thonet, Jean-Michel Renders, and Maarten de Rijke*  \nWSDM 2023 – Feb 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.08632)]\n\n**Recommendation via Collaborative Diffusion Generative Model**  \n*Joojo Walker, Ting Zhong, Fengli Zhang, Qiang Gao, Fan Zhou*  \nKSEM 2022 – Aug 2022 [[paper](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002Fabs\u002F10.1007\u002F978-3-031-10989-8_47)]\n\n## Generative Knowledge Graphs\n\n**What Breaks Knowledge Graph based RAG? Empirical Insights into Reasoning under Incomplete Knowledge**  \n*Dongzhuoran Zhou, Yuqicheng Zhu, Xiaxia Wang, Hongkuan Zhou, Yuan He, Jiaoyan Chen, Steffen Staab, Evgeny Kharlamov*  \narXiv – Aug 2025 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2508.08344)]\n\n**KG-CQR: Leveraging Structured Relation Representations in Knowledge Graphs for Contextual Query Retrieval**  \n*Chi Minh Bui, Ngoc Mai Thieu, Van Vinh Nguyen, Jason J.Jung, Khac-Hoai Nam Bui*  \narXiv – Aug 2025 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2508.20417)]\n\n**DocGraphLM: Documental Graph Language Model for Information Extraction**  \n*Dongsheng Wang, Zhiqiang Ma, Armineh Nourbakhsh, Kang Gu, Sameena Shah*  \narXiv – Jan 2024 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.02823.pdf)]\n\n**KBFormer: A Diffusion Model for Structured Entity Completion**  \n*Ouail Kitouni, Niklas Nolte, James Hensman, Bhaskar Mitra*  \narXiv – Dec 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2312.05253.pdf)]\n\n**From Retrieval to Generation: Efficient and Effective Entity Set Expansion**  \n*Shulin Huang, Shirong Ma, Yangning Li, Yinghui Li, Hai-Tao Zheng, Yong Jiang*  \narXiv – Apr 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.03531v1)]\n\n**Crawling the Internal Knowledge-Base of Language Models**  \n*Roi Cohen, Mor Geva, Jonathan Berant, Amir Globerson*  \narXiv – Jan 2023 [[paper](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.12810)]\n\n**Prompt Tuning or Fine-Tuning - Investigating Relational Knowledge in Pre-Trained Language Models**  \n*Leandra Fichtel, Jan-Christoph Kalo, Wolf-Tilo Balke*  \nAKBC 2021 – [[paper](https:\u002F\u002Fopenreview.net\u002Fpdf?id=o7sMlpr9yBW)]\n\n**Language Models as Knowledge Bases?**  \n*Fabio Petroni, Tim Rocktäschel, Patrick Lewis, Anton Bakhtin, Yuxiang Wu, Alexander H. Miller, Sebastian Riedel*  \nEMNLP 2019 – Sep 2019 [[paper](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1909.01066.pdf)]\n\n\n## Live Generative Retrieval\n\nAlthough some of these are not accompanied by a paper, they might be useful to other Generative IR researchers for empirical studies or interface design considerations.\n\n⚡\n**Gemini** Dec 2023 [[live](https:\u002F\u002Fgemini.google.com\u002Fapp️)]  ⚡️\n**factiverse** Jun 2023 [[live](https:\u002F\u002Feditor.factiverse.ai\u002F)] ⚡️\n**devmarizer** Mar 2023 [[live](https:\u002F\u002Fdevmarizer.firebaseapp.com\u002F)] ⚡️\n**TaxGenius** Mar 2023 [[live](https:\u002F\u002Fwww.taxgenius.app\u002F)] ⚡️\n**doc-gpt** Mar 2023 [[live](https:\u002F\u002Fpineappleexpress808-doc-gpt-doc-gpt-q0823l.streamlit.app\u002F)] ⚡️\n**book-gpt** Feb 2023 [[live](https:\u002F\u002Fgithub.com\u002Ffraserxu\u002Fbook-gpt)] ⚡️\n**Neeva** Feb 2023 [[live](https:\u002F\u002Fneeva.com\u002F)] ⚡️\n**Golden Retriever** Feb 2023 [[live](https:\u002F\u002Fgolden.com\u002Fai)] ⚡️\n**Bing – Prometheus** Feb 2023 [[waitlist](https:\u002F\u002Fwww.bing.com\u002F)] ⚡️\n**Google – Bard** Feb 2023 [only in certain countries] ⚡️\n**Paper QA** Feb 2023 [[code](https:\u002F\u002Fgithub.com\u002Fwhitead\u002Fpaper-qa)] [[demo](https:\u002F\u002Fhuggingface.co\u002Fspaces\u002Fwhitead\u002Fpaper-qa)] ⚡️\n**DocsGPT** Feb 2023 [[live](https:\u002F\u002Fdocsgpt.arc53.com\u002F)] [[code](https:\u002F\u002Fgithub.com\u002Farc53\u002Fdocsgpt)] ⚡️\n**DocAsker** Jan 2023 [[live](https:\u002F\u002Fwww.docasker.com\u002F)] ⚡️\n**Lexii.ai** Jan 2023 [[live](https:\u002F\u002Flexii.ai\u002F)] ⚡️\n**YOU.com** Dec 2022 [[live](https:\u002F\u002Fyou.com\u002F)] ⚡️\n**arXivGPT** Dec 2022 [[Chrome extension](https:\u002F\u002Fgithub.com\u002FhunkimForks\u002Fchatgpt-arxiv-extension)] ⚡️\n**GPT Index** Nov 2022 [[API](https:\u002F\u002Fgithub.com\u002Fjerryjliu\u002Fgpt_index)] ⚡️\n**BlenderBot** Aug 2022 [[live (USA)](https:\u002F\u002Fgeo-not-available.blenderbot.ai\u002F)] [[model weights](https:\u002F\u002Fparl.ai\u002Fdocs\u002Fzoo.html)] [[code](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002FParlAI\u002Fblob\u002Fmain\u002Fprojects\u002Fbb3\u002Fagents\u002FREADME.md)] [[paper1](#paper-blenderbot)] [[paper2](#paper-blenderbot-hf)] ⚡️\n**PHIND** date? [[live](https:\u002F\u002Fphind.com\u002F)] ⚡️\n**Perplexity** date? [[live](https:\u002F\u002Fwww.perplexity.ai\u002F)] ⚡️\n**Galactica** date? [[demo](https:\u002F\u002Fgalactica.org\u002Fexplore\u002F)] [[API](https:\u002F\u002Fgithub.com\u002Fpaperswithcode\u002Fgalai)] [[paper](#paper-galactica)] ⚡️\n**Elicit** date? [[live](https:\u002F\u002Felicit.org\u002F)] ⚡️\n**ZetaAlpha** date? [[live](https:\u002F\u002Fsearch.zeta-alpha.com\u002F)] uses OpenAI API \n\n---\n\nTo get just the paper titles do `grep '\\*\\*' README.md | sed 's\u002F\\*\\*\u002F\u002Fg'`\n","# 令人惊叹的生成式信息检索 [![Awesome](https:\u002F\u002Fawesome.re\u002Fbadge-flat2.svg)](https:\u002F\u002Fawesome.re)\n\n对话模型开始具备访问网络或用来源佐证其说法（即归属）的能力。因此，这些聊天机器人可以被视为信息检索机器，与传统搜索引擎竞争，甚至取而代之。我们希望为这类模型以及更广泛的生成式信息检索领域设立一个专门的空间。我们暂且将该领域划分为两个主要方向：**基于知识的答案生成**和**生成式文档检索**。此外，我们也涵盖了生成式推荐、生成式基于知识的摘要等内容。\n\n欢迎提交 Pull 请求！\n\n# 目录\n\n- [博客文章](#blog-posts)\n- [数据集](#datasets)\n- [工具](#tools)\n- [评估](#evaluation)\n- [研讨会与教程](#workshops-and-tutorials)\n- [认识论论文](#epistemology-papers)\n- [基于知识的答案生成](#grounded-answer-generation)\n  - [检索增强生成 (RAG)](#retrieval-augmented-generation-rag)（在推理时进行外部知识库检索）\n  - [大语言模型记忆操作](#llm-memory-manipulation)（在推理时基于模型内部权重进行知识关联）\n  - [重排序](#re-ranking)\n  - [自我修正](#self-correction)\n  - [事实不确定性估计](#fact-uncertainty-estimates)\n  - [约束生成](#constrained-generation)\n  - [数据驱动](#data-centric)\n  - [效用最大化](#utility-maximization)\n  - [多模态](#multimodal)\n  - [提示工程](#prompting)\n  - [生成代码](#generate-code)\n  - [查询生成](#query-generation)\n  - [摘要与文档改写](#summarization-and-document-rewriting)\n  - [表格问答](#table-qa)\n- [生成式文档检索](#generative-document-retrieval)\n  - [生成文档 ID 作为标识符](#generate-a-document-id-as-an-identifier)\n  - [生成字符串作为标识符](#generate-a-string-as-an-identifier)\n  - [面向生成式检索的持续学习](#continual-learning-for-generative-retrieval)\n  - [应用](#applications)\n- [生成式推荐](#generative-recommendation)\n- [生成式知识图谱](#generative-knowledge-graphs)\n- [实时生成式检索](#live-generative-retrieval)\n\n## 博客文章\n\n**确定性引用：让大语言模型在医疗保健领域更安全**  \n*Matt Yeung*  \n个人博客 – 2024年4月 [[链接](https:\u002F\u002Fmattyyeung.github.io\u002Fdeterministic-quoting)]\n\n**检索增强生成研究：2017–2024年**  \n*Moritz Mallawitsch*  \nScaling Knowledge – 2024年2月 [[链接](https:\u002F\u002Fscalingknowledge.substack.com\u002Fp\u002Frag)]\n\n**掌握 RAG：如何构建企业级 RAG 系统**  \n*Pratik Bhavsar*  \nGalileo Labs – 2024年1月 [[链接](https:\u002F\u002Fwww.rungalileo.io\u002Fblog\u002Fmastering-rag-how-to-architect-an-enterprise-rag-system#multi-tenancy)]\n\n**使用 LlamaIndex 在本地运行 Mixtral 8x7**  \n*LlamaIndex*  \nLlamaIndex 博客 – 2023年12月 [[链接](https:\u002F\u002Fblog.llamaindex.ai\u002Frunning-mixtral-8x7-locally-with-llamaindex-e6cebeabe0ab)]\n\n**高级 RAG 技术：图文并茂的概述**  \n*Ivan Ilin*  \nTowards AI – 2023年12月 [[链接](https:\u002F\u002Fpub.towardsai.net\u002Fadvanced-rag-techniques-an-illustrated-overview-04d193d8fec6)]\n\n**结合 LlamaIndex 和 Neo4j 的多模态 RAG 流程**  \n*Tomaz Bratanic*  \nLlamaIndex 博客 – 2023年12月 [[链接](https:\u002F\u002Fblog.llamaindex.ai\u002Fmultimodal-rag-pipeline-with-llamaindex-and-neo4j-a2c542eb0206)]\n\n**针对表格的 RAG 基准测试**  \n*LangChain*  \nLangChain 博客 – 2023年12月 [[链接](https:\u002F\u002Fblog.langchain.dev\u002Fbenchmarking-rag-on-tables\u002F)]\n\n**高级 RAG 01：从小到大的检索**  \n*Sophia Yang*  \nTowards Data Science – 2023年11月 [[链接](https:\u002F\u002Ftowardsdatascience.com\u002Fadvanced-rag-01-small-to-big-retrieval-172181b396d4)]\n\n**查询变换**  \n*LangChain*  \nLangChain 博客 – 2023年10月 [[链接](https:\u002F\u002Fblog.langchain.dev\u002Fquery-transformations\u002F)]\n\n**什么样的对话代理才算有用？**  \n*Nazneen Rajani、Nathan Lambert、Victor Sanh、Thomas Wolf*  \nHugging Face 博客 – 2023年1月 [[链接](https:\u002F\u002Fhuggingface.co\u002Fblog\u002Fdialog-agents)]\n\n**预测语言模型可能被滥用于虚假信息传播，并探讨降低风险的方法**  \n*Josh A. Goldstein、Girish Sastry、Micah Musser、Renée DiResta、Matthew Gentzel、Katerina Sedova*  \nOpenAI 博客 – 2023年1月 [[链接](https:\u002F\u002Fopenai.com\u002Fresearch\u002Fforecasting-misuse)]\n\n## 数据集\n\n**事实、检索与推理：检索增强生成的统一评估**\n*萨蒂亚普里亚·克里希纳、卡尔佩什·克里希纳、安哈德·莫哈内伊、史蒂文·施瓦茨、亚当·斯坦布勒、夏姆·乌帕迪亚耶、马纳尔·法鲁基*\narXiv – 2024年9月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2409.12941)] [[数据](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fgoogle\u002Fframes-benchmark)]\n\n**LitSearch：科学文献检索的检索基准测试**\n*阿尼鲁德·阿吉特、孟舟夏、亚历克西斯·谢瓦利耶、塔尼亚·戈亚尔、丹奇·陈、田宇·高*\narXiv – 2023年7月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2407.18940)] [[数据](https:\u002F\u002Fgithub.com\u002Fprinceton-nlp\u002FLitSearch)]\n\n**BRIGHT：面向推理密集型检索的真实且具有挑战性的基准测试**\n*苏洪进、霍华德·延、孟舟夏、史伟嘉、尼克拉斯·门尼霍夫、王汉宇、刘海苏、石权、扎卡里·S·西格尔、迈克尔·唐、孙若曦、尹晋成、塞尔坎·O·阿里克、丹奇·陈、余涛*\narXiv – 2023年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2407.12883)] [[数据](https:\u002F\u002Ft.co\u002FP3GyfcO0gO)] [[代码](github.com\u002Fxlang-ai\u002FBRIGHT)]\n\n**FreshLLMs：通过搜索引擎增强刷新大型语言模型**\n*涂武、莫希特·艾耶尔、王学智、诺亚·康斯坦特、杰瑞·魏、杰森·魏、克里斯·塔尔、云轩·宋、邓尼·周、阮国乐、汤朗*\narXiv – 2023年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.03214)] [[代码](https:\u002F\u002Fgithub.com\u002Ffreshllms\u002Ffreshqa)]\n\n**LegalBench：用于衡量大型语言模型法律推理能力的协作构建基准测试**\n*尼尔·古哈、朱利安·尼亚科、丹尼尔·E·霍、克里斯托弗·雷、亚当·奇尔顿、阿迪提亚·纳拉亚纳、亚历克斯·乔赫拉斯-伍德、奥斯汀·彼得斯、布兰登·沃尔登、丹尼尔·N·罗克莫尔、迭戈·桑布拉诺、德米特里·塔利斯曼、埃南·霍克、法伊兹·苏拉尼、弗兰克·法根、加利特·萨尔法蒂、格雷戈里·M·迪金森、哈盖·波拉特、杰森·赫格兰、杰西卡·吴、乔·努德尔、乔尔·尼克劳斯、约翰·奈、乔纳森·H·崔、凯文·托比亚、玛格丽特·哈根、梅根·马、迈克尔·利弗莫尔、尼肯·拉苏莫夫-拉赫、尼尔斯·霍尔岑贝格、诺姆·科尔特、彼得·亨德森、肖恩·雷哈格、沙拉德·戈埃尔、尚高、斯宾塞·威廉姆斯、桑尼·甘地、汤姆·祖尔、瓦伦·艾耶尔、李泽华*\narXiv – 2023年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.11462)] [[数据集](https:\u002F\u002Fhuggingface.co\u002Fdatasets\u002Fnguha\u002Flegalbench)]\n\n**OpenAssistant对话——推动大型语言模型对齐民主化**\n*安德烈亚斯·科普夫、扬尼克·基尔彻、迪米特里·冯·吕特、索蒂里斯·阿纳格诺斯蒂迪斯、谭志锐、基思·史蒂文斯、阿卜杜拉·巴尔胡姆、阮明德、奥利弗·斯坦利、理查德·纳吉菲、沙胡尔·ES、萨米尔·苏里、大卫·格卢什科夫、阿尔纳夫·丹图鲁里、安德鲁·麦圭尔、克里斯托夫·舒曼、胡·阮、亚历山大·马蒂克*\narXiv – 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.07327)]\n\n**ChatGPT-RetrievalQA**\n*阿里安·阿斯卡里、穆罕默德·阿里安内贾迪、埃万杰洛斯·卡诺拉斯、苏珊·费尔伯恩*\nGithub – 2023年2月 [[代码](https:\u002F\u002Fgithub.com\u002Farian-askari\u002FChatGPT-RetrievalQA)]\n\n**KAMEL：语言模型中的多词实体知识分析**\n*扬-克里斯托夫·卡洛、莱昂德拉·菲希特尔*\nAKBC 22 – [[论文](https:\u002F\u002Fwww.akbc.ws\u002F2022\u002Fassets\u002Fpdfs\u002F15_kamel_knowledge_analysis_with_.pdf)]\n\n**TruthfulQA：衡量模型如何模仿人类错误观念**\n*斯蒂芬妮·林、雅各布·希尔顿、欧文·埃文斯*\narXiv – 2021年9月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2109.07958.pdf)] [[代码](https:\u002F\u002Fgithub.com\u002Fsylinrl\u002FTruthfulQA)]\n\n**复杂答案检索**\n*劳拉·迪茨、玛尼莎·维尔马、菲利普·拉德林斯基、尼克·克拉斯韦尔、本·加马里、杰夫·达尔顿、约翰·福利*\nTREC – 2017–2019年 [[链接](http:\u002F\u002Ftrec-car.cs.unh.edu\u002F)]\n\n## 工具\n\n**GraphRAG**\n*乔纳森·拉尔森、史蒂文·特鲁伊特*\n微软 – 2024年2月 [[代码](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fgraphrag)]\n\n**缩小知识评估差距：基于多粒度答案的开放域问答**\n*加尔·约纳、罗伊·阿哈罗尼、莫尔·格瓦*\narXiv – 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.04695.pdf)]\n\n**DHS LLM研讨会——模块6**\n*索拉布·芒格鲁尔卡尔*\nGitHub – 2023年12月 [[代码](https:\u002F\u002Fgithub.com\u002Fpacman100\u002FDHS-LLM-Workshop\u002Ftree\u002Fmain\u002F6_Module)]\n\n**PrimeQA：最先进的多语言问答研究与开发的首要资源库**\n*阿维鲁普·西尔、杰迪普·森、巴瓦尼·艾耶尔、马丁·弗兰茨、克希蒂吉·法德尼斯、米哈埃拉·博尔内亚、萨拉·罗森塔尔、斯科特·麦卡利、荣章、维什瓦吉特·库马尔、于龙·李、穆罕默德·阿拉法特·苏丹、里亚兹·巴特、拉杜·弗洛里安、萨利姆·鲁科斯*\narXiv – 2023年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.09715)] [[代码](https:\u002F\u002Fgithub.com\u002Fprimeqa\u002Fprimeqa)]\n\n**TRL：Transformer强化学习**\n*莱昂德罗·冯·韦拉、尤内斯·贝尔卡达、刘易斯·通斯托尔、爱德华·比钦、特里斯坦·瑟什、内森·兰伯特、黄盛义*\nGitHub – 2020年 [[代码](https:\u002F\u002Fgithub.com\u002Fhuggingface\u002Ftrl)]\n\n## 评估\n\n**FACTSCORE：长篇文本生成中事实精确性的细粒度原子级评估**\n*徐源敏、卡尔佩什·克里希纳、吕欣希、迈克·刘易斯、叶文涛、郭邦伟、莫希特·艾耶尔、卢克·泽特勒莫耶、汉娜内·哈吉希尔齐*\nPypi – 2023年5月 [[论文](https:\u002F\u002Fmartiansideofthemoon.github.io\u002Fassets\u002Ffactscore.pdf)] [[代码](https:\u002F\u002Fpypi.org\u002Fproject\u002Ffactscore\u002F#description)]\n\n**FACTKB：利用增强事实知识的语言模型进行可泛化的事实性评估**\n*冯尚斌、维迪莎·巴拉昌德兰、白宇阳、尤莉娅·茨维特科夫*\narXiv – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.08281)] [[代码](https:\u002F\u002Fgithub.com\u002FBunsenFeng\u002FFactKB)]\n\n**生成式搜索引擎的可验证性评估**\n*尼尔森·F·刘、张天一、珀西·梁*\narXiv – 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.09848)] [[代码](https:\u002F\u002Fgithub.com\u002Fnelson-liu\u002Fevaluating-verifiability-in-generative-search-engines)]\n\n## 研讨会和教程\n\n**推荐系统与个性化中的生成式AI研讨会**\n*纳尔格斯·塔巴里、阿尼凯特·德什穆克、王成康、拉什米·甘加达赖亚、哈梅德·扎马尼、朱利安·麦考利、乔治·卡里皮斯*\nKDD 24 – 2024年8月 [[链接](https:\u002F\u002Fgenai-personalization.github.io\u002FGenAIRecP2024)]\n\n**第二届生成式信息检索研讨会**\n*加布里埃尔·贝内迪克特、张如清、唐纳德·梅茨勒、安德鲁·耶茨、蒋子言*\nSIGIR 24 – 2024年7月 [[链接](https:\u002F\u002Fcoda.io\u002F@sigir\u002Fgen-ir-24)]\n\n**个性化生成式AI**\n*郑辰、蒋子言、杨帆、韩奎·何、侯玉鹏、全恩雅、朱利安·麦考利、阿拉姆·加尔斯蒂安、胡晓华、杨洁*\nCIKM 23 – 2023年10月 [[链接](https:\u002F\u002Fsites.google.com\u002Fview\u002Fpgai2023\u002Fhome)]\n\n**首届基于生成模型的推荐研讨会**\n*王文杰、刘勇、张洋、刘伟文、冯福礼、何祥楠、孙爱新*\nCIKM 23 – 2023年10月 [[链接](https:\u002F\u002Frgm-cikm23.github.io\u002F)]\n\n**首届生成式信息检索研讨会**\n*加布里埃尔·贝内迪克特、张如清、唐纳德·梅茨勒*\nSIGIR 23 – 2023年7月 [[链接](https:\u002F\u002Fcoda.io\u002F@sigir\u002Fgen-ir)]\n\n**基于检索的语言模型及其应用**\n*浅井茜、徐源敏、钟泽轩、陈丹奇*\nACL 23 – 2023年7月 [[链接](https:\u002F\u002Facl2023-retrieval-lm.github.io\u002F)]\n\n## 认识论论文\n\n**主体性信息检索**  \n*张伟楠、廖俊威、李宁、杜坤年华*  \narXiv — 2024年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2410.09713)]\n\n**背诵、重构、回忆：大语言模型中的记忆现象及其多面性**  \n*USVSN 赛·普拉桑特、邓阿尔文、欧布莱恩凯尔、Jyothir S V、穆罕默德·阿夫拉赫·汗、博卡尔杰伊迪普、乔克特-丘克里斯托弗 A、富恩雅各布·雷、比德曼斯特拉、凯特蕾西、李凯瑟琳、萨夫拉娜奥米*  \narXiv — 2024年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2406.17746)]\n\n**ChatGPT 就是胡扯**  \n*迈克尔·汤森·希克斯、詹姆斯·亨弗里斯、乔·斯莱特*  \n《伦理与信息技术》— 2024年6月 [[论文](https:\u002F\u002Flink.springer.com\u002Fepdf\u002F10.1007\u002Fs10676-024-09775-5?sharing_token=0CIhP_zo5-plierRq8kkDPe4RwlQNchNByi7wbcMAY77xTOWyddkW01qGFs1m5zuuoZGBctVlsJF8SbYqcxWi-XzgEYEPiw7xwWi4bMYXJ_1JARDrER9JGdWZOW-UGSkrk_tXPjPh-XWvFNoiFzNlnDUUUEBAztiX9PtP2p6jfI%3D)]\n\n**多模态大语言模型的幻觉现象：综述**  \n*白泽晨、王皮超、肖天俊、何通、韩宗博、张正、寿郑迈克*  \narXiv — 2024年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.18930)]\n\n**从匹配到生成：生成式信息检索综述**  \n*李晓溪、金家杰、周宇佳、张雨瑶、张培田、朱玉涛、窦志成*  \narXiv — 2024年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.14851)]\n\n**大语言模型中的知识冲突：综述**  \n*徐荣武、齐哲涵、王存祥、王洪儒、张岳、徐伟*  \narXiv — 2024年3月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2403.08319)]\n\n**SIGIR 2023 第1届生成式信息检索研讨会（Gen-IR 2023）报告**  \n*加布里埃尔·贝内迪克特、张如清、唐纳德·梅茨勒、安德鲁·耶茨、罗曼·德法耶、菲利普·哈格尔、萨米·朱利安*  \nSIGIR论坛 — 2023年12月 [[论文](https:\u002F\u002Fsigir.org\u002Fwp-content\u002Fuploads\u002F2023\u002F12\u002Fp13.pdf)]\n\n**SIGIR 2023 第1届生成式AI时代下的任务导向型信息检索研讨会报告**  \n*奇拉格·沙阿、怀特瑞恩 W*  \nSIGIR论坛 — 2023年12月 [[论文](https:\u002F\u002Fsigir.org\u002Fwp-content\u002Fuploads\u002F2023\u002F12\u002Fp20.pdf)]\n\n**迈向生成式搜索与推荐：RecSys 2023主题演讲**  \n*蔡达生*  \nSIGIR论坛 — 2023年12月 [[论文](https:\u002F\u002Fsigir.org\u002Fwp-content\u002Fuploads\u002F2023\u002F12\u002Fp05.pdf)]\n\n**大型搜索模型：在大语言模型时代重新定义搜索架构**  \n*王亮、杨楠、黄晓龙、杨林军、马久姆德兰甘、魏福如*  \nSIGIR论坛 — 2023年12月 [[论文](https:\u002F\u002Fsigir.org\u002Fwp-content\u002Fuploads\u002F2023\u002F12\u002Fp23.pdf)]\n\n**用于生成式信息抽取的大语言模型：综述**  \n*许德荣、陈伟、彭文俊、张超、许彤、赵向宇、吴贤、郑叶峰、陈恩宏*  \narXiv — 2023年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2312.17617v1.pdf)]\n\n**基于预训练语言模型的密集文本检索：综述**  \n*赵新伟、刘静、任瑞阳、温继荣*  \nTOIS — 2023年12月 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.1145\u002F3637870)]\n\n**面向大语言模型的检索增强生成：综述**  \n*高云帆、熊云、高鑫宇、贾康翔、潘金柳、毕宇熙、戴毅、孙嘉伟、王浩奋*  \narXiv — 2023年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2312.10997v2.pdf)]\n\n**校准后的语言模型必然会产生幻觉**  \n*亚当·陶曼·卡拉伊、桑托什·S·文帕拉*  \narXiv — 2023年11月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2311.14648.pdf)]\n\n**AI海洋中的塞壬之歌：大语言模型幻觉现象综述**  \n*张岳、李亚夫、崔乐洋、蔡登、刘乐茂、傅廷臣、黄欣婷、赵恩波、张宇、陈宇龙、王隆跃、卢安团、毕伟、施芙雷达、施淑明*  \narXiv — 2023年9月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2309.01219)]\n\n**模仿专有大语言模型的虚假承诺**  \n*古迪班德阿尔纳夫、华莱士埃里克、斯奈尔查理、耿信扬、刘浩、阿贝尔彼得、列维谢尔盖、宋丹恩*  \narXiv — 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.15717)]\n\n**生成式推荐：迈向下一代推荐范式**  \n*张凤吉、陈蓓、张悦、刘瑾、赞道光、毛义、楼建广、陈伟竹*  \narXiv — 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2304.03516.pdf)]\n\n**增强型语言模型：综述**  \n*米阿隆格雷瓜尔、德西罗伯托、洛梅利玛丽亚、纳尔潘蒂斯克里斯托福罗斯、帕苏努鲁拉姆、赖莱阿努罗伯塔、罗齐耶尔巴普蒂斯特、希克蒂莫、德维迪-尤简、切利基尔马兹阿斯莉、格拉韦爱德华、勒丘恩扬、夏洛姆托马斯*  \narXiv — 2023年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2302.07842.pdf)]\n\n**生成式语言模型与自动化影响力行动：新兴威胁及潜在应对措施**  \n*戈德斯坦乔什 A、萨斯特里吉里什、穆瑟米卡、迪雷斯塔蕾妮、根策尔马修、谢多娃卡捷琳娜*  \narXiv — 2023年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2301.04246.pdf)]\n\n**对话式信息检索。对话式搜索、推荐和问答入门**  \n*扎马尼哈迈德、特里帕斯约翰娜 R、达尔顿杰夫和拉德林斯基菲利普*  \narXiv — 2023年1月 [[论文](https:\u002F\u002Fwww.sciencedirect.com\u002Fscience\u002Farticle\u002Fpii\u002FS0956713521008355)]\n\n**事实**  \n*凯文·穆利根和法布里斯·科雷亚*  \n《斯坦福哲学百科全书》— 2021年冬季 [[网址](https:\u002F\u002Fplato.stanford.edu\u002Farchives\u002Fwin2021\u002Fentries\u002Ffacts\u002F)]\n\n**诚实AI：开发与治理不撒谎的AI**  \n*欧文·埃文斯、欧文·科顿-巴拉特、芬维登卢卡斯、贝尔斯亚当、巴尔维特阿维塔尔、威尔斯彼得、里盖蒂卢卡、桑德斯威廉*  \narXiv — 2021年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2110.06674.pdf)]\n\n**重新思考搜索：让门外汉成为领域专家**  \n*梅茨勒唐纳德、泰伊易、巴赫里达拉、纳约克马克*  \nSIGIR论坛 2021 — 2021年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2105.02274.pdf)]  \n\n## 知识 grounded 的答案生成\n\n\n**归属式问答：面向归属式大语言模型的评估与建模**  \n*博内特伯恩德、陈文奇、维尔加帕特、阿哈罗尼罗伊、安多尔丹尼尔、索阿雷斯利维奥·巴尔迪尼、艾森斯坦雅各布、甘切夫库兹曼、赫尔齐格乔纳森、辉凯、夸特科夫斯基汤姆、马季、倪建谟、舒斯特塔尔、科恩威廉 W、柯林斯迈克尔、达斯迪潘詹、梅茨勒唐纳德、彼得罗夫斯拉夫、韦伯斯特凯莉*  \narXiv — 2022年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.08037)]\n\n\n### 检索增强生成 (RAG)\n\n> 推理时的外部知识源\u002F检索\n\n**REFRAG：基于解码的RAG重思考**  \n*林晓强、戈什阿里特拉、低健祥布莱恩、施里瓦斯塔瓦安舒马利、莫汉维杰*  \narXiv — 2025年9月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2509.01092)]\n\n**RAPTOR：面向树状检索的递归抽象处理**  \n*萨尔蒂帕尔斯、阿卜杜拉萨尔曼、图利阿迪蒂、坎纳舒布、戈尔迪安娜、曼宁克里斯托弗 D*  \nICLR 24 — 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.18059.pdf)]\n\n**纠正型检索增强生成**  \n*严世奇、顾嘉辰、朱云、凌振华*  \narXiv — 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.15884.pdf)]\n\n**关于时间：在检索增强语言模型中融入时间维度**  \n*加德阿努什卡、杰切娃乔尔杰塔*  \narXiv — 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.13222.pdf)]\n\n**RAG 与微调：流水线、权衡及农业领域的案例研究**  \n*安赫尔斯·巴拉格尔、维纳姆拉·贝纳拉、雷纳托·卢伊兹·德·弗雷塔斯·库尼亚、罗伯托·德·M·埃斯特瓦奥·菲略、托德·亨德里、丹尼尔·霍尔斯坦、珍妮弗·马斯曼、尼克·梅克伦堡、萨拉·马尔瓦尔、莱昂纳多·O·努内斯、拉斐尔·帕迪利亚、莫里斯·夏普、布鲁诺·席尔瓦、斯瓦蒂·夏尔马、维杰·阿斯基、兰维尔·钱德拉*  \narXiv — 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.08406.pdf)]\n\n**序列很重要：用于构建对话式智能体的生成—检索—生成模型**  \n*奎因·帕特瓦丹、格蕾丝·许阳*  \nTREC 23 — 2023年11月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.09513)]\n\n**Self-RAG：通过自我反思学习检索、生成与批判**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=hSyW5go0v8)]\n\n**RA-DIT：检索增强型双指令微调**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=22OTbutug9)]\n\n**基于检索的编码器-解码器语言模型的上下文学习**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=QXRScRrwNr)]\n\n**使检索增强型语言模型对无关上下文更具鲁棒性**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=ZS4m74kZpH)]\n\n**检索与长上下文大语言模型的结合**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=xw5nxFWMlo)]\n\n**将大语言模型的领域适应重新表述为适应—检索—修订**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=3GunDQNKFJ)]\n\n**InstructRetro：检索增强预训练后的指令微调**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=4stB7DFLp6)]\n\n**SuRe：通过摘要式检索提升大语言模型的开放域问答能力**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=w4DW6qkRmt)]\n\n**RECOMP：利用上下文压缩与选择性增强改进检索增强型语言模型**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=ZdjKRbtrth)]\n\n**检索即精准生成**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=clU5xWyItb)]\n\n**PaperQA：用于科学研究的检索增强型生成式智能体**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=clU5xWyItb)]\n\n**理解用于长篇问答的检索增强技术**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=mCnWT9OVvK)]\n\n**基于贝叶斯度量增强检索的个性化语言生成**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fpdf?id=n1LiKueC4F)]\n\n**DSPy：将声明式语言模型调用编译为自我改进的流水线**  \n*奥马尔·哈塔卜、阿尔纳夫·辛格维、帕里迪·马赫什瓦里、张志远、凯沙夫·桑塔南、斯里·瓦尔达马南、赛富尔·哈克、阿舒托什·夏尔马、托马斯·T·乔希、汉娜·莫阿扎姆、希瑟·米勒、马泰伊·扎哈里亚、克里斯托弗·波茨*  \narXiv — 2023年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.03714)] [[代码](https:\u002F\u002Fgithub.com\u002Fstanfordnlp\u002Fdspy)]\n\n**RA-DIT：检索增强型双指令微调**  \n*林西·维多利亚、陈熙伦、陈明达、史伟佳、玛丽亚·洛梅利、里奇·詹姆斯、佩德罗·罗德里格斯、雅各布·卡恩、格尔盖利·西尔瓦西、迈克·刘易斯、卢克·泽特勒莫耶、斯科特·伊赫*  \narXiv — 2023年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.01352)]\n\n**工具文档支持大语言模型零样本使用工具**  \n*谢承宇、陈思安、李春亮、藤井康久、亚历山大·拉特纳、李晨宇、兰贾伊·克里希纳、托马斯·普菲斯特*  \narXiv — 2023年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.00675)]\n\n**ReAugKD：面向预训练语言模型的检索增强知识蒸馏**  \n*张建义、阿希克·穆罕默德、阿迪提亚·阿南塔拉曼、王国银、陈昌友、钟凯、崔庆军、徐毅、曾碧琳、奇林比·特里舒尔、陈怡然*  \nACL 23 — 2023年7月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.acl-short.97.pdf)]\n\n**基于表面的检索降低检索增强型语言模型的困惑度**  \n*埃桑·杜斯特穆罕默迪、托比亚斯·诺伦德、马可·库尔曼、理查德·约翰逊*  \nACL 23 — 2023年7月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.acl-short.45\u002F)]\n\n**软提示微调用于增强大语言模型的密集检索**  \n*彭志远、吴旭阳、方毅*  \narXiv — 2023年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2307.08303)]\n\n**RETA-LLM：一个检索增强型大语言模型工具包**  \n*刘炯楠、金家杰、王子涵、程继韩、窦志成、温继荣*  \narXiv — 2023年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.05212)]\n\n**WebGLM：面向高效网络增强型问答系统并兼顾人类偏好的探索**  \n*刘晓、赖翰宇、于浩、许一凡、曾傲寒、杜正霄、张鹏、董宇啸、唐杰*  \narXiv — 2023年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.07906)]\n\n**WikiChat：通过少量示例在维基百科上进行事实校验，以防止大语言模型聊天机器人产生幻觉**  \n*西娜·J·塞姆纳尼、黄紫薇、张海蒂、拉姆莫妮卡*  \nEMNLP Findings 2023 — 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.14292)] [[代码](https:\u002F\u002Fgithub.com\u002Fstanford-oval\u002FWikiChat)] [[演示](https:\u002F\u002Fwikichat.genie.stanford.edu)]\n\n**RET-LLM：迈向大语言模型的通用读写记忆**  \n*阿里·莫达雷西、艾尤布·伊玛尼、穆赫辛·法亚兹、欣里希·舒策*  \narXiv — 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.14322)]\n\n**Gorilla：连接海量API的大语言模型**  \n*希希尔·G·帕蒂尔、张天俊、王鑫、约瑟夫·E·冈萨雷斯*  \narXiv — 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.15334)] [[代码](https:\u002F\u002Fgithub.com\u002FShishirPatil\u002Fgorilla)]\n\n**我们是否应该用检索来预训练自回归语言模型？一项综合研究**  \n*王博欣、魏平、徐鹏、劳伦斯·麦卡菲、刘子涵、穆罕默德·绍伊比、董毅、奥列克西·库恰耶夫、李博、肖超伟、阿尼玛·阿南德库马尔、布莱恩·卡坦扎罗*  \narXiv — 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.06762)] [[代码](https:\u002F\u002Fgithub.com\u002FNVIDIA\u002FMegatron-LM#retro)]\n\n**核对事实并再试一次：借助外部知识和自动化反馈改进大语言模型**  \n*彭宝林、米歇尔·加利、何鹏程、程浩、谢宇佳、胡宇、黄秋源、拉斯·利登、周宇、陈伟柱、高建峰*  \narXiv — 2023年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.12813)] [[代码](https:\u002F\u002Fgithub.com\u002Fpengbaolin\u002FLLM-Augmenter)]\n\n**Toolformer：语言模型可以自我教授如何使用工具**  \n*蒂莫·希克、简·德维迪-余、罗伯托·德西、罗伯塔·赖莱阿努、玛丽亚·洛梅利、卢克·泽特勒莫耶、尼古拉·坎切达、托马斯·西亚洛姆*  \narXiv — 2023年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.04761)]\n\n**REPLUG：检索增强型黑盒语言模型**  \n*史伟佳、闵世勋、安永道、徐敏俊、里奇·詹姆斯、迈克·刘易斯、卢克·泽特勒莫耶、伊文涛*  \narXiv — 2023年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.12652)]\n\n**上下文检索增强语言模型**  \n*奥里·拉姆、约阿夫·莱文、伊泰·达尔梅迪戈斯、多尔·穆赫盖、阿姆农·沙舒亚、凯文·莱顿-布朗、约阿夫·肖哈姆*  \nAI21 Labs – 2023年1月 [[论文](https:\u002F\u002Fuploads-ssl.webflow.com\u002F60fd4503684b466578c0d307\u002F63c6c20dec4479564db21819_NEW_In_Context_Retrieval_Augmented_Language_Models.pdf)] [[代码](https:\u002F\u002Fgithub.com\u002FAI21Labs\u002Fin-context-ralm)]\n\n**构建开放域聊天机器人的方法**  \n*斯蒂芬·罗勒、艾米丽·迪南、纳曼·戈亚尔、达·朱、玛丽·威廉姆森、尹汉·刘、景旭、迈尔·奥特、埃里克·迈克尔·史密斯、Y-Lan 布雷欧、杰森·韦斯顿*  \nEACL 2021 – 2021年4月 [[论文](https:\u002F\u002Faclanthology.org\u002F2021.eacl-main.24.pdf)]\n\n**AtMan：通过内存高效的注意力操作理解 Transformer 的预测**  \n*哈迈德·扎马尼、乔汉娜·R·特里帕斯、杰夫·道尔顿和菲利普·拉德林斯基*  \narXiv – 2023年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2301.08110.pdf)]\n\n**RetroMAE v2：用于检索型语言模型预训练的双工掩码自编码器**  \n*肖石涛、刘征*  \narXiv – 2023年11月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.08769)]\n\n**演示-搜索-预测：将检索与语言模型结合用于知识密集型自然语言处理**  \n*奥马尔·哈塔卜、凯沙夫·桑塔南、谢昂·丽莎·李、大卫·霍尔、珀西·梁、克里斯托弗·波茨、马泰伊·扎哈里亚*  \narXiv – 2022年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2212.14024.pdf)]\n\n**通过从数万亿个标记中检索来改进语言模型**  \n*塞巴斯蒂安·博尔戈、阿图尔·芒什、乔丹·霍夫曼、特雷弗·蔡、伊莉莎·卢瑟福、凯蒂·米利坎、乔治·范登德里舍、让-巴蒂斯特·莱斯皮奥、博格丹·达莫克、艾丹·克拉克、迭戈·德拉斯卡萨斯、奥蕾莉娅·盖伊、雅各布·梅尼克、罗曼·林、汤姆·亨尼根、萨弗伦·黄、洛伦·马吉奥雷、克里斯·琼斯、阿尔宾·卡西雷尔、安迪·布洛克、米凯拉·帕加尼尼、杰弗里·欧文、奥里奥尔·维尼亚尔斯、西蒙·奥斯因德罗、卡伦·西蒙扬、杰克·W·雷、埃里希·埃尔森和洛朗·西弗雷*  \narXiv – 2022年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2112.04426.pdf)]\n\n**通过从数万亿个标记中检索来改进语言模型**  \n*塞巴斯蒂安·博尔戈、阿图尔·芒什、乔丹·霍夫曼、特雷弗·蔡、伊莉莎·卢瑟福、凯蒂·米利坎、乔治·范登德里舍、让-巴蒂斯特·莱斯皮奥、博格丹·达莫克、艾丹·克拉克、迭戈·德拉斯卡萨斯、奥蕾莉娅·盖伊、雅各布·梅尼克、罗曼·林、汤姆·亨尼根、萨弗伦·黄、洛伦·马吉奥雷、克里斯·琼斯、阿尔宾·卡西雷尔、安迪·布洛克、米凯拉·帕加尼尼、杰弗里·欧文、奥里奥尔·维尼亚尔斯、西蒙·奥斯因德罗、卡伦·西蒙扬、杰克·W·雷、埃里希·埃尔森、洛朗·西弗雷*  \narXiv – 2021年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2112.04426)]\n\n**WebGPT：基于浏览器辅助问答并结合人类反馈**  \n*内海一郎、雅各布·希尔顿、苏奇尔·巴拉吉、杰夫·吴、龙·欧阳、克里斯蒂娜·金、克里斯托弗·赫塞、沙特纳乌·贾因、维尼特·科萨拉朱、威廉·桑德斯、徐江、卡尔·科布、蒂娜·埃隆杜、格雷琴·克鲁格、凯文·巴顿、马修·奈特、本杰明·切斯、约翰·舒尔曼*  \narXiv – 2021年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2112.09332)]\n\n**BERT-kNN：在预训练语言模型中加入 kNN 检索组件以提升问答性能**  \n*诺拉·卡斯纳、欣里希·舒策*  \nEMNLP 2020 – 2020年11月 [[论文](https:\u002F\u002Faclanthology.org\u002F2020.findings-emnlp.307.pdf)]\n\n**REALM：检索增强型语言模型预训练**  \n*凯尔文·古、肯顿·李、佐拉·通、帕努蓬·帕苏帕特、明伟·张*  \nICML 2020 – 2020年7月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2002.08909)]\n\n**一种混合检索-生成神经对话模型**  \n*刘洋、胡俊杰、邱明辉、曲晨、高建峰、W. 布鲁斯·克罗夫特、刘晓东、沈叶龙、刘静静*  \narXiv – 2019年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F1904.09068)]\n\n### 大型語言模型的記憶操控\n\n> 基於推理時的內部模型權重\n\n**大型語言模型在預訓練過程中如何獲取事實知識？**  \n*Hoyeon Chang、Jinho Park、Seonghyeon Ye、Sohee Yang、Youngkyung Seo、Du-Seong Chang、Minjoon Seo*  \narXiv – 2024年6月 [[論文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2406.11813)]\n\n**針對事實性微調語言模型**  \n*Katherine Tian、Eric Mitchell、Huaxiu Yao、Christopher D. Manning、Chelsea Finn*  \narXiv – 2023年11月 [[論文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.08401)]\n\n**R-Tuning：教導大型語言模型拒絕回答未知問題**  \n*Hanning Zhang、Shizhe Diao、Yong Lin、Yi R. Fung、Qing Lian、Xingyao Wang、Yangyi Chen、Heng Ji、Tong Zhang*  \narXiv – 2023年11月 [[論文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.09677)]\n\n**EasyEdit：一個易於使用的大型語言模型知識編輯框架**  \n*Peng Wang、Ningyu Zhang、Xin Xie、Yunzhi Yao、Bozhong Tian、Mengru Wang、Zekun Xi、Siyuan Cheng、Kangwei Liu、Guozhou Zheng、Huajun Chen*  \narXiv – 2023年8月 [[論文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2308.07269.pdf)]\n\n**檢視與編輯語言模型中的知識表徵**  \n*Evan Hernandez、Belinda Z. Li、Jacob Andreas*  \narXiv – 2023年4月 [[論文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.00740)] [[程式碼](https:\u002F\u002Fgithub.com\u002Fevandez\u002FREMEDI)]\n\n**利用生成式模型進行段落檢索，用於開放領域問答系統**  \n*Gautier Izacard、Edouard Grave*  \narXiv – 2023年2月 [[論文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2007.01282.pdf)]\n\n**無監督地發現語言模型中的隱藏知識**  \n*Collin Burns、Haotian Ye、Dan Klein、Jacob Steinhardt*  \nICLR 2023 – 2023年2月 [[論文](https:\u002F\u002Fopenreview.net\u002Fpdf?id=ETKGuby0hcs)] [[程式碼](https:\u002F\u002Fgithub.com\u002Fcollin-burns\u002Fdiscovering_latent_knowledge)]\n\n\u003Ca name=\"paper-galactica\">\u003C\u002Fa>\n**Galactica：一款面向科學領域的大型語言模型**  \n*Ross Taylor、Marcin Kardas、Guillem Cucurull、\nThomas Scialom、Anthony Hartshorn、Elvis Saravia、\nAndrew Poulton、Viktor Kerkez、Robert Stojnic*  \nGalactica.org – 2022年 [[論文](https:\u002F\u002Fgalactica.org\u002Fstatic\u002Fpaper.pdf)]\n\n\u003Ca name=\"paper-blenderbot\">\u003C\u002Fa>\n**BlenderBot 3：一款持續學習並以負責任方式互動的已部署對話代理**  \n*Kurt Shuster、Jing Xu、Mojtaba Komeili、Da Ju、Eric Michael Smith、Stephen Roller、Megan Ung、Moya Chen、Kushal Arora、Joshua Lane、Morteza Behrooz、William Ngan、Spencer Poff、Naman Goyal、Arthur Szlam、Y-Lan Boureau、Melanie Kambadur、Jason Weston*  \narXiv – 2022年8月 [[論文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.03188)]\n\n**生成而非檢索：大型語言模型是強大的上下文生成器**  \n*Wenhao Yu、Dan Iter、Shuohang Wang、Yichong Xu、Mingxuan Ju、Soumya Sanyal、Chenguang Zhu、Michael Zeng、Meng Jiang*  \nICLR 2023 – 2022年9月 [[論文](https:\u002F\u002Fopenreview.net\u002Fforum?id=fB0hRu9GZUS)]\n\n**背誦增強型語言模型**  \n*Zhiqing Sun、Xuezhi Wang、Yi Tay、Yiming Yang、Denny Zhou*  \nICLR 2023 – 2022年9月 [[論文](https:\u002F\u002Fopenreview.net\u002Fforum?id=-cqvvvb-NkI)]\n\n\u003Ca name=\"paper-sparrow\">\u003C\u002Fa>\n**通過目標明確的人類判斷改進對話代理的一致性**  \n*Amelia Glaese、Nat McAleese、Maja Trębacz、John Aslanides、Vlad Firoiu、Timo Ewalds、Maribeth Rauh、Laura Weidinger、Martin Chadwick、Phoebe Thacker、Lucy Campbell-Gillingham、Jonathan Uesato、Po-Sen Huang、Ramona Comanescu、Fan Yang、Abigail See、Sumanth Dathathri、Rory Greig、Charlie Chen、Doug Fritz、Jaume Sanchez Elias、Richard Green、Soňa Mokrá、Nicholas Fernando、Boxi Wu、Rachel Foley、Susannah Young、Iason Gabriel、William Isaac、John Mellor、Demis Hassabis、Koray Kavukcuoglu、Lisa Anne Hendricks、Geoffrey Irving*  \narXiv – 2022年9月 [[論文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2209.14375.pdf)]\n\n**LaMDA：用於對話應用的語言模型**  \n*Romal Thoppilan、Daniel De Freitas、Jamie Hall、Noam Shazeer、Apoorv Kulshreshtha、Heng-Tze Cheng、Alicia Jin、Taylor Bos、Leslie Baker、Yu Du、YaGuang Li、Hongrae Lee、Huaixiu Steven Zheng、Amin Ghafouri、Marcelo Menegali、Yanping Huang、Maxim Krikun、Dmitry Lepikhin、James Qin、Dehao Chen、Yuanzhong Xu、Zhifeng Chen、Adam Roberts、Maarten Bosma、Vincent Zhao、Yanqi Zhou、Chung-Ching Chang、Igor Krivokon、Will Rusch、Marc Pickett、Pranesh Srinivasan、Laichee Man、Kathleen Meier-Hellstern、Meredith Ringel Morris、Tulsee Doshi、Renelito Delos Santos、Toju Duke、Johnny Soraker、Ben Zevenbergen、Vinodkumar Prabhakaran、Mark Diaz、Ben Hutchinson、Kristen Olson、Alejandra Molina、Erin Hoffman-John、Josh Lee、Lora Aroyo、Ravi Rajakumar、Alena Butryna、Matthew Lamm、Viktoriya Kuzmina、Joe Fenton、Aaron Cohen、Rachel Bernstein、Ray Kurzweil、Blaise Aguera-Arcas、Claire Cui、Marian Croak、Ed Chi、Quoc Le*  \narXiv – 2022年1月 [[論文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2201.08239)]\n\n**語言模型作為或用作知識庫**  \n*Simon Razniewski、Andrew Yates、Nora Kassner、Gerhard Weikum*  \nDL4KG 2021 – 2021年10月 [[論文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2110.04888.pdf)]\n\n**通過記憶實現泛化：最近鄰語言模型**  \n*Urvashi Khandelwal、Omer Levy、Dan Jurafsky、Luke Zettlemoyer、Mike Lewis*  \nICLR 2020 – 2019年9月 [[論文](https:\u002F\u002Fopenreview.net\u002Fforum?id=HklBjCEKvH)] [[程式碼](https:\u002F\u002Fgithub.com\u002Furvashik\u002Fknnlm)]\n\n### 重新排序\n\n**ChatGPT擅長搜尋嗎？探究大型語言模型作為重新排序代理的可能性**  \n*Wenhao Yu、Hongming Zhang、Xiaoman Pan、Kaixin Ma、Hongwei Wang、Dong Yu*  \narXiv – 2023年11月 [[論文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.09210)]\n\n**指令蒸餾使大型語言模型成為高效的零樣本排序器**  \n*Weiwei Sun、Zheng Chen、Xinyu Ma、Lingyong Yan、Shuaiqiang Wang、Pengjie Ren、Zhumin Chen、Dawei Yin、Zhaochun Ren*  \narXiv 2023 – 2023年11月 [[論文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2311.01555)]\n\n### 自我修正\n\n**评论者：大型语言模型可通过工具交互式批评实现自我修正**  \n*苟志斌、邵志宏、龚叶云、沈业龙、杨宇久、段楠、陈伟柱*  \nICLR 2024 – 2024年1月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=Sx038qxjek)]\n\n**防微杜渐：通过验证低置信度生成来检测并缓解大语言模型的幻觉问题**  \n*尼拉杰·瓦尔什尼、姚文林、张洪明、陈建树、于东*  \narXiv – 2023年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.06983)]\n\n**RARR：利用语言模型研究并修订语言模型所说的内容**  \n*高路宇、戴竹韵、帕苏帕特、陈安东尼、查甘蒂、范一成、赵文森、劳妮、李洪莱、胡大成、郭凯文*  \nACL 2023 – 2023年7月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.acl-long.910\u002F)]\n\n**验证与编辑：一种知识增强型思维链框架**  \n*赵若晨、李兴轩、乔蒂、秦成伟、冰立东*  \nACL 2023 – 2023年7月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.acl-long.320\u002F)]\n\n**主动检索增强生成**  \n*蒋正宝、徐弗兰克·F、高路宇、孙志恒、刘倩、德维迪-余简、杨一鸣、卡伦·杰米、纽比格·格雷厄姆*  \narXiv – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.06983)] [[代码](https:\u002F\u002Fgithub.com\u002Fjzbjyb\u002FFLARE)]\n\n**通过即插即用式检索反馈改进语言模型**  \n*于文浩、张志瀚、梁振文、江萌、萨巴瓦尔·阿希什*  \narXiv – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.14002)]\n\n### 事实不确定性估计\n\n**长文本生成的语言学校准**  \n*尼尔·班德、李雪晨、马腾宇、桥本达津纪*  \narXiv 2024 – 2024年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2404.00474)]\n\n**相信还是不相信你的大语言模型？**  \n*亚辛·阿巴西·亚德科里、库兹博尔斯基·伊利亚、乔治·安德拉什、塞佩斯瓦里·查巴*  \narXiv 2024 – 2024年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2406.02543)]\n\n**SaySelf：通过自我反思性理由教导大语言模型表达置信度**  \n*许天阳、吴淑瑾、刁世哲、刘晓泽、王星耀、陈洋毅、高静*  \narXiv 2024 – 2024年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.20974)]\n\n**专家不会作弊：通过预测配对来学习自己不知道的事情**  \n*约翰逊·丹尼尔·D、塔洛·丹尼尔、杜文诺德·大卫、麦迪逊·克里斯·J*  \narXiv 2024 – 2024年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2402.08733.pdf)]\n\n### 约束生成\n\n**解锁预见性文本生成：一种用于大型语言模型忠实解码的约束方法**  \n*匿名*  \nICLR 24 – 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=774elYc5tw)]\n\n**DoLa：通过对比层解码提升大型语言模型的事实准确性**  \n*庄永生、谢宇嘉、罗鸿音、金润、詹姆斯·格拉斯、何鹏程*  \nICLR 24 – 2023年9月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2309.03883)]\n\n### 数据为中心\n\n**以数据为中心的方法：利用大型语言模型生成忠实且高质量的患者摘要**  \n*赫格塞尔曼·斯特凡、沈香江·香农、吉尔瑟·弗洛里安、阿格拉瓦尔·莫妮卡、松塔格·大卫、姜晓艺*  \narXiv 24 – 2024年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2402.15422.pdf)]\n\n### 效用最大化\n\n**随机RAG：通过期望效用最大化实现端到端的检索增强生成**  \n*扎马尼·哈迈德、本德斯基·迈克尔*  \narXiv 24 – 2024年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2405.02816)]\n\n\u003Ca name=\"paper-constiutional-ai\">\u003C\u002Fa>\n**宪章式AI：来自AI反馈的无害性**  \n*白云涛、卡达瓦特·索拉夫、昆杜·桑迪潘、阿斯克尔·阿曼达、科尔尼恩·杰克逊、琼斯·安迪、陈安娜、戈尔迪·安娜、米尔霍赛尼·阿扎莉娅、麦金农·卡梅隆、陈卡罗尔、奥尔森·凯瑟琳、奥拉·克里斯托弗、埃尔南德斯·丹尼、德雷恩·道恩、冈古利·迪普、李达斯汀、特兰-约翰逊·伊莱、佩雷斯·伊桑、克尔·杰米、穆勒·贾雷德、拉迪什·杰弗里、兰道·约书亚、恩多斯·卡马尔、卢科修特·卡米莱、洛维特·莉安、塞利托·迈克尔、埃尔哈吉·尼尔森、谢弗·尼古拉斯、梅尔卡多·诺埃米、达斯萨尔玛·诺娃、拉斯恩比·罗伯特、拉尔森·罗宾、林格·萨姆、约翰斯顿·斯科特、克拉韦克·绍娜、肖克·希尔、福尔特·斯坦尼斯拉夫、兰汉姆·塔梅拉、泰伦·特利恩-劳顿、康纳利·汤姆、亨尼根·汤姆、休姆·特里斯坦、鲍曼·塞缪尔·R、哈特菲尔德-多兹·扎克、曼·本、阿莫迪·达里奥、约瑟夫·尼古拉斯、麦坎德利什·萨姆、布朗·汤姆、卡普兰·贾雷德*  \nAnthropic.com – 2022年12月 [[论文](https:\u002F\u002Fwww.anthropic.com\u002Fconstitutional.pdf)]\n\n\u003Ca name=\"paper-blenderbot-hf\">\u003C\u002Fa>\n**部署后学习新技能：通过人类反馈改进开放域互联网驱动的对话系统**  \n*徐静、昂格·梅根、科梅伊利·莫杰塔巴、阿拉·库沙尔、布罗·尤-兰、韦斯顿·杰森*  \narXiv – 2022年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.03270)]\n\n### 多模态\n\n**检索增强型多模态语言建模**  \n*安永·三弘、阿加贾尼扬·阿尔门、施伟佳、詹姆斯·里奇、莱斯科维茨·朱雷、梁珀西、刘易斯·迈克、泽特勒莫耶尔·卢克、伊吾·温涛*  \narXiv – 2022年11月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2211.12561.pdf)]\n\n**RAMM：通过多模态预训练实现检索增强型生物医学视觉问答**  \n*袁征、金巧、谭传琦、赵郑云、袁洪义、黄飞、黄宋芳*  \narXiv – 2023年3月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.00534)]\n\n### 提示工程\n\n**将检索与思维链推理交织用于知识密集型多步问题**  \n*特里维迪·哈什、巴拉苏布拉马尼安·尼兰詹、科特·图沙尔和萨巴瓦尔·阿希什*  \nACL 23 – 2023年7月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.acl-long.557.pdf)]\n\n**ReAct：在语言模型中协同推理与行动**  \n*姚顺宇、赵杰弗里、俞典、杜楠、沙夫兰·伊扎克、纳拉西曼·卡尔提克、曹元*  \narXiv – 2022年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.03629)]\n\n### 生成代码\n\n**RepoCoder：通过迭代式检索与生成实现仓库级代码补全**  \n*张峰基、陈贝、张悦、刘进、赞道光、毛毅、楼建广、陈伟柱*  \narXiv – 2023年3月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2303.12570.pdf)]\n\n**DocPrompting：通过检索文档生成代码**  \n*周舒燕、阿隆·乌里、徐弗兰克·F、王志若、蒋正宝、纽比格·格雷厄姆*  \nICLR 23 – 2022年7月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2207.05987)] [[代码](https:\u002F\u002Fgithub.com\u002Fshuyanzhou\u002Fdocprompting)] [[数据](https:\u002F\u002Fgithub.com\u002Fshuyanzhou\u002Fdocprompting#data)]\n\n### 查询生成\n\n**面向检索器的广义强化学习：基于非结构化真实世界文档的查询改写**  \n*Cha Sungguk、Kim DongWook、Hahn Taeseung、Kim Mintae、Han Youngsub、Jeon Byoung-Ki*  \narXiv — 2025年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2507.23242)]\n\n**生成、过滤与融合：通过多步关键词生成实现零样本神经排序器的查询扩展**  \n*Li Minghan、Zhuang Honglei、Hui Kai、Qin Zhen、Lin Jimmy、Jagerman Rolf、Wang Xuanhui、Bendersky Michael*  \narXiv — 2023年11月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2311.09175.pdf)]\n\n**Agent4Ranking：基于多智能体大模型的个性化查询改写实现语义鲁棒排序**  \n*Li Xiaopeng、Su Lixin、Jia Pengyue、Zhao Xiangyu、Cheng Suqi、Wang Junfeng、Yin Dawei*  \narXiv — 2023年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2209.05861)]\n\n**统一的生成式与密集型检索用于赞助搜索中的查询改写**  \n*Mohankumar Akash Kumar、Dodla Bhargav、K Gururaj、Singh Amit*  \narXiv — 2022年9月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2209.05861)]\n\n\n### 摘要与文档改写\n\n**生成事实一致的体育赛事集锦解说**  \n*Sarfati Noah、Yerushalmy Ido、Chertok Michael、Keller Yosi*  \nMMSports 2023 — 2023年10月 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.1145\u002F3606038.3616157)]\n\n**遗传生成式信息检索**  \n*Kulkarni Hrishikesh、Young Zachary、Goharian Nazli、Frieder Ophir、MacAvaney Sean*  \nDocEng 23 — 2023年8月 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002Fpdf\u002F10.1145\u002F3573128.3609340)]\n\n**基于人类反馈的摘要生成学习**  \n*Stiennon Nisan、Ouyang Long、Wu Jeff、Ziegler Daniel M.、Lowe Ryan、Voss Chelsea、Radford Alec、Amodei Dario、Christiano Paul*  \nNeurIPS 2020 — 2020年9月 [[论文](https:\u002F\u002Fproceedings.neurips.cc\u002Fpaper\u002F2020\u002Ffile\u002F1f89885d556929e98d3ef9b86448f951-Paper.pdf)]\n\n**关于抽象式摘要中的忠实性与事实性**  \n*Maynez Joshua、Narayan Shashi、Bohnet Bernd、McDonald Ryan*  \nACL 2020 — 2020年5月 [[论文](https:\u002F\u002Faclanthology.org\u002F2020.acl-main.173.pdf)]\n\n### 表格问答\n\n**先增强再尝试：基于表格扩展的知识增强型表格问答**  \n*Liu Yujian、Ji Jiabao、Yu Tong、Rossi Ryan、Kim Sungchul、Zhao Handong、Sinha Ritwik、Zhang Yang、Chang Shiyu*  \narXiv — 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.15555.pdf)]\n\n## 生成式文档检索\n\n我们通过复用 [awesome-generative-retrieval-models](https:\u002F\u002Fgithub.com\u002FChriskuei\u002Fawesome-generative-retrieval-models) 的内容来启动本节，并在此向 [Chriskuei](https:\u002F\u002Fgithub.com\u002FChriskuei) 致以充分的感谢！目前我们又在此基础上补充了一些内容。\n\n### 生成文档ID作为标识符\n\n**面向生成式信息检索的轻量级直接文档相关性优化**  \n*基迪斯特·阿姆德·梅科嫩、唐宇宝、马尔滕·德·赖克*  \nSIGIR 2025 – 2025年7月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2504.05181)] [[代码](https:\u002F\u002Fgithub.com\u002Fkidist-amde\u002Fddro)]\n\n**生成式检索中的前瞻规划：通过同步解码引导自回归生成**  \n*韩斯·曾、罗晨、哈迈德·扎马尼*  \narXiv – 2024年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2404.14600.pdf)] [[代码](https:\u002F\u002Fgithub.com\u002FHansiZeng\u002FPAG)]\n\n**面向生成式文档检索的瓶颈最小化索引**  \n*杜鑫、修立新、田中久美子*  \nICML 2024 口头报告 – 2024年7月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2405.10974)] [[代码](https:\u002F\u002Fgithub.com\u002Fkduxin\u002FBottleneck-Minimal-Indexing)]\n\n**NOVO：基于模型的IR中可学习且可解释的文档标识符**  \n*王子涵、周雨佳、涂一腾、窦志成*  \nCIKM 2023 – 2023年10月 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.1145\u002F3583780.3614993)]\n\n**De-DSI：去中心化的可微分搜索索引**  \n*佩特鲁·内阿格、马塞尔·格雷戈里亚迪斯、约翰·普韦尔斯*  \nEuroMLSys 24 – 2024年4月 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002Fpdf\u002F10.1145\u002F3642970.3655837)]\n\n**基于序列学习过程的列表式生成式检索模型**  \n*唐宇宝、张汝清、郭嘉峰、马尔滕·德·赖克、陈伟、程雪琪*  \nTOIS 2024 – 2024年3月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2403.12499v1)]\n\n**蒸馏增强型生成式检索**  \n*李永奇、张振、王文杰、聂利强、李文杰、蔡达生*  \narXiv 2024 – 2024年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2402.10769)]\n\n**自检索：用一个大型语言模型构建信息检索系统**  \n*唐巧玉、陈家伟、于博文、陆耀杰、傅成、于海阳、林宏宇、黄飞、何奔、韩先培、孙乐、李勇斌*  \narXiv 2024 – 2024年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2403.00801)]\n\n**生成式密集检索：内存可能成为负担**  \n*袁培文、王兴林、冯绍雄、潘博远、李毅威、王赫达、缪旭鹏、李侃*  \nEACL 2024 – 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2401.10487)] [[代码](https:\u002F\u002Fgithub.com\u002Fypw0102\u002FGDR)]\n\n**端到端文档检索的自动搜索索引器**  \n*杨天驰、宋明辉、张子涵、黄海珍、邓伟伟、孙峰、张琪*  \nEMNLP 2023 – 2023年12月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.findings-emnlp.464.pdf)]\n\n**DiffusionRet：使用约束解码的扩散增强型生成式检索器**  \n*乔善宝、刘学兵、罗承勋*  \nEMNLP Findings 2023 – 2023年12月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.findings-emnlp.638.pdf)]\n\n**可扩展且高效的生成式信息检索**  \n*韩斯·曾、罗晨、金博文、谢赫·穆罕默德·萨尔瓦尔、魏天欣、哈迈德·扎马尼*  \nWWW 2024 – 2023年11月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2311.09134)] [[代码](https:\u002F\u002Fgithub.com\u002FHansiZeng\u002FRIPOR)]\n\n**生成式检索中的非参数解码**  \n*李贤智、金在英、昌浩妍、吴汉锡、梁素熙、弗拉基米尔·卡尔普金、陆义、徐敏俊*  \nACL Findings 2023 – 2023年7月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.findings-acl.801.pdf)]\n\n**模型增强型向量索引**  \n*张海林、王玉静、陈琪、常瑞恒、张婷、苗子明、侯颖燕、丁洋、缪旭鹏、王浩楠、庞博臣、詹岳峰、孙浩、邓伟伟、张琪、杨帆、谢星、杨茂、崔彬*  \nNeurIPS 2023 – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2309.13335)] [[代码](https:\u002F\u002Fgithub.com\u002FHugoZHL\u002FMEVI)]\n\n**生成式检索中的排序学习**  \n*李永奇、杨楠、王亮、魏福儒、李文杰*  \narXiv – 2023年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.15222)]\n\n**大型语言模型本身就是内置的自回归搜索引擎**  \n*诺亚·齐姆斯、于文豪、张志瀚、蒋萌*  \nACL Findings 2023 – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.09612)]\n\n**多视角标识符增强的生成式检索**  \n*李永奇、杨楠、王亮、魏福儒、李文杰*  \nACL 2023 – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.16675)]\n\n**生成式检索如何扩展到数百万段落？**  \n*罗纳克·普拉迪普、凯·辉、贾伊·古普塔、亚当·D·莱尔克斯、庄洪磊、吉米·林、唐纳德·梅茨勒、阮庆川*  \narXiv – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.11841)]\n\n**TOME：一种基于模型的两阶段检索方法**  \n*任睿阳、赵维恩、刘静、吴华、温继荣、王海峰*  \nACL 2023 – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.11161)]\n\n**理解用于文本检索的可微分搜索索引**  \n*陈晓阳、刘延江、何奔、孙乐、孙英菲*  \nACL Findings 2023 – 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.02073)]\n\n**生成式检索中的分词学习**  \n*孙伟伟、严凌勇、陈正、王帅强、朱海超、任鹏杰、陈柱民、尹大伟、马尔滕·德·赖克、任兆春*  \narXiv – 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.04171)]\n\n**DynamicRetriever：一款无需显式索引的预训练模型IR系统**  \n*周雨佳、姚静、窦志成、吴乐德、温继荣*  \n机器智能研究 – 2023年1月 [[论文](https:\u002F\u002Flink.springer.com\u002Farticle\u002F10.1007\u002Fs11633-022-1373-9)]\n\n**CodeDSI：可微分的代码搜索**  \n*乌萨马·纳迪姆、诺亚·齐姆斯、吴绍恩*  \narXiv – 2022年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.00328)]\n\n**情境化生成式检索**  \n*李贤智、金在英、昌浩妍、吴汉锡、梁素熙、卡尔普金、陆义、徐敏俊*  \narXiv – 2022年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2210.02068.pdf)]\n\n**Transformer记忆作为可微分搜索索引**  \n*易泰、阮庆川、莫斯塔法·德赫加尼、倪建模、巴赫里、梅塔、秦震、凯·辉、赵哲、贾伊·古普塔、塔尔·舒斯特、威廉·W·科恩、唐纳德·梅茨勒*  \nNeurIPS 2022 – 2022年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=Vu-B0clPfq)] [[视频](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=qlB0TPBQ7YY)] [[第三方代码](https:\u002F\u002Fgithub.com\u002FArvinZhuang\u002FDSI-transformers)]\n\n**用于文档检索的神经语料库索引器**  \n*王某等人*  \nArxiv 2022 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.02743)]\n\n**通过查询生成弥合可微分搜索索引中索引与检索之间的鸿沟**  \n*庄圣尧、任厚兴、寿林军、裴健、龚明、祖孔和姜大新*  \nArxiv 2022 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.10128)] [[代码](https:\u002F\u002Fgithub.com\u002FArvinZhuang\u002FDSI-transformers)]\n\n**DynamicRetriever：一款既无稀疏索引也无稠密索引的预训练模型IR系统**  \n*周某等人*  \nArxiv 2022 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2203.00537.pdf)]\n\n**Ultron：基于模型索引器的终极语料库检索器**  \n*周某等人*  \nArxiv 2022 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2208.09257.pdf)]\n\n### 生成一个字符串作为标识符\n\n**面向生成式信息检索的轻量级直接文档相关性优化**  \n*基迪斯特·阿姆德·梅科嫩、唐宇宝、马尔滕·德·赖克*  \narXiv — 2025年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2504.05181)] [[代码](https:\u002F\u002Fgithub.com\u002Fkidist-amde\u002Fddro)]\n\n**生成式检索中的前瞻规划：通过同步解码引导自回归生成**  \n*韩斯·曾、罗晨、哈迈德·扎马尼*  \narXiv — 2024年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2404.14600.pdf)] [[代码](https:\u002F\u002Fgithub.com\u002FHansiZeng\u002FPAG)]\n\n**将生成式检索视为多向量密集检索**  \n*吴世光、魏文达、张梦琪、陈志民、马俊、任兆春、马尔滕·德·赖克、任鹏杰*  \nSIGIR 2024 — 2024年3月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.00684)] [[代码](https:\u002F\u002Fgithub.com\u002FFuryton\u002FGR-as-MVDR)]\n\n**Re3val：强化与重排序的生成式检索**  \n*宋义律、金相烈、李海珠、金俊基、詹姆斯·索恩*  \nEACL Findings 2023 — 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.16979.pdf)]\n\n**GLEN：基于词汇索引学习的生成式检索**  \n*李善京、崔敏珍、李钟旭*  \nEMNLP 2023 — 2023年12月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.emnlp-main.477\u002F)] [[代码](https:\u002F\u002Fgithub.com\u002Fskleee\u002FGLEN)]\n\n**利用相关性反馈的强化学习提升生成式检索**  \n*周雨佳、窦志成、温继荣*  \nEMNLP 2023 — 2023年12月 [[论文](https:\u002F\u002Faclanthology.org\u002F2023.emnlp-main.768.pdf)]\n\n**NOVO：用于模型驱动信息检索的可学习且可解释的文档标识符**  \n*王子涵、周雨佳、涂一腾、窦志成*  \nCIKM 2023 — 2023年10月 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.1145\u002F3583780.3614993)]\n\n**基于大型语言模型的生成式检索**  \n*匿名*  \nICLR 24 — 2023年10月 [[论文](https:\u002F\u002Fopenreview.net\u002Fforum?id=oXYZJXDdo7)]\n\n**受学习策略启发的语义增强型可微搜索索引**  \n*唐宇宝、张如清、郭家峰、陈江贵、朱作伟、王帅强、尹大伟、程雪琪*  \nKDD 2023 — 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.15115)]\n\n**词集可作为自回归搜索引擎的强大文档标识符**  \n*张培田、刘正、周雨佳、窦志成、曹赵*  \narXiv — 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.13859)] [[代码](https:\u002F\u002Fgithub.com\u002Fnamespace-Pt\u002FAdon\u002Ftree\u002FAutoTSG)]\n\n**通过提示学习构建面向知识密集型语言任务的统一生成式检索器**  \n*陈江贵、张如清、郭家峰、马尔滕·德·赖克、刘益群、范一星、程雪琪*  \nSIGIR 2023 — 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.14856)] [[代码](https:\u002F\u002Fgithub.com\u002Fict-bigdatalab\u002FUGR)]\n\n**CorpusBrain：为知识密集型语言任务预训练生成式检索模型**  \n*陈江贵、张如清、郭家峰、刘益群、范一星、程雪琪*  \nCIKM 2022 — 2022年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.07652)] [[代码](https:\u002F\u002Fgithub.com\u002Fict-bigdatalab\u002FCorpusBrain)]\n\n**自回归搜索引擎：以子字符串作为文档标识符**  \n*米凯莱·贝维拉夸、朱塞佩·奥塔维亚诺、帕特里克·刘易斯、伊藤文太、塞巴斯蒂安·里德尔、法比奥·佩特罗尼*  \narXiv — 2022年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2204.10628.pdf)] [[代码](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002FSEAL)]\n\n**自回归实体检索**  \n*尼古拉·德·考、高提耶·伊扎卡尔、塞巴斯蒂安·里德尔、法比奥·佩特罗尼*  \nICLR 2021 — 2020年10月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2010.00904.pdf)] [[代码](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002FGENRE)]\n\n### 生成式检索的持续学习\n\n**CLEVER：面向动态语料库的生成式检索持续学习框架**  \n*陈江贵、张如清、郭家峰、马尔滕·德·赖克、陈伟、范一星、程雪琪*  \nCIKM 2023 — 2023年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.14968)]\n\n**DSI++：用新文档更新Transformer记忆**  \n*桑凯特·瓦伊巴夫·梅塔、贾伊·古普塔、泰奕、穆斯塔法·德赫加尼、阮文奇、饶金凤、马克·纳约克、艾玛·斯特鲁贝尔、唐纳德·梅茨勒*  \narXiv — 2022年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.09744)]\n\n**IncDSI：可增量更新的文档检索系统**  \n*瓦尔莎·基肖尔、万超、贾斯汀·洛夫莱斯、约阿夫·阿策、基利安·Q·温伯格*  \nICML'23 — 2023年7月 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.5555\u002F3618408.3619112)]\n\n**探索生成式检索在动态语料库上的实用性**  \n*金彩恩、尹素英、李贤智、张乔尔、杨昭熙、徐珉俊*  \nEMNLP 24 — 2024年11月 [[论文](https:\u002F\u002Faclanthology.org\u002F2024.emnlp-main.755\u002F)]\n\n**对动态语料库上生成式检索的复现与探索**  \n*张振、马欣宇、孙伟伟、任鹏杰、陈志民、王帅强、尹大伟、马尔滕·德·赖克、任兆春*  \nSIGIR 2025 — 2025年7月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2504.17519)]\n\n**CorpusBrain++：面向知识密集型语言任务的持续生成式预训练框架**  \n*郭家峰、周昌江、张如清、陈江贵、马尔滕·德·赖克、范一星、程雪琪*  \narXiv — 2024年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2402.16767)]\n\n### 应用\n\n**面向事实核查的数据高效自回归文档检索**  \n*詹姆斯·索恩*  \nSustaiNLP@EMNLP 2022 — 2022年11月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.09388)]\n\n**GERE：面向事实核查的生成式证据检索**  \n*陈江贵、张如清、郭家峰、范一星、程雪琪*  \nSIGIR 2022 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002Fpdf\u002F10.1145\u002F3477495.3531827)] [[代码](https:\u002F\u002Fgithub.com\u002FChriskuei\u002FGERE)]\n\n**生成式多跳检索**  \n*李贤智、杨昭熙、吴汉锡、徐珉俊*  \narXiv — 2022年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2312.15450.pdf)]\n\n## 生成式推荐\n\n**利用未登录词提升大语言模型的推荐性能**  \n*黄廷基、杨嘉琪、沈春旭、刘凯奇、詹德川、叶汉嘉*  \narXiv — 2024年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2406.08477)]\n\n**用于序列化推荐的插件式扩散模型**  \n*马浩凯、谢若冰、孟磊、陈鑫、张旭、林乐宇、康展辉*  \narXiv — 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.02913.pdf)]\n\n**面向协同过滤的图感知扩散建模**  \n*朱云琴¹、王超、熊辉*  \narXiv — 2023年11月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2311.08744.pdf)]\n\n**RecMind：由大语言模型驱动的推荐代理**  \n*王延成、蒋子言、陈铮、杨帆、周颖雪、曹恩雅、范星、黄晓江、陆彦斌、杨英振*  \narXiv — 2023年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.14296)]\n\n**ChatGPT对推荐公平吗？评估大语言模型推荐中的公平性**  \n*张继志、鲍克勤、张洋、王文杰、冯福丽、何向南*  \nRecsys 2023 — 2023年7月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2305.07609v2.pdf)]\n\n**RecFusion：一种用于推荐的1D数据二项式扩散过程**  \n*加布里埃尔·贝内迪克特、奥利维埃·热南、萨穆埃莱·帕帕、萨马尔特·巴尔加夫、达安·奥迪克、马尔滕·德·赖克*  \narXiv — 2023年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.08947)]\n\n**LLM驱动的生成式新闻推荐初探**  \n*刘绮琼、陈诺、酒井哲也、吴小明*  \narXiv — 2023年6月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2305.06566.pdf)]\n\n**大语言模型作为零样本对话式推荐系统**  \n*侯宇鹏、张俊杰、林子涵、陆洪宇、谢若冰、朱利安·麦考利、赵新伟*  \narXiv — 2023年5月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2308.10053.pdf)]\n\n**DiffuRec：一种用于序列化推荐的扩散模型**  \n*李子豪、孙爱欣、李晨亮*  \narXiv — 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.00686)]\n\n**扩散推荐模型**  \n*王文杰、许怡燕、冯福丽、林欣宇、何向南、蔡盛松*  \nSIGIR 2023 — 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.04971)]\n\n**用于协同过滤的模糊-锐化过程模型**  \n*崔正焕、洪书英、朴能成、赵成培*  \nSIGIR 2023 — 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.09324)] [[代码](https:\u002F\u002Fgithub.com\u002Fjeongwhanchoi\u002FBSPM)]\n\n**基于生成式检索的推荐系统**  \n*沙尚克·拉杰普特、尼基尔·梅塔、阿尼玛·辛格、拉古南丹·凯沙万、武中、卢卡什·赫尔特、洪立灿、泰伊、阮庆全、乔纳·萨莫斯、马切伊·库拉、埃德·H·奇、马赫斯瓦兰·萨蒂亚莫西*  \n非会议论文 — 2023年3月 [[论文](https:\u002F\u002Fshashankrajput.github.io\u002FGenerative.pdf)]\n\n**预训练、提示与推荐：推荐系统中语言建模范式的全面综述**  \n*刘鹏、张乐美、Jon Atle Gulla*  \narXiv — 2023年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.03735)]\n\n**基于强化学习的生成式列表推荐**  \n*罗曼·德法耶、蒂博·托内、让-米歇尔·朗德尔以及马尔滕·德·赖克*  \nWSDM 2023 — 2023年2月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.08632)]\n\n**基于协同扩散生成模型的推荐**  \n*沃克·朱乔、钟婷、张凤丽、高强、周凡*  \nKSEM 2022 — 2022年8月 [[论文](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002Fabs\u002F10.1007\u002F978-3-031-10989-8_47)]\n\n## 生成式知识图谱\n\n**什么会破坏基于知识图谱的RAG？关于不完全知识下推理的实证见解**  \n*周东卓然、朱玉成、王霞霞、周宏宽、何源、陈娇艳、施特芬·斯塔布、叶夫根尼·哈拉莫夫*  \narXiv — 2025年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2508.08344)]\n\n**KG-CQR：在知识图谱中利用结构化关系表示进行上下文查询检索**  \n*裴志明、刁玉梅、阮文荣、郑Jason J.J.、裴克怀*  \narXiv — 2025年8月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2508.20417)]\n\n**DocGraphLM：用于信息抽取的文档图语言模型**  \n*王东升、马志强、努尔巴赫什·阿尔米内、顾康、莎米娜·沙赫*  \narXiv — 2024年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2401.02823.pdf)]\n\n**KBFormer：一种用于结构化实体补全的扩散模型**  \n*欧艾尔·基图尼、尼克拉斯·诺尔特、詹姆斯·亨斯曼、巴斯卡尔·米特拉*  \narXiv — 2023年12月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F2312.05253.pdf)]\n\n**从检索到生成：高效且有效的实体集合扩展**  \n*黄淑琳、马世荣、李阳宁、李迎辉、郑海涛、姜勇*  \narXiv — 2023年4月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.03531v1)]\n\n**爬取语言模型的内部知识库**  \n*罗伊·科恩、莫尔·格瓦、乔纳森·伯兰特、阿米尔·格洛伯森*  \narXiv — 2023年1月 [[论文](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.12810)]\n\n**提示调优还是微调——探究预训练语言模型中的关系知识**  \n*莱昂德拉·菲希特尔、扬-克里斯托夫·卡洛、沃尔夫-蒂洛·巴尔克*  \nAKBC 2021 — [[论文](https:\u002F\u002Fopenreview.net\u002Fpdf?id=o7sMlpr9yBW)]\n\n**语言模型能否作为知识库？**  \n*法比奥·佩特罗尼、蒂姆·罗克塔谢尔、帕特里克·刘易斯、安东·巴赫金、吴宇翔、亚历山大·H·米勒、塞巴斯蒂安·里德尔*  \nEMNLP 2019 — 2019年9月 [[论文](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1909.01066.pdf)]\n\n## 实时生成式检索\n\n尽管其中一些项目并未发表论文，但它们对于其他生成式信息检索研究人员在实证研究或界面设计方面仍可能具有参考价值。\n\n⚡\n**Gemini** 2023年12月 [[在线](https:\u002F\u002Fgemini.google.com\u002Fapp️)]  ⚡️\n**factiverse** 2023年6月 [[在线](https:\u002F\u002Feditor.factiverse.ai\u002F)] ⚡️\n**devmarizer** 2023年3月 [[在线](https:\u002F\u002Fdevmarizer.firebaseapp.com\u002F)] ⚡️\n**TaxGenius** 2023年3月 [[在线](https:\u002F\u002Fwww.taxgenius.app\u002F)] ⚡️\n**doc-gpt** 2023年3月 [[在线](https:\u002F\u002Fpineappleexpress808-doc-gpt-doc-gpt-q0823l.streamlit.app\u002F)] ⚡️\n**book-gpt** 2023年2月 [[在线](https:\u002F\u002Fgithub.com\u002Ffraserxu\u002Fbook-gpt)] ⚡️\n**Neeva** 2023年2月 [[在线](https:\u002F\u002Fneeva.com\u002F)] ⚡️\n**Golden Retriever** 2023年2月 [[在线](https:\u002F\u002Fgolden.com\u002Fai)] ⚡️\n**Bing – Prometheus** 2023年2月 [[候补名单](https:\u002F\u002Fwww.bing.com\u002F)] ⚡️\n**Google – Bard** 2023年2月 [仅在部分国家可用] ⚡️\n**Paper QA** 2023年2月 [[代码](https:\u002F\u002Fgithub.com\u002Fwhitead\u002Fpaper-qa)] [[演示](https:\u002F\u002Fhuggingface.co\u002Fspaces\u002Fwhitead\u002Fpaper-qa)] ⚡️\n**DocsGPT** 2023年2月 [[在线](https:\u002F\u002Fdocsgpt.arc53.com\u002F)] [[代码](https:\u002F\u002Fgithub.com\u002Farc53\u002Fdocsgpt)] ⚡️\n**DocAsker** 2023年1月 [[在线](https:\u002F\u002Fwww.docasker.com\u002F)] ⚡️\n**Lexii.ai** 2023年1月 [[在线](https:\u002F\u002Flexii.ai\u002F)] ⚡️\n**YOU.com** 2022年12月 [[在线](https:\u002F\u002Fyou.com\u002F)] ⚡️\n**arXivGPT** 2022年12月 [[Chrome扩展](https:\u002F\u002Fgithub.com\u002FhunkimForks\u002Fchatgpt-arxiv-extension)] ⚡️\n**GPT Index** 2022年11月 [[API](https:\u002F\u002Fgithub.com\u002Fjerryjliu\u002Fgpt_index)] ⚡️\n**BlenderBot** 2022年8月 [[在线（美国）](https:\u002F\u002Fgeo-not-available.blenderbot.ai\u002F)] [[模型权重](https:\u002F\u002Fparl.ai\u002Fdocs\u002Fzoo.html)] [[代码](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002FParlAI\u002Fblob\u002Fmain\u002Fprojects\u002Fbb3\u002Fagents\u002FREADME.md)] [[论文1](#paper-blenderbot)] [[论文2](#paper-blenderbot-hf)] ⚡️\n**PHIND** 日期？[[在线](https:\u002F\u002Fphind.com\u002F)] ⚡️\n**Perplexity** 日期？[[在线](https:\u002F\u002Fwww.perplexity.ai\u002F)] ⚡️\n**Galactica** 日期？[[演示](https:\u002F\u002Fgalactica.org\u002Fexplore\u002F)] [[API](https:\u002F\u002Fgithub.com\u002Fpaperswithcode\u002Fgalai)] [[论文](#paper-galactica)] ⚡️\n**Elicit** 日期？[[在线](https:\u002F\u002Felicit.org\u002F)] ⚡️\n**ZetaAlpha** 日期？[[在线](https:\u002F\u002Fsearch.zeta-alpha.com\u002F)] 使用OpenAI API \n\n---\n\n若只想获取论文标题，可执行 `grep '\\*\\*' README.md | sed 's\u002F\\*\\*\u002F\u002Fg'`","# awesome-generative-information-retrieval 快速上手指南\n\n**项目说明**：`awesome-generative-information-retrieval` 并非一个可直接安装的单一软件库或工具包，而是一个**精选资源列表（Awesome List）**。它汇集了生成式信息检索（Generative IR）领域的论文、数据集、工具代码库、博客文章及评估基准。\n\n本指南旨在帮助开发者如何利用该列表快速定位所需资源，并选取代表性的工具（如 RAG 框架）进行环境搭建和实践。\n\n## 环境准备\n\n由于该列表涵盖多种技术栈（主要是 Python），建议准备以下基础环境：\n\n*   **操作系统**：Linux (Ubuntu\u002FCentOS), macOS 或 Windows (WSL2 推荐)\n*   **Python 版本**：3.9 或更高版本（大多数现代 LLM 工具要求）\n*   **包管理器**：`pip` 或 `conda`\n*   **硬件要求**：\n    *   基础使用：任意现代 CPU，8GB+ 内存\n    *   本地运行大模型\u002F微调：建议配备 NVIDIA GPU (显存 16GB+ 推荐)，需安装 CUDA Toolkit\n*   **前置依赖**：\n    *   Git (用于克隆代码库)\n    *   Hugging Face Account (用于下载部分数据集和模型，建议配置 Token)\n\n## 安装步骤\n\n由于这是一个资源索引，没有统一的安装命令。你需要根据列表中感兴趣的具体工具进行安装。以下是获取该列表及安装列表中两个主流工具（**LlamaIndex** 和 **LangChain**，常用于构建 RAG 系统）的步骤。\n\n### 1. 获取资源列表\n克隆仓库以浏览最新的论文和工具链接：\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fyour-target-repo\u002Fawesome-generative-information-retrieval.git\ncd awesome-generative-information-retrieval\n```\n*(注：请在实际使用时替换为真实的 GitHub 仓库地址)*\n\n### 2. 安装代表性工具 (以 LlamaIndex 为例)\n列表中多次提及 **LlamaIndex** 作为构建生成式检索系统的核心工具。\n\n**使用 pip 安装（推荐国内用户配置镜像源）：**\n```bash\n# 使用清华大学镜像源加速安装\npip install llama-index -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n**安装额外依赖（如需处理 PDF 或使用特定向量库）：**\n```bash\npip install llama-index-vector-stores-chroma llama-index-readers-file -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n*(若选择 LangChain，命令为：`pip install langchain langchain-community -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple`)*\n\n## 基本使用\n\n以下示例展示如何利用列表中推荐的 **RAG (Retrieval Augmented Generation)** 范式，使用 LlamaIndex 构建一个简单的“基于文档的问答”系统。这对应了列表中 *Grounded Answer Generation* 的核心概念。\n\n### 最简单的使用示例\n\n此示例将加载一个本地文本文件，建立索引，并进行查询。\n\n```python\nfrom llama_index.core import SimpleDirectoryReader, VectorStoreIndex, Settings\nfrom llama_index.llms.huggingface import HuggingFaceLLM\n\n# 1. 准备数据\n# 假设当前目录下有一个 data 文件夹，里面包含 .txt 文档\ndocuments = SimpleDirectoryReader(\".\u002Fdata\").load_data()\n\n# 2. 设置模型 (此处以本地轻量模型为例，也可替换为 OpenAI\u002FAzure 等)\n# 注意：首次运行会自动下载模型权重\nSettings.llm = HuggingFaceLLM(model_name=\"Qwen\u002FQwen2-0.5B-Instruct\")\n\n# 3. 构建索引 (生成式检索的核心步骤：将文档转化为向量并存储)\nindex = VectorStoreIndex.from_documents(documents)\n\n# 4. 创建查询引擎\nquery_engine = index.as_query_engine()\n\n# 5. 执行查询 (带引用的生成式回答)\nresponse = query_engine.query(\"请总结文档中关于生成式检索的主要观点是什么？\")\n\nprint(response)\n# 输出将包含基于文档内容的回答，并可配置显示引用来源 (Attribution)\n```\n\n### 进阶方向参考\n根据 `awesome-generative-information-retrieval` 列表，你可以进一步探索以下方向：\n*   **多模态检索**：参考列表中 \"Multimodal RAG pipeline\" 相关博文，结合图像与文本。\n*   **评估优化**：使用列表中提到的 **FACTSCORE** 或 **BRIGHT** 数据集来评估你的生成结果准确性。\n*   **图增强检索**：尝试列表中的 **GraphRAG** (Microsoft) 项目，利用知识图谱提升复杂推理能力。","某医疗科技公司的研发团队正在构建一个面向医生的智能临床辅助系统，需要模型在回答复杂病症咨询时提供精准且可追溯的医学依据。\n\n### 没有 awesome-generative-information-retrieval 时\n- **幻觉风险高**：大模型常凭空捏造不存在的药物剂量或治疗方案，缺乏事实核查机制，可能引发严重医疗事故。\n- **来源不可溯**：生成的建议无法关联到具体的权威医学文献或指南，医生无法验证信息的可靠性，导致信任度低。\n- **检索效率低下**：传统关键词搜索难以理解复杂的临床语境，返回大量无关文档，开发人员需手动编写繁琐规则进行过滤。\n- **更新滞后**：内部知识库更新后，模型无法实时感知最新研究成果，导致回答基于过时的医疗数据。\n\n### 使用 awesome-generative-information-retrieval 后\n- **答案有据可依**：利用“接地答案生成（Grounded Answer Generation）”技术，模型强制基于检索到的真实文献作答，显著消除幻觉。\n- **自动归属引用**：系统能自动生成精确的文献出处（Attribution），每条建议旁均附带来源链接，方便医生快速核验。\n- **语义精准匹配**：借助先进的 RAG 架构和查询重写技术，系统能深刻理解临床意图，直接从海量论文中定位最相关的片段。\n- **动态知识融合**：通过“实时生成检索（Live Generative Retrieval）”能力，模型可即时调用最新发布的医学期刊内容，确保诊疗建议与时俱进。\n\nawesome-generative-information-retrieval 将不可控的聊天机器人转化为严谨的信息检索引擎，从根本上解决了生成式 AI 在专业领域落地的可信度难题。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgabriben_awesome-generative-information-retrieval_01d10afa.png","gabriben","Gabriel Benedict","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fgabriben_f6933928.jpg","@amzn","Madrid","https:\u002F\u002Fgithub.com\u002Fgabriben",721,50,"2026-04-02T09:16:14",1,"","未说明",{"notes":85,"python":83,"dependencies":86},"该仓库是一个资源列表（Awesome List），汇集了关于生成式信息检索（Generative Information Retrieval）的论文、数据集、工具和博客文章，本身不是一个可直接运行的软件工具，因此 README 中未包含具体的操作系统、硬件配置或依赖库安装要求。用户需根据列表中引用的具体子项目（如 GraphRAG, LlamaIndex, TRL 等）查阅其各自的文档以获取运行环境需求。",[],[14,35,13,88,15],"其他",[90,91,92,93,94,95,96],"nlp","ai","chatgpt","deep-learning","information-retrieval","machine-learning","generative-ai","2026-03-27T02:49:30.150509","2026-04-08T23:47:04.522198",[],[]]