Reco-papers

3.5k 814 非常简单 1 次阅读 3天前MIT开发框架

AI 解读由 AI 自动生成，仅供参考

Reco-papers 是一个专注于推荐系统领域的开源知识库，由行业专家王喆整理并动态更新。它汇集了推荐算法发展史上的经典论文、前沿技术文档以及业界实战分享，旨在解决从业者在海量学术资源中难以高效筛选核心价值内容的痛点。

该资源库内容结构清晰，涵盖了从“召回与重排序”到“深度学习推荐模型”等关键模块。其中不仅收录了阿里巴巴的 DIN、微软的 Deep Crossing、斯坦福的 DCN 等里程碑式论文，还包含了关于个性化重排序（PRM）、多样性优化及大规模检索结构等具体工程实践的深度资料。相比通用的学术搜索引擎，Reco-papers 的独特亮点在于其“工业界视角”，精选的文章多为经过大规模业务验证的技术方案，兼具理论深度与落地指导意义。

Reco-papers 非常适合推荐算法工程师、人工智能研究人员以及相关领域的学生使用。对于希望快速构建知识体系、追踪技术演进路线或寻找工程优化灵感的开发者而言，这是一份极具价值的入门指南与进阶手册。通过这份清单，用户能够系统地掌握推荐系统的核心脉络，避免在碎片化信息中迷失方向，从而更高效地提升专业能力。

使用场景

某电商平台的推荐算法工程师正在为“双 11"大促优化召回与重排序模块，急需寻找能平衡准确率与多样性的前沿工业界方案。

没有 Reco-papers 时

检索效率低下：需要在 Google Scholar、ArXiv 和各类博客中碎片化搜索，耗费数天才能拼凑出完整的“召回 - 粗排 - 精排”技术链路。
缺乏工业落地视角：找到的多为纯学术理论论文，难以判断哪些模型（如 DIN、DCN）已在阿里、Airbnb 等大厂实际验证过，不敢轻易上线。
关键资源缺失：很难一次性获取到关于多样性控制（如 DPP）、序列重排序（如 Seq2Slate）等细分领域的经典文献合集。
知识体系断层：由于资料分散，难以系统性地对比从 RankNet 到 LambdaMART 再到深度学习模型的演进逻辑，导致技术方案选型犹豫不决。

使用 Reco-papers 后

一站式高效获取：直接通过 Reco-papers 的目录结构，按"Retrieval and Rerank"或"Deep Learning"分类，几分钟内即可定位到 TDM、COLD 等目标论文。
聚焦工业实战：优先阅读收录的 Airbnb 多样性管理、Hulu 重排序等业界分享，快速确认模型在大规模数据下的可行性，降低试错成本。
专题资源聚合：针对“提升阅读时长”或“广告点击预测”等具体目标，直接调取蒸馏多任务学习、Deep Crossing 等针对性极强的经典文档。
构建系统认知：借助整理好的演进路线，清晰梳理出从传统排序学习到深度交叉网络的技术脉络，迅速制定出适合当前业务的重排序升级方案。

Reco-papers 将散落的推荐系统明珠串联成图，让算法工程师从“大海捞针”转变为“按图索骥”，极大缩短了从理论研究到工业落地的路径。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该项目并非可执行的 AI 软件工具，而是一个推荐系统领域的论文、学习资料和业界分享的文档列表（仓库）。它主要包含指向各类 PDF 论文的链接，因此不需要特定的操作系统、GPU、内存或 Python 环境即可浏览和使用。用户只需具备阅读 PDF 的能力及访问 GitHub 的网络条件。

python未说明

快速开始

Reco-papers 快速上手指南

Reco-papers 并非一个需要编译安装的可执行软件或代码库，而是一个推荐系统领域的论文、学习资料与业界实践的资源索引仓库。它由王喆（Wang Zhe）维护，旨在为从业者提供动态更新的精选文献列表。

因此，“上手”本工具的核心在于获取资源与按需阅读。以下是针对中国开发者的快速使用指南。

1. 环境准备

本项目无特殊的系统运行依赖，仅需具备基础的文档阅读环境和网络访问能力。

操作系统：Windows / macOS / Linux 均可。
前置依赖：
- Git：用于克隆仓库（可选，也可直接网页浏览）。
- PDF 阅读器：用于打开下载的论文文件（如 Adobe Acrobat, Chrome 浏览器等）。
- 网络连接：由于原始文件托管在 GitHub 上，国内访问可能较慢，建议配置网络加速或使用镜像。

2. 获取资源（安装步骤）

你可以通过以下两种方式获取论文列表及文件：

方式一：直接网页浏览（推荐）

无需安装任何工具，直接访问 GitHub 仓库页面，按分类查找感兴趣的论文标题并点击下载。

仓库地址: https://github.com/wzhe06/Reco-papers
国内加速技巧: 如果直接访问 GitHub 速度慢，可使用国内镜像站（如 mirror.ghproxy.com）加速下载，或在 Gitee 搜索是否有同步镜像。

方式二：使用 Git 克隆本地

如果你希望离线浏览或批量管理文件，可以使用 Git 将仓库克隆到本地。

# 基础克隆命令
git clone https://github.com/wzhe06/Reco-papers.git

# 【推荐】国内开发者使用加速代理克隆（如果直连超时）
# 注意：请根据实际网络情况替换 <your-proxy> 或直接使用上述基础命令
git clone https://ghproxy.com/https://github.com/wzhe06/Reco-papers.git

克隆完成后，进入目录即可看到按类别整理的文件夹结构：

cd Reco-papers
ls
# 输出示例：
# 'Retrieval and Rerank'  'Deep Learning Recommender System'  Embedding ...

3. 基本使用

本仓库的内容已按推荐系统的核心模块进行了分类整理。使用者只需根据当前学习或工作需求，进入对应文件夹查找论文。

核心分类说明

检索与重排序 (Retrieval and Rerank)
- 包含召回策略、粗排、精排及多样性重排序相关论文。
- 典型资源: PRM (个性化重排), COLD (下一代预排序系统), TDM (树模型), Seq2Slate。
- 路径: Reco-papers/Retrieval and Rerank/
深度学习推荐模型 (Deep Learning Recommender System)
- 涵盖经典的 CTR 预估模型及序列建模方法。
- 典型资源: Wide&Deep (Google), DeepFM (华为), DIN/DIEN (阿里), DCN, xDeepFM。
- 路径: Reco-papers/Deep Learning Recommender System/
嵌入表示学习 (Embedding)
- 包含用户/物品向量化表示、图神经网络等相关技术。
- 典型资源: Word2Vec, Item2Vec, GraphSAGE, Node2vec, RippleNet。
- 路径: Reco-papers/Embedding/

使用示例

假设你想研究阿里巴巴提出的深度兴趣网络 (DIN) 以优化点击率预测：

进入深度学习分类目录：

cd "Reco-papers/Deep Learning Recommender System"

找到对应文件： [DIN] Deep Interest Network for Click-Through Rate Prediction (Alibaba 2018).pdf
使用本地 PDF 阅读器打开该文件即可开始阅读。

扩展资源

如果在主仓库未找到所需内容，可参考 README 中列出的关联资源库：

计算广告: Ad-papers
实时竞价 (RTB): rtb-papers
业界实践文章: Algorithm-Practice-in-Industry

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架

Reco-papers

使用场景

没有 Reco-papers 时

使用 Reco-papers 后

运行环境要求

快速开始

推荐系统论文、学习资料、业界分享

目录

检索与重排

深度学习推荐系统

嵌入

著名机器学习论文

多任务

特征数据与基础设施

经典推荐系统

大语言模型推荐系统

评估

强化学习在推荐中的应用

工业界推荐系统

探索与利用

冷启动与去偏