Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising

2.4k 286 非常简单 1 次阅读今天图像其他开发框架

AI 解读由 AI 自动生成，仅供参考

Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising 是一份专为工业界打造的深度学习论文精选清单，聚焦于搜索、推荐系统与广告领域的核心算法演进。它系统性地梳理了从基础嵌入（Embedding）到复杂排序（Ranking）、重排序（Re-ranking），乃至大语言模型（LLM）与强化学习等前沿方向的关键研究成果。

在海量数据场景下，如何高效提取特征、精准匹配用户意图并优化点击率（CTR）或转化率（CVR）是业界长期面临的挑战。这份资源通过分类整理经典与最新论文，帮助从业者快速定位技术脉络，避免在浩如烟海的文献中迷失方向。无论是重温 Word2vec、DeepWalk 等奠基之作，还是研究阿里巴巴、Pinterest 等大厂落地的 Billion-scale Embedding 与 PinSage 等实战方案，都能在此找到权威参考。

该资源特别适合从事算法研发的工程师、攻读相关方向的研究生以及希望深入了解推荐机制的技术决策者。其独特亮点在于不仅涵盖学术界顶会（如 KDD、NIPS、ICLR）的理论突破，更着重收录了具有大规模工业应用背景的实战论文，实现了理论与实践的紧密衔接。对于想要构建高效推荐系统或追踪行业技术风向的专业人士而言，这是一份极具价值的入门指南与进阶手册。

使用场景

某电商平台的推荐算法团队正面临用户点击率增长瓶颈，急需引入工业界验证过的深度学习模型来优化商品嵌入（Embedding）与匹配策略。

没有 Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising 时

文献检索如大海捞针：工程师需手动在 arXiv、Google Scholar 等平台搜索"Graph Embedding"或"CTR Prediction"，耗费数周才能拼凑出零散的论文列表，且难以区分学术理论与工业落地方案。
技术选型缺乏依据：面对 Word2vec、Node2vec、GCN 等众多模型，团队不清楚哪些是谷歌、阿里、Pinterest 等大厂在实际亿级数据场景中验证有效的，容易盲目尝试不成熟的算法。
知识体系碎片化：团队成员对从预排序到重排序的全链路技术认知不一，缺乏统一的参考标准，导致技术方案讨论时经常因信息不对称而陷入低效争论。

使用 Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising 后

一站式获取工业级方案：团队直接查阅该清单中"00_Embedding"章节，迅速定位到阿里巴巴的 Billion-scale Commodity Embedding 和 Pinterest 的 PinSage 等经典论文，将调研周期从数周缩短至两天。
精准对标落地场景：通过清单中明确标注的厂商（如 Google、Alibaba）和应用场景（如电商推荐、社交网络），团队果断放弃纯学术模型，优先复现已在大规模生产中验证过的 GraphSAGE 和 GAT 算法。
构建系统化技术图谱：依托清单涵盖的嵌入、匹配、排序及强化学习等全链路分类，团队快速统一了技术视野，基于成熟的工业界演进路径制定了清晰的模型迭代路线图。

Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising 将分散的顶会论文转化为结构化的工业实战指南，帮助算法团队大幅降低试错成本并加速核心指标提升。

运行环境要求

依赖

notes该仓库是一个深度学习论文合集（Awesome List），主要包含搜索、推荐和广告领域的学术论文链接（PDF），并非可执行的软件代码库。因此，它没有特定的操作系统、GPU、内存、Python 版本或依赖库要求。用户只需具备阅读 PDF 文档的能力即可使用。若需复现论文中的算法，则需参考各篇论文具体的实现要求。

Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising hero image

快速开始

面向工业界搜索、推荐和广告的优秀深度学习论文。这些论文主要关注嵌入、匹配、预排序、排序（CTR/CVR预测）、后排序、相关性、大语言模型、强化学习等领域。

00_嵌入

01_匹配

近似最近邻搜索

图神经网络

LLM_匹配

02_预排序

03_排序

激活函数

2020年（Arxiv） [GLU] GLU变体改进Transformer

校准

经典

DNN

延迟反馈问题

蒸馏

实验

特征交叉

特征重要性

门控机制

LLM_Ranking

损失函数

多模态

多领域-多场景

多任务

参数服务器

预训练

序列建模

序列建模-长期

迁移学习

触发机制

2022年（阿里巴巴）（WWW）触发式推荐中的点击率预估深度兴趣突出网络

04_排序后处理

Seq2Slate

05_相关性排序

06_LLM

01_LLM_经典

02_自监督学习

07_强化学习

RL_classical

08_深度学习

Awesome-Deep-Learning-Papers-for-Search-Recommendation-Advertising 快速上手指南

本仓库并非一个可执行的软件工具或 Python 包，而是一个精选论文清单。它整理了工业界搜索、推荐和广告领域（涵盖 Embedding、匹配、排序、重排序等阶段）的经典深度学习论文。

因此，本指南将指导你如何获取资源、阅读核心文献以及复现经典模型。

环境准备

由于本仓库主要提供论文 PDF 链接，阅读本身无需特殊环境。但若要复现论文中的算法，建议准备以下开发环境：

操作系统: Linux (Ubuntu/CentOS) 或 macOS (Windows 用户建议使用 WSL2)
编程语言: Python 3.8+
深度学习框架: PyTorch 或 TensorFlow (根据具体论文实现选择)
依赖管理: pip 或 conda
网络环境: 部分论文链接托管在 GitHub 上，国内访问可能较慢，建议配置代理或使用加速工具。

安装步骤（获取资源）

你可以通过克隆仓库的方式将所有论文索引和目录下载到本地。

1. 克隆仓库

打开终端，执行以下命令：

git clone https://github.com/guyulongcs/Deep-Learning-for-Search-Recommendation-Advertisements.git

国内加速方案: 如果直接克隆速度过慢，可使用国内镜像源（如 Gitee 镜像，若存在）或指定代理：
git clone https://ghproxy.com/https://github.com/guyulongcs/Deep-Learning-for-Search-Recommendation-Advertisements.git
(注：ghproxy.com 为常用的 GitHub 加速服务，若失效请切换回官方地址或使用科学上网)

2. 进入目录

cd Deep-Learning-for-Search-Recommendation-Advertisements

此时，你可以在本地文件夹中看到按技术阶段分类的子目录（如 00_Embedding, 01_Matching 等），里面包含了指向具体论文 PDF 的 Markdown 链接文件。

基本使用

本项目的核心用法是按需查阅论文并复现模型。

1. 查阅论文列表

你可以直接在 GitHub 网页版浏览，或在本地用 Markdown 编辑器打开对应的 .md 文件（如果仓库包含汇总文件），直接点击链接下载 PDF。

核心分类导航：

00_Embedding: 包含 Word2vec, DeepWalk, Node2vec, GCN, GraphSAGE, PinSage 等图嵌入与表示学习论文。
01_Matching: 包含 User-CF, Item-CF, DSSM, Youtube DNN, Two-Tower, MIND 等召回与匹配模型论文。
(其他分类如 Ranking, Re-ranking 等在完整仓库中继续列出)

2. 复现经典模型示例 (以 Youtube DNN 为例)

假设你想复现 01_Matching 章节中的 [Youtube DNN] 模型，通常步骤如下：

第一步：阅读论文

点击仓库中对应的链接下载并阅读 Deep Neural Networks for YouTube Recommendations (2016)。

第二步：寻找开源实现

该仓库仅提供论文链接。你需要在 GitHub 搜索该论文的开源实现代码。例如：

# 在 GitHub 搜索 "Youtube DNN pytorch implementation"
# 找到合适的仓库后克隆，例如 (以下为示例虚拟地址，实际请搜索最新高星项目):
git clone https://github.com/example-user/youtube-dnn-pytorch.git
cd youtube-dnn-pytorch

第三步：安装依赖并运行

进入代码目录，安装依赖并运行训练脚本：

# 创建虚拟环境
python -m venv venv
source venv/bin/activate  # Windows 用户使用: venv\Scripts\activate

# 安装依赖
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt

# 运行训练示例 (具体命令视下载的代码库而定)
python train.py --config configs/youtube_dnn.yaml

3. 构建自己的知识库

你可以利用仓库中的分类结构，将自己复现代码的笔记或整理好的中文解读添加到对应目录下，构建个人的搜广推知识体系。

提示: 仓库中带 * 或 ** 标记的论文通常为工业界落地效果显著的经典之作（如 Alibaba Embedding, MIND, Two-Tower），建议优先研读。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|3天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|4天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 146.8k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|2天前

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|3天前

语言模型图像Agent