phd-bibliography

GitHub
976 208 非常简单 1 次阅读 2周前视频
AI 解读 由 AI 自动生成,仅供参考

phd-bibliography 是一个专为最优控制、强化学习与运动规划领域打造的开源文献知识库。它系统性地梳理了从动态规划、线性规划到模型预测控制等经典理论,并深入涵盖了安全控制、博弈论、序列学习及模仿学习等前沿方向。

面对相关领域文献浩如烟海、知识体系庞杂的痛点,phd-bibliography 通过结构化的目录分类,将分散的学术论文、经典著作和关键技术(如 MCTS、REPS、Actor-Critic 等)整合成一张清晰的学习地图。它不仅罗列资源,更按算法流派与应用场景(如自动驾驶)进行逻辑串联,帮助用户快速定位核心资料,理清技术演进脉络。

这份资源特别适合人工智能领域的研究人员、硕博研究生以及算法工程师使用。无论是刚入门需要构建知识框架的新手,还是资深专家希望查漏补缺、追踪最新进展,都能从中获益。其独特的亮点在于极高的专业度与细致的分类颗粒度,不仅包含基础理论,还细分至“无导数优化”、“分层时序抽象”等具体技术点,是从事智能决策与机器人控制研究不可或缺的案头参考指南。

使用场景

某自动驾驶初创公司的算法工程师正在研发一套基于强化学习的城市道路决策系统,急需梳理最优控制与运动规划领域的理论基石以突破瓶颈。

没有 phd-bibliography 时

  • 文献检索如大海捞针:在 Google Scholar 上搜索"Safe Control"或"Model-based RL"时,返回成千上万篇论文,难以区分哪些是奠基性经典,哪些是过时方法。
  • 知识体系支离破碎:手动整理的参考文献缺乏系统性,容易遗漏动态规划、博弈论或多智能体协同等关键分支的理论联系,导致算法架构设计存在盲区。
  • 复现基准难以确立:面对黑盒优化或逆强化学习等细分方向,找不到权威的开源实现参考或标准测试用例(如 REPS 算法的具体出处),浪费大量时间验证基础理论。
  • 跨领域融合困难:难以快速定位将“风险规避控制”与“分层时序抽象”结合的前沿交叉研究,限制了复杂场景下的策略创新能力。

使用 phd-bibliography 后

  • 精准锁定核心经典:直接查阅其分类清晰的目录,瞬间获取从 Bellman 动态规划到现代 MCTS 的必读清单,大幅缩短文献调研周期。
  • 构建完整知识图谱:依托其结构化的大纲(涵盖从理论推导到自动驾驶应用的全链路),快速建立起从状态约束控制到不确定性系统处理的系统化认知框架。
  • 高效复现权威算法:通过列表中提供的精确论文链接(如 Peters 的相对熵策略搜索),迅速找到算法源头与数学证明,为代码复现提供坚实依据。
  • 激发交叉创新灵感:利用其独特的分类视角(如将模仿学习与逆向强化学习并列对比),快速发现多智能体博弈与表示学习的结合点,加速新策略原型的诞生。

phd-bibliography 将原本散乱的学术海洋浓缩为一张精准的导航图,让研发人员能从繁琐的文献筛选中解放出来,专注于核心算法的突破与创新。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该项目并非可执行的软件工具或代码库,而是一个学术文献综述列表(Bibliography),涵盖了最优控制、安全控制、博弈论、强化学习等领域的经典论文和书籍。因此,它没有特定的操作系统、硬件配置、Python 版本或依赖库要求。用户只需通过提供的链接阅读相关文献即可。
python未说明
phd-bibliography hero image

快速开始

参考文献

目录

强化学习图

最优控制 :dart:

动态规划

线性规划

基于树的规划

控制理论

模型预测控制

安全控制 :lock:

鲁棒控制

风险规避控制

价值约束控制

状态约束控制与稳定性

不确定动力系统

博弈论 :spades:

顺序学习 :shoe:

多臂老虎机 :slot_machine:

上下文相关

最优臂识别 :muscle:

黑箱优化 :black_large_square:

强化学习 :robot:

理论 :books:

生成模型

策略梯度

线性系统

基于价值 :chart_with_upwards_trend:

基于策略 :muscle:

策略梯度

演员-评论家

无导数方法

基于模型的 :world_map:

探索 :tent:

层次结构与时间抽象 :clock2:

部分可观测性 :eye:

迁移学习 :earth_americas:

多智能体 :two_men_holding_hands:

表征学习

离线

其他

示范学习 :mortar_board:

模仿学习

自动驾驶应用 :car:

逆强化学习

自动驾驶应用 :taxi:

运动规划 :running_man:

搜索

采样

优化

反应式

架构与应用

相似工具推荐

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|1周前
开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85.1k|★★☆☆☆|3天前
图像数据工具视频

MoneyPrinterTurbo

MoneyPrinterTurbo 是一款利用 AI 大模型技术,帮助用户一键生成高清短视频的开源工具。只需输入一个视频主题或关键词,它就能全自动完成从文案创作、素材匹配、字幕合成到背景音乐搭配的全过程,最终输出完整的竖屏或横屏短视频。 这款工具主要解决了传统视频制作流程繁琐、门槛高以及素材版权复杂等痛点。无论是需要快速产出内容的自媒体创作者,还是希望尝试视频生成的普通用户,无需具备专业的剪辑技能或昂贵的硬件配置(普通电脑即可运行),都能轻松上手。同时,其清晰的 MVC 架构和对多种主流大模型(如 DeepSeek、Moonshot、通义千问等)的广泛支持,也使其成为开发者进行二次开发或技术研究的理想底座。 MoneyPrinterTurbo 的独特亮点在于其高度的灵活性与本地化友好性。它不仅支持中英文双语及多种语音合成,允许用户精细调整字幕样式和画面比例,还特别优化了国内网络环境下的模型接入方案,让用户无需依赖 VPN 即可使用高性能国产大模型。此外,工具提供批量生成模式,可一次性产出多个版本供用户择优,极大地提升了内容创作的效率与质量。

55k|★★★☆☆|1周前
开发框架语言模型Agent

oh-my-openagent

oh-my-openagent(简称 omo)是一款强大的开源智能体编排框架,前身名为 oh-my-opencode。它致力于打破单一模型供应商的生态壁垒,解决开发者在构建 AI 应用时面临的“厂商锁定”难题。不同于仅依赖特定模型的封闭方案,omo 倡导开放市场理念,支持灵活调度多种主流大模型:利用 Claude、Kimi 或 GLM 进行任务编排,调用 GPT 处理复杂推理,借助 Minimax 提升响应速度,或发挥 Gemini 的创意优势。 这款工具特别适合希望摆脱平台限制、追求极致性能与成本平衡的开发者及研究人员使用。通过统一接口,用户可以轻松组合不同模型的长处,构建更高效、更具适应性的智能体系统。其独特的技术亮点在于“全模型兼容”架构,让用户不再受制于某一家公司的策略变动或定价调整,真正实现对前沿模型资源的自由驾驭。无论是构建自动化编码助手,还是开发多步骤任务处理流程,oh-my-openagent 都能提供灵活且稳健的基础设施支持,助力用户在快速演进的 AI 生态中保持技术主动权。

50.7k|★★☆☆☆|昨天
视频语言模型开发框架

tabby

Tabby 是一款可私有化部署的开源 AI 编程助手,旨在为开发团队提供 GitHub Copilot 的安全替代方案。它核心解决了代码辅助过程中的数据隐私顾虑与云端依赖问题,让企业能够在完全掌控数据的前提下享受智能代码补全、聊天问答及上下文理解带来的效率提升。 这款工具特别适合注重代码安全的企业开发团队、希望本地化运行大模型的科研机构,以及拥有消费级显卡的个人开发者。Tabby 的最大亮点在于其“开箱即用”的自包含架构,无需配置复杂的数据库或依赖云服务即可快速启动。同时,它对硬件十分友好,支持在普通的消费级 GPU 上流畅运行,大幅降低了部署门槛。此外,Tabby 提供了标准的 OpenAPI 接口,能轻松集成到现有的云 IDE 或内部开发流程中,并支持通过 REST API 接入自定义文档以增强知识上下文。从代码自动补全到基于 Git 仓库的智能问答,Tabby 致力于成为开发者身边懂业务、守安全的智能伙伴。

33.3k|★★★☆☆|5天前
开发框架语言模型Agent

generative-models

Generative Models 是 Stability AI 推出的开源项目,核心亮点在于最新发布的 Stable Video 4D 2.0(SV4D 2.0)。这是一个先进的视频转 4D 扩散模型,旨在解决从单一视角视频中生成高保真、多视角动态 3D 资产的技术难题。传统方法往往难以处理物体自遮挡或背景杂乱的情况,且生成的动态细节容易模糊,而 SV4D 2.0 通过改进的架构,显著提升了运动中的画面锐度与时空一致性,无需依赖额外的多视角参考图即可稳健地合成新颖视角的视频。 该项目特别适合计算机视觉研究人员、AI 开发者以及从事 3D 内容创作的设计师使用。对于研究者,它提供了探索 4D 生成前沿的完整代码与训练权重;对于开发者,其支持自动回归生成长视频及低显存优化选项,便于集成与调试;对于设计师,它能将简单的物体运动视频快速转化为可用于游戏或影视的多视角 4D 素材。技术层面,SV4D 2.0 支持一次性生成 12 帧视频对应 4 个相机视角(或 5 帧对应 8 视角),分辨率达 576x576,并能更好地泛化至真实世界场景。用户只需准备一段白底或经简单抠图处理的物体运动视频,

27.1k|★★★★☆|2天前
视频其他