awesome-game-ai

GitHub
952 115 非常简单 1 次阅读 昨天MIT图像开发框架Agent
AI 解读 由 AI 自动生成,仅供参考

awesome-game-ai 是一个专注于多智能体强化学习(Multi-Agent Reinforcement Learning)的游戏人工智能资源合集。它旨在解决游戏 AI 开发中从单智能体向复杂多智能体环境过渡的难题,特别是在处理玩家间策略博弈、完全信息(如围棋、象棋)与不完全信息(如德州扑克、斗地主)等不同场景下的技术挑战。

该资源库系统性地整理了开源项目工具包、综述论文、前沿研究文献以及相关行业竞赛资料,并按游戏类型和发表年份进行了细致分类。无论是希望复现 AlphaGo、AlphaZero 或 OpenAI Five 等经典案例的研究人员,还是致力于开发具备高阶决策能力游戏 NPC 的开发者,都能从中快速找到所需的代码实现与理论支撑。

其独特亮点在于不仅涵盖了传统的棋类游戏,还深入收录了针对即时战略游戏(如《星际争霸》、《Dota 2》)及各类扑克牌游戏的最新突破成果,为探索复杂动态环境下的协同与对抗机制提供了宝贵的一站式入口。如果你正投身于游戏 AI 的前沿探索,awesome-game-ai 将是不可或缺的参考指南。

使用场景

某游戏工作室的算法团队正致力于开发一款支持多人在线对战的卡牌游戏,急需构建具备高水平博弈能力的非完美信息多智能体 AI。

没有 awesome-game-ai 时

  • 资源搜集如大海捞针:团队成员需分散在 arXiv、GitHub 和各大学术会议网站中手动筛选“斗地主”或“德州扑克”相关的多智能体强化学习论文与代码,耗时数周仍难辨优劣。
  • 复现基准模型困难:缺乏统一的开源项目参考,开发人员难以找到经过验证的基线代码(如 Libratus 或 DouZero 的实现细节),导致从零造轮子,试错成本极高。
  • 技术选型盲目:面对完美信息与不完美信息博弈的理论差异,团队因缺少系统的综述文章和分类资源,难以判断哪种算法架构更适合当前游戏的隐藏手牌机制。
  • 前沿动态滞后:无法及时获取如 AlphaStar 或 OpenAI Five 等最新多智能体协作技术的演进路径,导致技术方案可能起步即落后于行业顶尖水平。

使用 awesome-game-ai 后

  • 一站式资源聚合:团队直接利用该清单中按游戏类型(如 Texas Hold'em、Dou Dizhu)分类的精选库,半天内即可锁定多个高星开源项目和核心论文。
  • 快速搭建基线系统:通过引用清单中成熟的统一工具包和特定游戏项目代码,开发人员迅速复现了专家级博弈模型,将原型开发周期从数月缩短至两周。
  • 精准匹配技术路线:借助清单中关于“不完美信息博弈”的专项综述,团队清晰理解了对手建模与概率推理的关键点,迅速确定了适合隐藏信息机制的算法组合。
  • 紧跟学术前沿:定期查阅该清单更新的会议论文与竞赛成果,确保团队始终掌握多智能体协作学习的最新 SOTA(状态最优)方法,保持技术竞争力。

awesome-game-ai 通过系统化整理多智能体博弈资源,将研发团队从繁琐的信息检索中解放出来,使其能专注于核心算法的创新与落地。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该仓库是一个游戏 AI(特别是多智能体学习)资源的精选列表,而非单一的独立软件工具。它汇集了针对不同游戏(如德州扑克、斗地主、星际争霸、围棋等)的多个开源项目、论文和竞赛链接。每个列出的子项目(如 DouZero, PerfectDou, ELF 等)都有各自独立的运行环境要求和依赖库,需参考其对应的代码仓库链接获取具体安装说明。
python未说明
awesome-game-ai hero image

快速开始

令人惊叹的游戏AI

Awesome

这是一份精心整理但并不完整的、关于多智能体学习的游戏AI资源列表。

如果您希望为本列表贡献力量,欢迎随时提交拉取请求。您也可以联系 daochen.zha@rice.edukhlai@rice.edu

:loudspeaker: 最新消息:请查看我们开源的【大型时间序列模型(LTSM)】!GitHub链接

:loudspeaker: 您听说过以数据为中心的人工智能吗?请参阅我们的【以数据为中心的人工智能综述】和【以数据为中心的人工智能优秀资源】!

什么是游戏AI?

游戏AI专注于根据当前的游戏状态预测应采取的动作。通常,大多数游戏都会内置某种形式的AI,这些AI表现为游戏中的角色或玩家。对于一些热门游戏,如《星际争霸》和《Dota 2》,开发者花费了多年时间设计和优化AI,以提升玩家的游戏体验。

单智能体与多智能体

在单智能体环境中,针对游戏AI的研究和成果已经非常丰富,例如,在Atari游戏中成功应用了深度Q学习。其他例子还包括超级马里奥、我的世界以及Flappy Bird等。

相比之下,多智能体环境更具挑战性,因为每个玩家都需要考虑其他玩家的行动。近年来,随着强化学习技术的发展,多智能体游戏AI取得了显著进展。2015年,AlphaGo首次在标准19×19围棋盘上战胜了职业棋手;2017年,AlphaZero从零开始自学,掌握了国际象棋、将棋和围棋。近年来,研究人员又将目光投向扑克类游戏,如Libratus、DeepStack和DouZero等,这些项目在德州扑克和中国斗地主中都达到了专家级水平。如今,借助深度强化学习,研究人员还在《Dota 2》和《星际争霸2》中实现了接近人类水平的AI表现。

完全信息与不完全信息

完全信息博弈是指所有玩家都能获取相同的信息,例如围棋、国际象棋和五子棋。而不完全信息博弈则意味着玩家无法观察到游戏的全部状态。比如在纸牌游戏中,玩家无法看到其他玩家的手牌。因此,不完全信息博弈往往具有更高的复杂性和更多的可能性。

本资源包含哪些内容?

本仓库汇集了大量关于多智能体学习的游戏AI资源,涵盖完全信息和不完全信息两类游戏,包括但不限于开源项目、综述论文、研究论文、会议及竞赛等。资源按游戏分类,并按年份排序。

目录

开源项目

通用工具包

  • RLCard:用于卡牌游戏强化学习的工具包 [论文] [代码]。
  • OpenSpiel:适用于各类游戏的强化学习框架 [论文] [代码]。
  • Unity ML-Agents 工具包 [论文] [代码]。
  • Alpha Zero General [代码]。

德州扑克项目

  • DeepStack-Leduc [论文] [代码]。
  • DeepHoldem [代码]。
  • OpenAI Gym 无限制德州扑克环境,专为强化学习设计 [代码]。
  • PyPokerEngine [代码]。
  • DeepMind开发的扑克机器人,可用于PokerStars和Partypoker [代码]。

斗地主项目

  • PerfectDou:通过完美信息蒸馏技术称霸斗地主 [代码]。
  • DouZero:利用自我对弈的深度强化学习掌握斗地主 [代码]。
  • 基于强化学习的斗地主AI [代码]。
  • 结合组合Q学习的斗地主AI [论文] [代码]。
  • 斗地主AI [代码]。
  • 斗地主AI的设计与实现 [代码]。

星际争霸项目

  • StarCraft II 学习环境 [论文] [代码]。
  • Gym StarCraft [代码]。
  • StarCraft II 强化学习示例 [代码]。
  • 关于DeepMind星际争霸AI环境的指南 [代码]。
  • 基于DI-engine重新实现的AlphaStar,并附带训练好的模型 [代码]。

围棋项目

  • ELF:一个基于AlphaGoZero/AlphaZero重写的平台,用于游戏研究 [代码] [论文]。

五子棋项目

国际象棋项目

中国象棋项目

  • CCZero (中国象棋Zero) [代码]。

麻将项目

  • pymahjong(日本立直麻将)[代码]。
  • Mortal [代码]。

综述与通用论文

  • 不完全信息博弈中的自我对弈深度强化学习,arXiv 2016 [论文]。
  • 多智能体强化学习:综述,2010年 [论文]。
  • 合作与竞争性多智能体学习概述,LAMAS 2005 [论文]。
  • 多智能体强化学习:批判性综述,2003年 [论文]。

研究论文

投注类游戏

投注类游戏是扑克游戏中最受欢迎的形式之一。列表包括Goofspiel库恩扑克勒杜克扑克德州扑克

  • 神经元复制动力学,arXiv 2019 [论文]。
  • 基于可利用性下降的顺序对抗性博弈近似均衡计算,IJCAI 2019 [论文]。
  • 通过折扣后悔最小化求解不完全信息博弈,AAAI 2019 [论文]。
  • 深度反事实后悔最小化,ICML 2019 [论文]。
  • 部分可观测多智能体环境中的演员—评论家策略优化,NeurIPS 2018 [论文]。
  • 不完全信息博弈的安全嵌套子博弈求解,NeurIPS 2018 [论文]。
  • DeepStack:无限制头寸单挑扑克中的专家级人工智能,Science 2017 [论文]。
  • 多智能体强化学习的统一博弈论方法,NeurIPS 2017 [论文]。
  • 扑克-CNN:使用卷积网络在扑克游戏中进行跟注和下注的模式学习策略 [论文]。
  • 不完全信息博弈中的自我对弈深度强化学习,arXiv 2016 [论文]。
  • 广义形式博弈中的虚构自我对弈,ICML 2015 [论文]。
  • 解决头寸限注德州扑克,IJCAI 2015 [论文]。
  • 不完全信息博弈中的后悔最小化,NeurIPS 2007 [论文]。

斗地主

  • PerfectDou:通过完美信息蒸馏统治斗地主,NeurIPS 2022 [论文] [代码]。
  • DouZero:通过自我对弈深度强化学习掌握斗地主,ICML 2021 [论文] [代码]。
  • DeltaDou:通过自我对弈达到专家级斗地主AI,IJCAI 2019 [论文]。
  • 斗地主的组合Q学习,arXiv 2019 [论文] [代码]。
  • 斗地主牌戏中的确定化与信息集蒙特卡洛树搜索,CIG 2011 [论文]。

麻将

  • 强化学习中的变分oracle引导,ICLR 2022 [论文]。
  • Suphx:用深度强化学习掌握麻将,arXiv 2020 [论文]。
  • 在多人麻将游戏中构建基于马尔可夫决策过程抽象的人工智能玩家的方法,arXiv 2019 [论文]。
  • 基于蒙特卡洛模拟和对手模型的计算机麻将玩家开发,IEEE CIG 2017 [论文]。

桥牌

  • 提升桥牌人工智能,ICTAI 2017 [论文]。

围棋

  • 不依赖人类知识掌握围棋,Nature 2017 [论文]。
  • 使用深度神经网络和树搜索掌握围棋,Nature 2016 [论文]。
  • 计算机围棋中的时序差分搜索,机器学习,2012年 [论文]。
  • 计算机围棋中的蒙特卡洛树搜索和快速动作价值估计,人工智能,2011年 [论文]。
  • 计算围棋中走法模式的“elo评分”,ICGA期刊,2007年 [论文]。

星际争霸

  • 使用多智能体强化学习达到星际争霸II的大师级水平,Nature 2019 [论文]。
  • 关于星际争霸完整游戏的强化学习,AAAI 2019 [论文]。
  • 稳定化深度多智能体强化学习的经验回放,ICML 2017 [论文]。
  • 星际争霸中多单位作战的合作强化学习,SSCI 2017 [论文]。
  • 使用深度学习从重播中学习星际争霸中的宏观管理,CIG 2017 [论文]。
  • 将强化学习应用于即时战略游戏《星际争霸:母巢之战》中的小规模战斗,CIG 2012 [论文]。

会议与研讨会

竞赛

相关列表

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|4天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|5天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

148.6k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.1k|★★☆☆☆|2天前
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|今天
插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|3天前
插件开发框架