game-datasets

GitHub
1k 76 非常简单 1 次阅读 2天前CC-BY-4.0数据工具
AI 解读 由 AI 自动生成,仅供参考

game-datasets 是一个专为游戏人工智能与数据挖掘领域打造的精选资源库。它系统性地整理了大量高质量的游戏数据集、实用开发工具以及相关学术资料,旨在解决研究人员和开发者在构建智能游戏应用时面临的“数据难找、工具分散”的痛点。

无论是需要训练强化学习模型的研究员,还是希望分析玩家行为的数据科学家,亦或是想要获取实时电竞数据的游戏开发者,都能在这里找到所需的支持。资源库涵盖了从经典主机游戏到移动端、Web 端的多平台数据接口(API),包括暴雪战网、Steam 数据库、Dota 2 开放数据、宝可梦全世代数据等知名来源,同时也收录了关于超级马里奥制造器等特定游戏的解析工具。

除了原始数据,game-datasets 还提供了市场研究资料、专业书籍推荐及各类辅助工具,帮助用户更高效地完成从数据获取到模型验证的全流程工作。项目采用开放的社区协作模式,持续更新维护,确保资源的时效性与实用性。对于希望深入探索游戏智能技术、开展数据驱动型游戏设计的专业人士而言,这是一个不可多得的入门指南与实战宝库。

使用场景

一家独立游戏工作室的数据分析师正试图构建一个预测模型,以评估新游戏在 Steam 平台的潜在销量与用户评价趋势。

没有 game-datasets 时

  • 数据源分散且难寻:团队需要在 GitHub、Kaggle 及各个游戏论坛中盲目搜索,花费数周时间才凑齐零散的 CS:GO 或 Dota 2 比赛记录。
  • 接口文档缺失:即使找到了如 Riot Games 或 Battle.net 的原始 API,也缺乏统一的调用指南和示例代码,导致开发环境配置反复报错。
  • 数据格式不统一:收集到的数据集结构各异,有的缺少关键字段,有的包含大量噪声,清洗和标准化工作占据了 80% 的项目时间。
  • 合规风险不明:难以确认某些爬取数据的使用许可,存在侵犯版权或违反服务条款的法律隐患。

使用 game-datasets 后

  • 资源一站式获取:直接通过 game-datasets 索引到经过筛选的高质量数据集,如 OpenDota 的实时比赛数据和 Steam Spy 的销售估算,半天内即可完成数据储备。
  • 开发效率倍增:利用列表中整理的 API 文档和工具链接(如 IGDB 和 Giant Bomb),快速打通数据管道,无需重复造轮子。
  • 数据质量可控:采纳库中推荐的成熟数据集,字段定义清晰且经过社区验证,大幅减少了数据预处理的工作量。
  • 授权清晰安心:每个条目均标注了明确的许可证信息(如 CC-BY-4.0),确保商业分析项目的合法合规性。

game-datasets 将原本耗时数月的数据筹备期压缩至几天,让团队能专注于核心算法优化而非繁琐的数据搜集。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该项目是一个游戏数据集、工具和资源的精选列表(Awesome List),并非一个需要安装和运行的单一软件工具。它主要包含指向外部 API、开源游戏项目、竞赛平台、书籍和数据集下载链接的引用。因此,没有统一的操作系统、GPU、内存或 Python 版本要求。具体的环境需求取决于用户选择使用列表中哪个特定的子项目或数据集。
python未说明
game-datasets hero image

快速开始

:video_game: 优秀的游戏数据集 Awesome

GitHub CC-BY-4.0 许可证 GitHub 工作流状态

在计算机科学中,人工智能(AI)是指机器所表现出的智能。其定义为:人工智能研究是关于“智能代理”的研究——即任何能够感知其环境并采取行动以实现其目标的设备 Russell 等人 (2016)

与此同时,数据挖掘(DM)是从数据集中发现模式的过程,涉及机器学习、统计学和数据库系统的方法;数据挖掘的重点在于从数据集中提取信息 Han (2011)

本仓库旨在指导如何在数字游戏中使用人工智能数据挖掘。您可以在这里找到数据集、工具和资料,用于构建您的_应用程序_或_数据集_。

贡献

如您有任何建议或问题,请提交一个议题。若想参与贡献,请阅读此处,然后提交一个拉取请求。


目录


API

API 是指“一组函数和过程,允许创建访问操作系统、应用程序或其他服务的功能或数据的应用程序”(Google)。


人工智能

移动端

网页端


图书

  • Drachen, A. Mirza-Babaei, P. Nacke, L. (2018). 游戏用户研究. 牛津。
  • El-Nasr, S. Drachen, A. Canossa, A. (2013). 游戏分析:最大化玩家数据的价值. Sprigner。
  • Han, J., Pei, J., Kamber, M. (2011). 数据挖掘:概念与技术. Elsevier。
  • Hennig-Thurau, T. Houston, M. (2018). 娱乐科学:电影、游戏、音乐和书籍的数据分析与实践理论. Springer。
  • Loh, A. Sheng, Y. Ifenthaler, D. (2015). 严肃游戏分析:绩效测量、评估和改进的方法论. Springer。
  • Millington, Ian, Funge, John (2020). 游戏中的人工智能,第三版. CRC Press。
  • Russell, S. J., Norvig, P. (2016). 人工智能:现代方法. 马来西亚;培生教育有限公司。
  • Yannakakis, G. N., Togelius, J. (2018). 人工智能与游戏. Springer。

数据集

相关资源


市场研究


其他


许可证

知识共享许可

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|1周前
Agent开发框架图像

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85.3k|★★☆☆☆|今天
图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理(NLP)打造的超级资源库,被誉为"NLP 民工的乐园”。它并非单一的软件工具,而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。 面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点,funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具,还独特地收录了丰富的垂直领域资源,如法律、医疗、金融行业的专用词库与数据集,甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性,从基础的字典词典到前沿的 BERT、GPT-2 模型代码,再到高质量的标注数据和竞赛方案,应有尽有。 无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师,还是从事人工智能研究的学者,都能在这里找到急需的“武器弹药”。对于开发者而言,它能大幅减少寻找数据和复现模型的时间;对于研究者,它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神,极大地降低了中文自然语言处理的开发与研究成本,是中文 AI 社区不可或缺的宝藏仓库。

79.9k|★☆☆☆☆|1周前
语言模型数据工具其他

cs-video-courses

cs-video-courses 是一个精心整理的计算机科学视频课程清单,旨在为自学者提供系统化的学习路径。它汇集了全球知名高校(如加州大学伯克利分校、新南威尔士大学等)的完整课程录像,涵盖从编程基础、数据结构与算法,到操作系统、分布式系统、数据库等核心领域,并深入延伸至人工智能、机器学习、量子计算及区块链等前沿方向。 面对网络上零散且质量参差不齐的教学资源,cs-video-courses 解决了学习者难以找到成体系、高难度大学级别课程的痛点。该项目严格筛选内容,仅收录真正的大学层级课程,排除了碎片化的简短教程或商业广告,确保用户能接触到严谨的学术内容。 这份清单特别适合希望夯实计算机基础的开发者、需要补充特定领域知识的研究人员,以及渴望像在校生一样系统学习计算机科学的自学者。其独特的技术亮点在于分类极其详尽,不仅包含传统的软件工程与网络安全,还细分了生成式 AI、大语言模型、计算生物学等新兴学科,并直接链接至官方视频播放列表,让用户能一站式获取高质量的教育资源,免费享受世界顶尖大学的课堂体验。

79.8k|★☆☆☆☆|1周前
其他图像数据工具

lobehub

LobeHub 是一个致力于工作与生活的智能体协作平台,旨在帮助用户发现、构建并与不断成长的 AI 智能体队友协同工作。它解决了当前 AI 应用中单点交互效率低、难以形成规模化协作网络的问题,将“智能体”确立为工作的基本单元,让人类与 AI 能够共同进化。 无论是开发者、研究人员还是普通用户,都能通过 LobeHub 轻松设计多智能体协作流程。平台支持一键安装 MCP 插件、访问丰富的智能体市场,并提供本地与云端数据库管理、多用户协作等高级功能。其独特的技术亮点包括对多种大模型服务商的兼容、本地大模型部署支持、视觉识别、语音对话(TTS/STT)、文生图以及思维链(Chain of Thought)等能力。此外,LobeHub 还具备分支对话、工件生成、文件上传与知识库集成等实用特性,并适配桌面端、移动端及 PWA 场景,支持自定义主题。 通过开源与自托管选项,LobeHub 为构建人机共演的未来协作网络提供了灵活、可扩展的基础设施。

75.1k|★★☆☆☆|5天前
语言模型数据工具Agent

scikit-learn

scikit-learn 是一个基于 Python 构建的开源机器学习库,依托于 SciPy、NumPy 等科学计算生态,旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口,涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具,内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。 对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言,scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点,让用户无需重复造轮子,只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。 其核心技术亮点在于高度一致的 API 设计风格,所有估算器(Estimator)均遵循相同的调用逻辑,极大地降低了学习成本并提升了代码的可读性与可维护性。此外,它还提供了强大的模型选择与评估工具,如交叉验证和网格搜索,帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目,scikit-learn 以其稳定性、详尽的文档和活跃的社区支持,成为连接理论学习与工业级应用的最

65.9k|★☆☆☆☆|今天
开发框架其他数据工具