[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-google-deepmind--meltingpot":3,"tool-google-deepmind--meltingpot":64},[4,17,27,35,48,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",140436,2,"2026-04-05T23:32:43",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,43,44,45,15,46,26,13,47],"数据工具","视频","插件","其他","音频",{"id":49,"name":50,"github_repo":51,"description_zh":52,"stars":53,"difficulty_score":10,"last_commit_at":54,"category_tags":55,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,46],{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},2181,"OpenHands","OpenHands\u002FOpenHands","OpenHands 是一个专注于 AI 驱动开发的开源平台，旨在让智能体（Agent）像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点，通过自动化流程显著提升开发速度。\n\n无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员，还是需要快速原型验证的技术团队，都能从中受益。OpenHands 提供了灵活多样的使用方式：既可以通过命令行（CLI）或本地图形界面在个人电脑上轻松上手，体验类似 Devin 的流畅交互；也能利用其强大的 Python SDK 自定义智能体逻辑，甚至在云端大规模部署上千个智能体并行工作。\n\n其核心技术亮点在于模块化的软件智能体 SDK，这不仅构成了平台的引擎，还支持高度可组合的开发模式。此外，OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩，证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能，支持与 Slack、Jira 等工具集成，并提供细粒度的权限管理，适合从个人开发者到大型企业的各类用户场景。",70626,"2026-04-05T22:51:36",[26,15,13,45],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":80,"owner_location":80,"owner_email":80,"owner_twitter":80,"owner_website":81,"owner_url":82,"languages":83,"stars":104,"forks":105,"last_commit_at":106,"license":107,"difficulty_score":10,"env_os":108,"env_gpu":109,"env_ram":110,"env_deps":111,"category_tags":120,"github_topics":121,"view_count":23,"oss_zip_url":80,"oss_zip_packed_at":80,"status":16,"created_at":123,"updated_at":124,"faqs":125,"releases":158},4013,"google-deepmind\u002Fmeltingpot","meltingpot","A suite of test scenarios for multi-agent reinforcement learning.","Melting Pot 是由 Google DeepMind 开源的一套多智能体强化学习（MARL）评测基准。它旨在解决当前 AI 研究中的一个核心难题：如何评估智能体在陌生社交环境中的泛化能力。传统的测试往往局限于训练场景，而 Melting Pot 通过构建超过 50 种基础多智能体游戏和 256 个独特的测试场景，专门用于检验智能体在面对未见过的个体及复杂社会互动时的表现。\n\n这些场景涵盖了合作、竞争、欺骗、互惠、信任等多种社会行为模式。通过让智能体在这些“保留”测试集中运行，研究人员可以量化其是否具备与陌生人有效协作或博弈的能力，从而客观地排名不同算法的优劣。这使得 Melting Pot 有望成为衡量多智能体系统社会智能的标准尺子。\n\n该工具主要面向人工智能领域的研究人员、算法工程师及高校学者，特别是那些致力于开发具备通用社交能力多智能体系统的团队。其技术亮点在于基于 DeepMind Lab2D 构建的高保真仿真环境，不仅支持丰富的交互逻辑，还提供了严谨的评测协议。如果你希望验证自己的多智能体算法是否真正学会了“与人相处”，而非仅仅死记硬背训练数据，Melting Pot ","Melting Pot 是由 Google DeepMind 开源的一套多智能体强化学习（MARL）评测基准。它旨在解决当前 AI 研究中的一个核心难题：如何评估智能体在陌生社交环境中的泛化能力。传统的测试往往局限于训练场景，而 Melting Pot 通过构建超过 50 种基础多智能体游戏和 256 个独特的测试场景，专门用于检验智能体在面对未见过的个体及复杂社会互动时的表现。\n\n这些场景涵盖了合作、竞争、欺骗、互惠、信任等多种社会行为模式。通过让智能体在这些“保留”测试集中运行，研究人员可以量化其是否具备与陌生人有效协作或博弈的能力，从而客观地排名不同算法的优劣。这使得 Melting Pot 有望成为衡量多智能体系统社会智能的标准尺子。\n\n该工具主要面向人工智能领域的研究人员、算法工程师及高校学者，特别是那些致力于开发具备通用社交能力多智能体系统的团队。其技术亮点在于基于 DeepMind Lab2D 构建的高保真仿真环境，不仅支持丰富的交互逻辑，还提供了严谨的评测协议。如果你希望验证自己的多智能体算法是否真正学会了“与人相处”，而非仅仅死记硬背训练数据，Melting Pot 将是一个不可或缺的专业助手。","# Melting Pot\n\n*A suite of test scenarios for multi-agent reinforcement learning.*\n\n\u003C!-- linter off -->\n\u003C!-- GITHUB -->\n[![Python](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fpyversions\u002Fdm-meltingpot.svg)](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fdm-meltingpot)\n[![PyPI version](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fdm-meltingpot.svg)](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fdm-meltingpot)\n[![PyPI tests](..\u002F..\u002Factions\u002Fworkflows\u002Fpypi-test.yml\u002Fbadge.svg)](..\u002F..\u002Factions\u002Fworkflows\u002Fpypi-test.yml)\n[![Tests](..\u002F..\u002Factions\u002Fworkflows\u002Ftest-meltingpot.yml\u002Fbadge.svg)](..\u002F..\u002Factions\u002Fworkflows\u002Ftest-meltingpot.yml)\n[![Examples](..\u002F..\u002Factions\u002Fworkflows\u002Ftest-examples.yml\u002Fbadge.svg)](..\u002F..\u002Factions\u002Fworkflows\u002Ftest-examples.yml)\n\u003C!-- \u002FGITHUB -->\n\u003C!-- linter on -->\n\n\u003C!-- disableFinding(SNIPPET_INVALID_LANGUAGE) -->\n\u003C!-- disableFinding(IMAGE_ALT_TEXT_INACCESSIBLE) -->\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-deepmind_meltingpot_readme_b2bc8ff9b64f.gif\"\n       alt=\"Melting Pot substrates\"\n       height=\"250\" width=\"250\" \u002F>\n\u003C\u002Fdiv>\n\n[Melting Pot 2.0 Tech Report](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.13746)\n[Melting Pot Contest at NeurIPS 2023](https:\u002F\u002Fwww.aicrowd.com\u002Fchallenges\u002Fmeltingpot-challenge-2023)\n\n## About\n\nMelting Pot assesses generalization to novel social situations involving both\nfamiliar and unfamiliar individuals, and has been designed to test a broad range\nof social interactions such as: cooperation, competition, deception,\nreciprocation, trust, stubbornness and so on. Melting Pot offers researchers a\nset of over 50 multi-agent reinforcement learning _substrates_ (multi-agent\ngames) on which to train agents, and over 256 unique test _scenarios_ on which\nto evaluate these trained agents. The performance of agents on these held-out\ntest scenarios quantifies whether agents:\n\n*   perform well across a range of social situations where individuals are\n    interdependent,\n*   interact effectively with unfamiliar individuals not seen during training\n\nThe resulting score can then be used to rank different multi-agent RL algorithms\nby their ability to generalize to novel social situations.\n\nWe hope Melting Pot will become a standard benchmark for multi-agent\nreinforcement learning. We plan to maintain it, and will be extending it in the\ncoming years to cover more social interactions and generalization scenarios.\n\nIf you are interested in extending Melting Pot, please refer to the\n[Extending Melting Pot](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fdocs\u002Fextending.md) documentation.\n\n## Installation\n\nMelting Pot is available on PyPI](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fdm-meltingpot)\nand can be installed using:\n\n```shell\npip install dm-meltingpot\n```\n\nAfter doing this you can then `import meltingpot` in your own code.\n\nNOTE: Melting Pot is built on top of [DeepMind Lab2D](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Flab2d)\nwhich is distributed as pre-built wheels. If there is no appropriate wheel for\n`dmlab2d`, you will need to build it from source (see\n[the `dmlab2d` `README.md`](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Flab2d\u002Fblob\u002Fmain\u002FREADME.md)\nfor details).\n\n## Development\n\n### Codespace\n\nThe easiest way to work on the Melting Pot source code, is to use our\npre-configured development environment via a\n[Github CodeSpace](https:\u002F\u002Fgithub.com\u002Ffeatures\u002Fcodespaces).\n\nThis provides a tested development workflow that allows for reproducible builds,\nand minimizes dependency management. We strongly advise preparing all Pull\nRequests for Melting Pot via this workflow.\n\n### Manual setup\n\nIf you want to work on the Melting Pot source code within your own development\nenvironment you will have to handle installation and dependency management\nyourself.\n\nFor example, you can perform an editable installation as follows:\n\n1.  Clone Melting Pot:\n\n    ```shell\n    git clone -b main https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\n    cd meltingpot\n    ```\n\n2.  Create and activate a virtual environment:\n\n    ```shell\n    python -m venv venv\n    source venv\u002Fbin\u002Factivate\n    ```\n\n3.  Install Melting Pot:\n\n    ```shell\n    pip install --editable .[dev]\n    ```\n\n4.  Test the installation:\n\n    ```shell\n    pytest --pyargs meltingpot\n    ```\n\n## Example usage\n\n### Evaluation\nThe [evaluation](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fmeltingpot\u002Futils\u002Fevaluation\u002Fevaluation.py) library can be used\nto evaluate [SavedModel](https:\u002F\u002Fwww.tensorflow.org\u002Fguide\u002Fsaved_model)s\ntrained on Melting Pot substrates.\n\nEvaluation results from the [Melting Pot 2.0 Tech Report](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.13746)\ncan be viewed in the [Evaluation Notebook](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fnotebooks\u002Fevaluation_results.ipynb).\n\n[![Open In Colab](https:\u002F\u002Fcolab.research.google.com\u002Fassets\u002Fcolab-badge.svg)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fdeepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fnotebooks\u002Fevaluation_results.ipynb)\n\n### Interacting with the substrates\n\nYou can try out the substrates interactively with the\n[human_players](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fmeltingpot\u002Fhuman_players) scripts. For example, to play\nthe `clean_up` substrate, you can run:\n\n```shell\npython meltingpot\u002Fhuman_players\u002Fplay_clean_up.py\n```\n\nYou can move around with the `W`, `A`, `S`, `D` keys, Turn with `Q`, and `E`,\nfire the zapper with `1`, and fire the cleaning beam with `2`. You can switch\nbetween players with `TAB`. There are other substrates available in the\n[human_players](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fmeltingpot\u002Fhuman_players) directory. Some have multiple\nvariants, which you select with the `--level_name` flag.\n\n### Training agents\n\nWe provide an illustrative example script using\n[RLlib](https:\u002F\u002Fgithub.com\u002Fray-project\u002Fray). However, note\nthat Melting Pot is agnostic to how you train your agents, and this\nscript is not meant to be a suggestion for how to achieve a good score\nin the task suite. The authors of the suite never used this example training\nscript in their own work.\n\n#### RLlib\n\nThis example uses RLlib to train agents in\nself-play on a Melting Pot substrate.\n\nFirst you will need to install the dependencies needed by the examples:\n\n```shell\ncd \u003Cmeltingpot_root>\npip install -r examples\u002Frequirements.txt\n```\n\nThen you can run the training experiment using:\n\n```shell\ncd examples\u002Frllib\npython self_play_train.py\n```\n\n## Documentation\n\nFull documentation is available [here](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fdocs\u002Findex.md).\n\n## Citing Melting Pot\n\nIf you use Melting Pot in your work, please cite the accompanying articles:\n\n```bibtex\n@inproceedings{leibo2021meltingpot,\n    title={Scalable Evaluation of Multi-Agent Reinforcement Learning with\n           Melting Pot},\n    author={Joel Z. Leibo AND Edgar Du\\'e\\~nez-Guzm\\'an AND Alexander Sasha\n            Vezhnevets AND John P. Agapiou AND Peter Sunehag AND Raphael Koster\n            AND Jayd Matyas AND Charles Beattie AND Igor Mordatch AND Thore\n            Graepel},\n    year={2021},\n    journal={International conference on machine learning},\n    organization={PMLR},\n    url={https:\u002F\u002Fdoi.org\u002F10.48550\u002FarXiv.2107.06857},\n    doi={10.48550\u002FarXiv.2107.06857}\n}\n```\n\n```bibtex\n@article{agapiou2022melting,\n  title={Melting Pot 2.0},\n  author={Agapiou, John P and Vezhnevets, Alexander Sasha and Du{\\'e}{\\~n}ez-Guzm{\\'a}n, Edgar A and Matyas, Jayd and Mao, Yiran and Sunehag, Peter and K{\\\"o}ster, Raphael and Madhushani, Udari and Kopparapu, Kavya and Comanescu, Ramona and Strouse, {DJ} and Johanson, Michael B and Singh, Sukhdeep and Haas, Julia and Mordatch, Igor and Mobbs, Dean and Leibo, Joel Z},\n  journal={arXiv preprint arXiv:2211.13746},\n  year={2022}\n}\n```\n\n## Disclaimer\n\nThis is not an officially supported Google product.\n","# 熔炉\n\n*用于多智能体强化学习的一系列测试场景。*\n\n\u003C!-- linter off -->\n\u003C!-- GITHUB -->\n[![Python](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fpyversions\u002Fdm-meltingpot.svg)](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fdm-meltingpot)\n[![PyPI版本](https:\u002F\u002Fimg.shields.io\u002Fpypi\u002Fv\u002Fdm-meltingpot.svg)](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fdm-meltingpot)\n[![PyPI测试](..\u002F..\u002Factions\u002Fworkflows\u002Fpypi-test.yml\u002Fbadge.svg)](..\u002F..\u002Factions\u002Fworkflows\u002Fpypi-test.yml)\n[![测试](..\u002F..\u002Factions\u002Fworkflows\u002Ftest-meltingpot.yml\u002Fbadge.svg)](..\u002F..\u002Factions\u002Fworkflows\u002Ftest-meltingpot.yml)\n[![示例](..\u002F..\u002Factions\u002Fworkflows\u002Ftest-examples.yml\u002Fbadge.svg)](..\u002F..\u002Factions\u002Fworkflows\u002Ftest-examples.yml)\n\u003C!-- \u002FGITHUB -->\n\u003C!-- linter on -->\n\n\u003C!-- disableFinding(SNIPPET_INVALID_LANGUAGE) -->\n\u003C!-- disableFinding(IMAGE_ALT_TEXT_INACCESSIBLE) -->\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-deepmind_meltingpot_readme_b2bc8ff9b64f.gif\"\n       alt=\"熔炉基底\"\n       height=\"250\" width=\"250\" \u002F>\n\u003C\u002Fdiv>\n\n[熔炉2.0技术报告](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.13746)\n[NeurIPS 2023熔炉竞赛](https:\u002F\u002Fwww.aicrowd.com\u002Fchallenges\u002Fmeltingpot-challenge-2023)\n\n## 关于\n\n熔炉评估智能体在包含熟悉与不熟悉个体的新型社交情境中的泛化能力，旨在测试广泛的社会交互行为，如合作、竞争、欺骗、互惠、信任、固执等。熔炉为研究人员提供超过50种多智能体强化学习“基底”（即多智能体游戏）用于训练智能体，并提供超过256个独特的测试场景来评估这些已训练的智能体。智能体在这些未见测试场景上的表现，可以量化其是否：\n\n* 在个体相互依赖的各种社交情境中表现出色，\n* 与训练过程中未见过的陌生个体有效互动。\n\n最终得分可用于对不同多智能体强化学习算法在新型社交情境中的泛化能力进行排名。\n\n我们希望熔炉能成为多智能体强化学习的标准基准。我们将持续维护并扩展它，以涵盖更多社会交互和泛化场景。\n\n如果您有兴趣扩展熔炉，请参阅[扩展熔炉](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fdocs\u002Fextending.md)文档。\n\n## 安装\n\n熔炉已在PyPI上发布（[https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fdm-meltingpot](https:\u002F\u002Fpypi.python.org\u002Fpypi\u002Fdm-meltingpot)），可通过以下命令安装：\n\n```shell\npip install dm-meltingpot\n```\n\n安装完成后，您可以在自己的代码中使用`import meltingpot`。\n\n注意：熔炉基于[DeepMind Lab2D](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Flab2d)构建，后者以预编译的wheel包形式分发。如果不存在适用于`dmlab2d`的wheel包，您需要从源码编译（详情请参阅[dmlab2d的README.md](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Flab2d\u002Fblob\u002Fmain\u002FREADME.md)）。\n\n## 开发\n\n### Codespace\n\n最便捷的熔炉源码开发方式是通过[Github Codespace](https:\u002F\u002Fgithub.com\u002Ffeatures\u002Fcodespaces)使用我们预配置的开发环境。\n\n这提供了一个经过验证的开发流程，支持可复现的构建，并最大限度地简化依赖管理。我们强烈建议所有针对熔炉的Pull Request都通过此流程准备。\n\n### 手动设置\n\n如果您希望在自己的开发环境中工作，则需自行处理安装和依赖管理。\n\n例如，您可以按如下步骤进行可编辑安装：\n\n1. 克隆熔炉：\n\n    ```shell\n    git clone -b main https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\n    cd meltingpot\n    ```\n\n2. 创建并激活虚拟环境：\n\n    ```shell\n    python -m venv venv\n    source venv\u002Fbin\u002Factivate\n    ```\n\n3. 安装熔炉：\n\n    ```shell\n    pip install --editable .[dev]\n    ```\n\n4. 测试安装：\n\n    ```shell\n    pytest --pyargs meltingpot\n    ```\n\n## 示例用法\n\n### 评估\n[evaluation](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fmeltingpot\u002Futils\u002Fevaluation\u002Fevaluation.py)库可用于评估在熔炉基底上训练的[SavedModel](https:\u002F\u002Fwww.tensorflow.org\u002Fguide\u002Fsaved_model)。\n\n来自[熔炉2.0技术报告](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.13746)的评估结果可在[评估笔记本](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fnotebooks\u002Fevaluation_results.ipynb)中查看。\n\n[![在Colab中打开](https:\u002F\u002Fcolab.research.google.com\u002Fassets\u002Fcolab-badge.svg)](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fdeepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fnotebooks\u002Fevaluation_results.ipynb)\n\n### 与基底互动\n您可以通过[human_players](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fmeltingpot\u002Fhuman_players)脚本交互式地体验各个基底。例如，要玩`clean_up`基底，可以运行：\n\n```shell\npython meltingpot\u002Fhuman_players\u002Fplay_clean_up.py\n```\n\n您可以使用`W`、`A`、`S`、`D`键移动，`Q`和`E`键转向，`1`键发射电击枪，`2`键发射清洁光束。使用`TAB`键可在不同玩家之间切换。`human_players`目录下还有其他基底可供选择，部分基底有多个变体，可通过`--level_name`参数选择。\n\n### 训练智能体\n我们提供了一个使用[RLlib](https:\u002F\u002Fgithub.com\u002Fray-project\u002Fray)的示例脚本。但请注意，熔炉对您的训练方法并不设限，该示例脚本并非旨在指导您如何在任务集中取得好成绩。该套件的作者们在其自身研究中并未使用此示例训练脚本。\n\n#### RLlib\n此示例使用RLlib在熔炉基底上进行自我对弈训练。\n\n首先，您需要安装示例所需的依赖：\n\n```shell\ncd \u003Cmeltingpot_root>\npip install -r examples\u002Frequirements.txt\n```\n\n然后，您可以运行训练实验：\n\n```shell\ncd examples\u002Frllib\npython self_play_train.py\n```\n\n## 文档\n\n完整文档请参见[此处](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fdocs\u002Findex.md)。\n\n## 引用 Melting Pot\n\n如果您在工作中使用了 Melting Pot，请引用随附的文章：\n\n```bibtex\n@inproceedings{leibo2021meltingpot,\n    title={Scalable Evaluation of Multi-Agent Reinforcement Learning with\n           Melting Pot},\n    author={Joel Z. Leibo AND Edgar Du\\'e\\~nez-Guzm\\'an AND Alexander Sasha\n            Vezhnevets AND John P. Agapiou AND Peter Sunehag AND Raphael Koster\n            AND Jayd Matyas AND Charles Beattie AND Igor Mordatch AND Thore\n            Graepel},\n    year={2021},\n    journal={International conference on machine learning},\n    organization={PMLR},\n    url={https:\u002F\u002Fdoi.org\u002F10.48550\u002FarXiv.2107.06857},\n    doi={10.48550\u002FarXiv.2107.06857}\n}\n```\n\n```bibtex\n@article{agapiou2022melting,\n  title={Melting Pot 2.0},\n  author={Agapiou, John P and Vezhnevets, Alexander Sasha and Du{\\'e}{\\~n}ez-Guzm{\\'a}n, Edgar A and Matyas, Jayd and Mao, Yiran and Sunehag, Peter and K{\\\"o}ster, Raphael and Madhushani, Udari and Kopparapu, Kavya and Comanescu, Ramona and Strouse, {DJ} and Johanson, Michael B and Singh, Sukhdeep and Haas, Julia and Mordatch, Igor and Mobbs, Dean and Leibo, Joel Z},\n  journal={arXiv preprint arXiv:2211.13746},\n  year={2022}\n}\n```\n\n## 免责声明\n\n本项目并非 Google 官方支持的产品。","# Melting Pot 快速上手指南\n\nMelting Pot 是由 Google DeepMind 开源的多智能体强化学习（MARL）测试套件。它提供了超过 50 种多智能体游戏环境（substrates）和 256 个独特的测试场景，旨在评估智能体在合作、竞争、欺骗、信任等复杂社交情境中的泛化能力。\n\n## 环境准备\n\n*   **操作系统**：推荐 Linux (Ubuntu) 或 macOS。Windows 用户建议使用 WSL2。\n*   **Python 版本**：Python 3.8 或更高版本。\n*   **前置依赖**：\n    *   `pip` 包管理工具。\n    *   该工具基于 [DeepMind Lab2D](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Flab2d) 构建。通常安装时会自动下载预编译的 wheel 包。若自动安装失败（无对应平台的 wheel），需参考 Lab2D 文档从源码编译。\n\n## 安装步骤\n\n### 方式一：通过 PyPI 安装（推荐）\n\n这是最简单的安装方式，适用于直接使用库进行开发或评估。\n\n```shell\npip install dm-meltingpot\n```\n\n> **国内加速建议**：如果下载速度较慢，可使用清华或阿里镜像源：\n> ```shell\n> pip install dm-meltingpot -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n安装完成后，即可在 Python 代码中通过 `import meltingpot` 使用。\n\n### 方式二：源码安装（用于开发或贡献）\n\n如果你需要修改源码或运行示例脚本，请按以下步骤操作：\n\n1.  **克隆仓库**\n    ```shell\n    git clone -b main https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\n    cd meltingpot\n    ```\n\n2.  **创建并激活虚拟环境**\n    ```shell\n    python -m venv venv\n    source venv\u002Fbin\u002Factivate  # Windows 用户使用: venv\\Scripts\\activate\n    ```\n\n3.  **以可编辑模式安装**\n    ```shell\n    pip install --editable .[dev]\n    ```\n    > **国内加速建议**：\n    > ```shell\n    > pip install --editable .[dev] -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n    > ```\n\n4.  **验证安装**\n    ```shell\n    pytest --pyargs meltingpot\n    ```\n\n## 基本使用\n\n### 1. 交互式体验（人工试玩）\n\n你可以直接运行脚本，通过键盘控制智能体体验内置的游戏环境。以下以 `clean_up`（清理协作）场景为例：\n\n```shell\npython meltingpot\u002Fhuman_players\u002Fplay_clean_up.py\n```\n\n**操作说明：**\n*   移动：`W`, `A`, `S`, `D`\n*   转向：`Q`, `E`\n*   发射干扰器：`1`\n*   发射清洁光束：`2`\n*   切换玩家视角：`TAB`\n\n*注：更多可玩场景位于 `meltingpot\u002Fhuman_players` 目录下，部分场景可通过 `--level_name` 参数选择变体。*\n\n### 2. 训练智能体示例\n\nMelting Pot 不绑定特定的训练框架，但官方提供了一个基于 **RLlib** 的自博弈（self-play）训练示例。\n\n**第一步：安装示例依赖**\n```shell\ncd \u003Cmeltingpot_root>\npip install -r examples\u002Frequirements.txt\n```\n\n**第二步：运行训练脚本**\n```shell\ncd examples\u002Frllib\npython self_play_train.py\n```\n\n*注意：此脚本仅作为用法演示，并非为了在该测试套件中获得高分而优化的最佳实践。*\n\n### 3. 评估智能体\n\n如果你已经训练好了模型（SavedModel 格式），可以使用官方提供的评估库进行测试。详细的评估结果和分析可参考官方的 [Evaluation Notebook](https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fdeepmind\u002Fmeltingpot\u002Fblob\u002Fmain\u002Fnotebooks\u002Fevaluation_results.ipynb)。","某自动驾驶研发团队正在训练多智能体协作系统，旨在让无人配送车在复杂路口与人类及其他车辆高效互动。\n\n### 没有 meltingpot 时\n- 团队只能依赖少量自定义的简单场景进行测试，无法覆盖欺骗、互信、僵持等复杂的社交博弈情况。\n- 训练出的车辆在遇到未曾见过的“陌生”交通参与者行为时经常死机或发生碰撞，泛化能力极差且难以量化。\n- 缺乏统一的评估标准，不同算法模型之间的优劣只能靠肉眼观察回放，无法通过客观分数进行排名和迭代。\n- 自行构建包含 50 种以上交互逻辑的测试环境耗时数月，严重拖慢了核心算法的研发进度。\n\n### 使用 meltingpot 后\n- 直接调用内置的 256 个独特测试场景，瞬间覆盖合作、竞争、互惠等多种高难度社交互动考验。\n- 利用预留的“持出”测试集精准评估车辆与陌生个体互动的表现，快速定位并修复了泛化性不足的缺陷。\n- 获得标准化的综合评分，能够清晰地将新旧算法在同一维度下排名，明确技术迭代的实际收益。\n- 基于现成的 50 多种多智能体游戏基底（substrates）立即开始训练，将环境搭建时间从数月缩短至几天。\n\nmeltingpot 通过提供标准化的复杂社交测试基准，将多智能体强化学习的评估从“主观定性”转变为“客观定量”，大幅加速了通用型智能体的研发进程。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fgoogle-deepmind_meltingpot_88526947.png","google-deepmind","Google DeepMind","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fgoogle-deepmind_06b1dd17.png","",null,"https:\u002F\u002Fwww.deepmind.com\u002F","https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind",[84,88,92,96,100],{"name":85,"color":86,"percentage":87},"Python","#3572A5",71.1,{"name":89,"color":90,"percentage":91},"Lua","#000080",28,{"name":93,"color":94,"percentage":95},"Jupyter Notebook","#DA5B0B",0.7,{"name":97,"color":98,"percentage":99},"Shell","#89e051",0.1,{"name":101,"color":102,"percentage":103},"Dockerfile","#384d54",0,811,154,"2026-04-03T20:35:07","Apache-2.0","Linux","未说明（基于 DeepMind Lab2D，通常依赖 CPU 或通用 GPU 加速，具体取决于渲染后端配置）","未说明",{"notes":112,"python":113,"dependencies":114},"该工具核心依赖 DeepMind Lab2D，官方提供预编译的 wheel 包，但仅支持特定平台（通常为 Linux）。如果当前环境没有适用的 dmlab2d 预编译包，则需要从源代码手动构建。开发建议使用 GitHub Codespaces 以确保环境一致性。示例训练脚本依赖 RLlib，需额外安装 examples\u002Frequirements.txt 中的依赖。","3.8+",[115,116,117,118,119],"dm-meltingpot","dmlab2d","tensorflow (用于 SavedModel 评估)","rllib (示例依赖)","pytest (开发依赖)",[15],[122],"multiagent-reinforcement-learning","2026-03-27T02:49:30.150509","2026-04-06T09:46:56.672122",[126,131,136,141,146,150,154],{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},18274,"在 Apple M1 Mac 上安装时出现 'ModuleNotFoundError: No module named dmlab2d.dmlab2d_pybind' 错误怎么办？","这通常是因为缺少必要的资产数据文件。请确保使用项目根目录下的 `install.sh` 脚本进行安装，该脚本会自动下载缺失的资产数据。如果手动构建，请检查是否运行了脚本中下载资产的步骤（参考 install.sh 第 86 行）。更新版本的 `install.sh` 和 `setup.py` 已修复了大部分此类初始安装问题。","https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fissues\u002F46",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},18275,"Melting Pot 模拟运行速度过慢，有什么优化建议吗？","模拟速度取决于具体的子环境（substrate），部分复杂环境（如化学反应类）本身计算量较大。维护者表示新版本即将发布，可能会包含性能改进。目前建议关注官方发布的最新版本，并确认是否使用了优化的构建配置（如 `-c opt`）。对于特定慢速环境，暂时缺乏通用的代码级加速补丁，需等待官方更新。","https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fissues\u002F7",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},18276,"设置 sprite size 为 1 时出现 'Error occured when setting sprite ... to Shape: [1, 1, 0] Empty' 错误如何解决？","这是一个已知问题，已在 `dmlab2d` 库的特定提交中修复。请确保您安装的 `dmlab2d` 版本包含了提交 `94e37d189aee8d309bc1dfae7227676c77636e88` 或更新的版本。如果问题依旧，请尝试重新构建 `dmlab2d`  wheel 包或从源码安装最新的 `lab2d` 主分支。","https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fissues\u002F112",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},18277,"运行时出现 'ModuleNotFoundError: No module named meltingpot.python' 错误是什么原因？","这通常是因为安装方式不正确，导致 `meltingpot\u002Fpython` 目录未被识别为 Python 包。请确保在项目根目录下正确执行了安装命令（通常是 `pip install -e .` 或运行提供的安装脚本），而不是直接将目录添加到 PYTHONPATH。检查虚拟环境中的 `site-packages\u002Fmeltingpot\u002F` 目录下是否存在 `python` 子目录及其 `__init__.py` 文件。如果缺失，请重新运行安装流程。","https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fissues\u002F14",{"id":147,"question_zh":148,"answer_zh":149,"source_url":145},18278,"如何在 Melting Pot 中启动人类玩家试玩模式？","可以使用提供的脚本来启动人类玩家界面。例如，运行 `python3 meltingpot\u002Fpython\u002Fhuman_players\u002Fplay_clean_up.py` 或 `python3 meltingpot\u002Fpython\u002Fhuman_players\u002Fplay_commons_harvest.py --level_name \u003C关卡名称>`。请确保已正确安装所有依赖项（包括 `dmlab2d` 和资产文件），并且当前终端环境已激活对应的虚拟环境。",{"id":151,"question_zh":152,"answer_zh":153,"source_url":130},18279,"在 macOS ARM64 (M1\u002FM2) 架构上如何正确构建 dmlab2d wheel 包？","在 M1 Mac 上，需要使用 Bazel 进行构建。推荐命令为：`bazel build -c opt --config=lua5_2 \u002F\u002Fdmlab2d:dmlab2d_wheel`。构建成功后，wheel 文件将位于 `bazel-bin\u002Fdmlab2d\u002F` 目录下（文件名类似 `dmlab2d-1.0-cp39-cp39-macosx_12_0_arm64.whl`）。之后需通过 pip 安装该 wheel 文件，并确保 Python 环境与构建时的版本一致（如 cp39 对应 Python 3.9）。",{"id":155,"question_zh":156,"answer_zh":157,"source_url":130},18280,"运行 pytest 测试时遇到 'AVAILABLE_MODEL' 相关错误或找不到文件夹怎么办？","这通常是因为测试所需的资产文件或配置未正确加载。首先确认已运行 `install.sh` 以下载所有必要资产。其次，检查是否在正确的目录（项目根目录）下运行 pytest 命令。如果问题出现在特定的 bot 配置测试中，可能是由于模型文件路径配置问题，请确保环境变量或配置文件指向了正确的资产目录。",[159,164,169,174,179,184,189,194,199,204,209,214,219,224],{"id":160,"version":161,"summary_zh":162,"released_at":163},108831,"v2.4.0","### 变更\r\n\r\n- 将主题拆分，并为 VideoSubject 添加更多检查\r\n- 更新 OpenCV 的支持版本\r\n\r\n### 修复\r\n\r\n- [#246](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fissues\u002F246)\r\n    - 修复 `clean_up_20`，使其使用正确的木偶机器人\r\n    - 删除 territory__rooms_6，因为它与 territory__rooms_5 重复","2024-12-19T12:22:13",{"id":165,"version":166,"summary_zh":167,"released_at":168},108832,"v2.3.1","将 Melting Pot 版本更新至 2.3.1。\n\n# 新增\n\n- 2023 年 NeurIPS 混合锅竞赛的最终结果。\n- 更新了评估笔记本，以使用新的竞赛结果。","2024-07-02T08:55:44",{"id":170,"version":171,"summary_zh":172,"released_at":173},108833,"v2.3.0","## [2.3.0] - 2024-06-27\n\n### 新增\n\n- 在 NeurIPS 2023 的 Melting Pot 比赛中使用的新场景、木偶和机器人。\n\n### 已知问题\n\n- 比赛中的两个场景设置错误。跟踪 issue：\n  https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fissues\u002F246\n    * `clean_up_20` 使用了错误的（木偶）机器人：\n      `clean_up__puppet_sanctioning_alternator_nice_0`，而非\n      `clean_up__puppet_sanctioning_alternator_0`。\n    * `territory__rooms_6` 与 `territory__rooms_5` 完全相同。\n\n","2024-06-28T10:10:10",{"id":175,"version":176,"summary_zh":177,"released_at":178},108834,"v2.2.2","### 修复\r\n\r\n- 更新 setup.py，使其能兼容较旧版本的 setuptools（修复了 2.2.1 版本的发布问题）。","2024-03-20T02:55:25",{"id":180,"version":181,"summary_zh":182,"released_at":183},108835,"v2.2.1","### 变更\n\n- 不允许在 Transform 对象中使用 `orientation = None`\n- 改进 territory__* 的文档\n- 改进场景标签\n- 将 puppeteers 的测试工具移至 testing 目录\n- 移除对 chex 的限制\n- 更新 setup.py，使其兼容较旧版本的 setuptools\n- 在 setup.py 中添加开发工具\n- 将 pytest-xdist 添加为必需插件\n- 更新 pylintrc\n\n### 修复\n\n- 调试观测会破坏隐藏议程 [#168](https:\u002F\u002Fgithub.com\u002Fgoogle-deepmind\u002Fmeltingpot\u002Fissues\u002F168)\n- 各种 lint 错误\n\n### 移除\n\n- 残留的 v1 文件：reaction_graph_utils.py\n- 移除 1.0 版本遗留的过时文档","2024-03-20T00:07:02",{"id":185,"version":186,"summary_zh":187,"released_at":188},108836,"v2.2.0","### 变更\n\n- 使 meltingpot 可通过 `pip` 安装。\n- 支持使用 `import meltingpot` 作为 `import meltingpot.python` 的别名。\n- 将最低 Python 版本提升至 Python 3.10。\n- 在执行 `pip install .` 时一同安装资源文件。\n- 更新 Dockerfile 和开发工具链（pytest、pyink、pytype、pylint、isort）。\n- 更新示例以兼容 v2 版本。\n- 在 README.md 中更新安装说明。\n- 从 rx 迁移到 reactivex。\n\n### 修复\n\n- 移除 dtype 的类型注解。\n- 在 play_hidden_agenda 中使用正确的角色。\n- 修复导致类型错误的空操作。\n- 补充缺失的 `__init__.py` 文件。\n- 为未定义朝向的对象设置默认朝向为 NORTH。\n\n### 新增\n\n- 评估工具。","2023-07-25T22:36:41",{"id":190,"version":191,"summary_zh":192,"released_at":193},108837,"v2.1.1","### 变更\n\n- 将 `COLLECTIVE_RETURN` 添加到 `PERMITTED_OBSERVATIONS` 中。\n- 将 `install.sh` 脚本拆分为三个脚本。\n- 从 `yapf` 切换到 `black`。\n- 移除调试观测，以加快环境步进速度。\n\n### 修复\n\n- 为 `unpack` 添加 Lua 5.2 兼容性。\n\n### 移除\n\n- 之前 v1 机器人所需的 SubstrateWrappers。\n\n### 新增\n\n- 用于可视化评估结果的 Colab 笔记本。\n- 示例的测试用例。\n- 用于测试的特定底板和场景的模拟对象。\n- 用于设置 `world.rgb` 规范的辅助函数。","2023-03-16T13:00:21",{"id":195,"version":196,"summary_zh":197,"released_at":198},108838,"v2.1.0","### 变更\n\n- 改进 `SavedModelPolicy` 中的调试信息。\n- 在场景剧集开始时对智能体进行重采样。\n\n### 修复\n\n- 在其他组件之前初始化 `Transform`（[#84](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fissues\u002F84)、[#24](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fissues\u002F24)）。\n\n### 新增\n\n- 新的基底“隐藏议程”及其场景。","2022-12-09T10:31:58",{"id":200,"version":201,"summary_zh":202,"released_at":203},108839,"v2.0.0","Melting Pot 2.0.0 版本发布。有关新底板、机器人和场景的详细信息，请参阅 [Melting Pot 2.0 技术报告](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.13746)。\n\n### 变更\n\n- 移除了所有 v1 版本的场景、机器人和底板，并替换为新版本。\n- 场景现在支持异构角色，这些角色必须在构建时指定。\n- 对 `examples` 及其文档进行了多项改进。\n\n### 新增\n\n- 新的操控器和策略，用于实现新机器人。\n- 用于处理精灵、颜色和地图的实用工具。\n- 用于测试的模拟对象。","2022-11-26T01:58:32",{"id":205,"version":206,"summary_zh":207,"released_at":208},108840,"v1.0.4","### 变更\n\n- 停止对 Python 3.7 和 3.8 的支持。\n- 将保存的模型存储在 Google Cloud Platform 上，而非 Git 仓库中。\n- 部分基底环境的速度提升至原来的两倍。\n- 改进了 `install.sh` 脚本和安装文档。\n- 对 `examples` 及其文档进行了多项优化。\n\n### 修复\n\n- 在场景中，智能体之间会共享状态。[#70](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fissues\u002F70)\n- 修复了 RLlib 示例中的多个问题。\n\n### 新增\n\n- 为项目添加了 `.devcontainer` 配置。\n- 新增了 `pettingzoo` 示例。\n- 提供了与 TensorFlow 1 兼容的 `SavedModelPolicy` 版本。\n","2022-08-23T18:28:59",{"id":210,"version":211,"summary_zh":212,"released_at":213},108841,"v1.0.3","\r\n### Changed\r\n\r\n- Define `is_focal` is in scenario configs.\r\n- Use `chex.dataclass` for [dm-tree](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Ftree) compatibility.\r\n\r\n### Fixed\r\n\r\n- Use correct `is_focal` settings for team-vs-team games [#16](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fissues\u002F16).","2022-03-04T00:10:38",{"id":215,"version":216,"summary_zh":217,"released_at":218},108842,"v1.0.2","### Added\r\n\r\n- Substrates and Scenarios now have ReactiveX observables.\r\n\r\n### Changed\r\n\r\n- Don't add `INVENTORY` observation to scenarios that don't use it.\r\n- Various updates to RLlib example.\r\n- Improved performance of the component system for environments.\r\n\r\n### Fixed\r\n\r\n- Simulation Speed [#7](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fissues\u002F7)\r\n- Horizon setting in examples [#9](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fissues\u002F9)\r\n- Error running example \"self_play_train.py\" [#10](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fissues\u002F10)\r\n- build lab2d on m1 chip [#13](https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fissues\u002F13)\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fcommits\u002Fv1.0.2","2022-02-23T20:31:33",{"id":220,"version":221,"summary_zh":222,"released_at":223},108843,"v1.0.1","Submitted a number of fixes to ensure substrates and scenarios operate as intended. Other changes not expected to have any impact.\r\n\r\n**Fixed**:\r\n- Python seed is not forwarded to Lua #4\r\n- Second episode using same seed as the first #5\r\n- Bots receive incorrect timesteps in Scenario #3\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fcommits\u002Fv1.0.1","2021-10-05T14:24:09",{"id":225,"version":226,"summary_zh":227,"released_at":228},108844,"v1.0.0","Initial release.\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Fdeepmind\u002Fmeltingpot\u002Fcommits\u002Fv1.0.0","2021-10-05T14:26:25"]