[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"tool-py499372727--AgentSims":3,"similar-py499372727--AgentSims":103},{"id":4,"github_repo":5,"name":6,"description_en":7,"description_zh":8,"ai_summary_zh":8,"readme_en":9,"readme_zh":10,"quickstart_zh":11,"use_case_zh":12,"hero_image_url":13,"owner_login":14,"owner_name":15,"owner_avatar_url":16,"owner_bio":17,"owner_company":18,"owner_location":18,"owner_email":18,"owner_twitter":18,"owner_website":18,"owner_url":19,"languages":20,"stars":37,"forks":38,"last_commit_at":39,"license":40,"difficulty_score":41,"env_os":42,"env_gpu":43,"env_ram":43,"env_deps":44,"category_tags":52,"github_topics":18,"view_count":57,"oss_zip_url":18,"oss_zip_packed_at":18,"status":58,"created_at":59,"updated_at":60,"faqs":61,"releases":102},8477,"py499372727\u002FAgentSims","AgentSims","AgentSims is an easy-to-use infrastructure for researchers from all disciplines to test the specific capacities they are interested in.","AgentSims 是一个专为大语言模型（LLM）评估打造的开源沙盒平台。当前，传统的模型评估方法常受限于测试场景单一、基准易被“刷题”以及指标不够客观等问题。AgentSims 创新性地提出基于任务的评估范式，让 AI 智能体在高度仿真的虚拟环境中完成具体任务，从而更全面、真实地衡量模型能力。\n\n该平台主要面向科研人员及开发者，尤其是需要跨学科验证特定模型能力的研究团队。用户无需深厚的工程背景，即可通过直观的图形界面添加智能体与建筑来构建自定义评估任务；同时也支持开发者通过少量代码快速部署新的记忆系统或规划机制等底层模块。\n\nAgentSims 的核心亮点在于其极高的灵活性与定制化能力。不同于封闭的评测集，它允许用户从零搭建专属测试场景，有效解决了现有评估体系难以覆盖长尾需求的问题。系统基于 Python 开发，依赖 MySQL 进行数据存储，并提供详细的文档支持私有模型部署。无论是想快速验证想法的研究者，还是希望深入探索智能体协作机制的工程师，AgentSims 都提供了一个稳定、开放且易于扩展的实验基础设施。","# AgentSims: An Open-Source Sandbox for Large Language Model Evaluation\nHow to evaluate the ability of large language models (LLM) is an open question after ChatGPT-like LLMs prevailing the community. Existing evaluation methods suffer from following shortcomings: (1) constrained evaluation abilities, (2) vulnerable benchmarks, (3) unobjective metrics. We suggest that task-based evaluation, where LLM agents complete tasks in a simulated environment, is a one-for-all solution to solve above problems. \n\nWe present \u003Ca href=\"https:\u002F\u002Fwww.agentsims.com\u002F\" title=\"AgentSims\">AgentSims\u003C\u002Fa>, an easy-to-use infrastructure for researchers from all disciplines to test the specific capacities they are interested in. Researchers can build their evaluation tasks by adding agents and buildings on an interactive GUI or deploy and test new support mechanisms, i.e. memory system and planning system, by a few lines of codes.  The demonstration is on https:\u002F\u002Fagentsims.com\u002F.\n\n***Our system has better customization capabilities compared to other similar systems, as it is designed for open source custom task building. See our \u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.04026\" title=\"arXiv\">arXiv paper\u003C\u002Fa>.*** \n\n![Image text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fpy499372727_AgentSims_readme_63055e241ead.png)\n\n## Dependency\n```\nPython: 3.9.x\nMySQL: 8.0.31\n```\nWe recommend deploying on MacOS or Linux for better stability.\n\n## API Key\nFor the security of your API Key, we have not included the parameter file in git. Please create the following file\n```\nconfig\u002Fapi_key.json\n``` \nyourself and remember not to push it to git.\n\nThe file parameter example is:\n```\n{\"gpt-4\": \"xxxx\", \"gpt-3.5\": \"xxxx\"}\n``` \nIf you want to deploy your own model, see \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fwiki\" title=\"DOCS\">DOCS\u003C\u002Fa>.\n\n## Folder Creation\nBefore running, please\n```\nmkdir snapshot\nmkdir logs\n```\nIn addition, we recommend modifying the ***count_limit*** (number of loops per run) and ***cooldown*** (cooldown time between runs) in ***config\u002Fapp.json*** to suitable values before running, in order to balance protection of your API key and experiment runtime efficiency.\n\nIf you encounter any issues during runtime, please first refer to our \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fwiki\" title=\"DOCS\">DOCS\u003C\u002Fa> in the wiki. If not resolved, please raise an issue or contact us directly.\n\n--------------------------------------\nTo use our system, please follow these steps:\n\n## 1.MySQL Init\nMySQL is used for data storage on the server. After installing the appropriate version of MySQL, start the SQL service and initialize it as follows:\n```\nuse mysql\nALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY '';\nflush privileges;\n\ncreate database `llm_account` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game0001` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game0002` default character set utf8mb4 collate utf8mb4_unicode_ci;\n```\n\n## 2.Install\n\n```bash\npip install tornado\npip install mysql-connector-python\npip install websockets\npip install openai_async\n```\n\nor\n```bash\npip install -r requirements.txt\n```\n## 3.Design Tasks\nYou can build tasks at this point. If you just want to try out the system first, you can skip this step. For task building, please refer to the \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fwiki\" title=\"DOCS\">DOCS\u003C\u002Fa> in the wiki or Section 4.2 Developer Mode in our \u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.04026\" title=\"arXiv\">arXiv paper\u003C\u002Fa>.\n\n## 4.Run Server\n\nStart server:\n```bash\n.\u002Frestart.sh\n```\nWhen you see\n```\n--------Server Started--------\n```\nin Server Terminal, the server has been started successfully.\n## 5.Run Client\nOnce the server has started successfully, please launch the client. In the current version, we provide a web-based client. Please open ***client\u002Findex.html*** in your browser.\n\nNote: Sometimes the web client fails to open correctly. We recommend right-clicking the ***index.html*** in your python IDE and select ***open in browser***. If you are familiar with ***nginx***, that is also a great choice. \n\nWhen you see\n```\nsomebody linked.\n```\nin Server Terminal, the client has been started successfully.\n\n## 6.Create agents and buildings\nYou can create agents and buildings at this point. For creation, please refer to the \u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fwiki\" title=\"DOCS\">DOCS\u003C\u002Fa> in the wiki or Section 4.1 User Mode in our \u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.04026\" title=\"arXiv\">arXiv paper\u003C\u002Fa>. \n\n## 7.Set Evaluation Target and Measurements\nIn AgentSims, evaluation are made by QA forms. Every k ticks, system would ask the subject agent an evaluation question. You can customize your subject agent, evaluation question, measurement of response in config\u002Feval.json \nThe example in config\u002Feval.json shows an experiment called 'know pH'. The experiment will ask agent Alan 'Are you acquainted with pH' every 1 tick and if 'Yes' in response, the eval function will return True.\n```\n{\n  \"id\": \"know pH\", # the human-readable name of evaluation, \n  \"target_nickname\": \"Alan\", # name of the subject agent\n  \"query\": \"Are you acquainted with pH ?\", # evaluation qustion \n  \"measurement\": \" 'Yes' in response\" # measurement, \n  \"interval\": 1 # Evaluate every 1 tick\n}\n\n```\n\n## 8.Run Simulation\n\nYou can start ***tick*** or ***mayor*** with the buttons on the web client. You can also\nstart with:\n```bash\npython -u tick.py\n```\n```bash\npython -u mayor.py\n```\n\nFor the difference with ***tick*** and ***mayor***, refer to our \u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.04026\" title=\"arXiv\">arXiv paper\u003C\u002Fa>.\n\n## 9.Restart\nThe following reset steps need to be performed each time upon restarting:\n```\n  rm -rf snapshot\u002Fapp.json\n```\n```\n  sudo mysql\n  drop database llm_account;\n  drop database llm_game0001;\n  create database `llm_game0001` default character set utf8mb4 collate utf8mb4_unicode_ci;\n  create database `llm_account` default character set utf8mb4 collate utf8mb4_unicode_ci;\n```\n```\n .\u002Frestart.sh\n```\n-------------------------------\n## Authors and Citation\n***Authors***: Jiaju Lin,\u003Ca href=\"https:\u002F\u002Ftwitter.com\u002Fzhaohao919041\" title=\"twitter\">Haoran Zhao\u003C\u002Fa>*,Aochi Zhang,Yiting Wu, Huqiuyue Ping,Qin Chen\n\n***About Us***: PTA Studio is a startup company dedicated to providing a better open source architecture for the NLP community and more interesting AI games for players.\n\n***Contact Us***: zhaohaoran@buaa.edu.cn\n\nPlease cite our paper if you use the code or data in this repository.\n```\n@misc{lin2023agentsims,\n      title={AgentSims: An Open-Source Sandbox for Large Language Model Evaluation}, \n      author={Jiaju Lin and Haoran Zhao and Aochi Zhang and Yiting Wu and Huqiuyue Ping and Qin Chen},\n      year={2023},\n      eprint={2308.04026},\n      archivePrefix={arXiv},\n      primaryClass={cs.AI}\n}\n```","# AgentSims：用于大型语言模型评估的开源沙盒\n在类似ChatGPT的大型语言模型风靡整个社区之后，如何评估这些模型的能力仍是一个开放性问题。现有的评估方法存在以下不足：(1) 评估能力受限；(2) 基准测试容易被攻破；(3) 指标不够客观。我们提出，基于任务的评估——即让LLM智能体在模拟环境中完成任务——是一种能够一劳永逸地解决上述问题的方法。\n\n我们推出了\u003Ca href=\"https:\u002F\u002Fwww.agentsims.com\u002F\" title=\"AgentSims\">AgentSims\u003C\u002Fa>,这是一个易于使用的基础设施，供各学科的研究人员测试他们感兴趣的特定能力。研究人员可以通过在交互式GUI上添加智能体和建筑物来构建自己的评估任务，也可以通过几行代码部署并测试新的支持机制，例如记忆系统和规划系统。演示地址为：https:\u002F\u002Fagentsims.com\u002F。\n\n***与其他类似系统相比，我们的系统具有更强的定制化能力，因为它专为开源自定义任务构建而设计。详情请参阅我们的\u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.04026\" title=\"arXiv\">arXiv论文\u003C\u002Fa>。***\n\n![Image text](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fpy499372727_AgentSims_readme_63055e241ead.png)\n\n## 依赖项\n```\nPython: 3.9.x\nMySQL: 8.0.31\n```\n为了获得更好的稳定性，我们建议在MacOS或Linux上进行部署。\n\n## API密钥\n为确保您的API密钥安全，我们未将参数文件纳入git仓库。请自行创建以下文件：\n```\nconfig\u002Fapi_key.json\n``` \n并务必不要将其推送到git仓库。\n\n文件参数示例如下：\n```\n{\"gpt-4\": \"xxxx\", \"gpt-3.5\": \"xxxx\"}\n``` \n如果您希望部署自己的模型，请参阅\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fwiki\" title=\"DOCS\">DOCS\u003C\u002Fa>。\n\n## 文件夹创建\n在运行之前，请执行以下命令：\n```\nmkdir snapshot\nmkdir logs\n```\n此外，我们建议在运行前修改***config\u002Fapp.json***中的***count_limit***（每次运行的循环次数）和***cooldown***（两次运行之间的冷却时间），以找到合适的值，从而在保护您的API密钥和提高实验运行效率之间取得平衡。\n\n如果在运行过程中遇到任何问题，请首先参考wiki中的\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fwiki\" title=\"DOCS\">DOCS\u003C\u002Fa>。若问题仍未解决，请提交issue或直接联系我们。\n\n--------------------------------------\n要使用我们的系统，请按照以下步骤操作：\n\n## 1.MySQL初始化\nMySQL用于服务器端的数据存储。安装适当版本的MySQL后，启动SQL服务并按如下方式初始化：\n```\nuse mysql\nALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY '';\nflush privileges;\n\ncreate database `llm_account` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game0001` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game0002` default character set utf8mb4 collate utf8mb4_unicode_ci;\n```\n\n## 2.安装\n```bash\npip install tornado\npip install mysql-connector-python\npip install websockets\npip install openai_async\n```\n或者\n```bash\npip install -r requirements.txt\n```\n## 3.设计任务\n此时您可以开始构建任务。如果您只是想先试用一下系统，可以跳过此步骤。有关任务构建，请参阅wiki中的\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fwiki\" title=\"DOCS\">DOCS\u003C\u002Fa>，或我们\u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.04026\" title=\"arXiv\">arXiv论文\u003C\u002Fa>中第4.2节“开发者模式”。\n\n## 4.运行服务器\n启动服务器：\n```bash\n.\u002Frestart.sh\n```\n当您在服务器终端看到\n```\n--------Server Started--------\n```\n时，说明服务器已成功启动。\n\n## 5.运行客户端\n服务器成功启动后，请启动客户端。当前版本提供基于网页的客户端。请在浏览器中打开***client\u002Findex.html***。\n\n注意：有时网页客户端可能无法正确打开。我们建议在您的Python IDE中右键单击***index.html***，然后选择“在浏览器中打开”。如果您熟悉***nginx***，这也是一个不错的选择。\n\n当您在服务器终端看到\n```\nsomebody linked.\n```\n时，说明客户端已成功启动。\n\n## 6.创建智能体和建筑物\n此时您可以创建智能体和建筑物。有关创建方法，请参阅wiki中的\u003Ca href=\"https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fwiki\" title=\"DOCS\">DOCS\u003C\u002Fa>，或我们\u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.04026\" title=\"arXiv\">arXiv论文\u003C\u002Fa>中第4.1节“用户模式”。\n\n## 7.设置评估目标和指标\n在AgentSims中，评估是通过问答形式进行的。每k个tick，系统会向目标智能体提出一个评估问题。您可以在config\u002Feval.json中自定义目标智能体、评估问题以及响应的衡量标准。config\u002Feval.json中的示例展示了一个名为“了解pH”的实验。该实验将每1个tick询问智能体Alan：“你是否了解pH？”如果回答为“是”，则评估函数将返回True。\n```\n{\n  \"id\": \"know pH\", # 评估的易读名称，\n  \"target_nickname\": \"Alan\", # 目标智能体的名称\n  \"query\": \"Are you acquainted with pH ?\", # 评估问题\n  \"measurement\": \" 'Yes' in response\" # 衡量标准，\n  \"interval\": 1 # 每1个tick评估一次\n}\n\n```\n\n## 8.运行模拟\n您可以通过网页客户端上的按钮启动***tick***或***mayor***。您也可以通过以下命令启动：\n```bash\npython -u tick.py\n```\n```bash\npython -u mayor.py\n```\n\n关于***tick***和***mayor***的区别，请参阅我们的\u003Ca href=\"https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.04026\" title=\"arXiv\">arXiv论文\u003C\u002Fa>。\n\n## 9.重启\n每次重启时，都需要执行以下重置步骤：\n```\n  rm -rf snapshot\u002Fapp.json\n```\n```\n  sudo mysql\n  drop database llm_account;\n  drop database llm_game0001;\n  create database `llm_game0001` default character set utf8mb4 collate utf8mb4_unicode_ci;\n  create database `llm_account` default character set utf8mb4 collate utf8mb4_unicode_ci;\n```\n```\n .\u002Frestart.sh\n```\n-------------------------------\n## 作者及引用\n***作者***：Jiaju Lin,\u003Ca href=\"https:\u002F\u002Ftwitter.com\u002Fzhaohao919041\" title=\"twitter\">Haoran Zhao\u003C\u002Fa>*,Aochi Zhang,Yiting Wu, Huqiuyue Ping,Qin Chen\n\n***关于我们***：PTA Studio是一家初创公司，致力于为NLP社区提供更优秀的开源架构，并为玩家带来更多有趣的AI游戏。\n\n***联系我们***：zhaohaoran@buaa.edu.cn\n\n如果您使用了本仓库中的代码或数据，请引用我们的论文。\n```\n@misc{lin2023agentsims,\n      title={AgentSims: An Open-Source Sandbox for Large Language Model Evaluation}, \n      author={Jiaju Lin and Haoran Zhao and Aochi Zhang and Yiting Wu and Huqiuyue Ping and Qin Chen},\n      year={2023},\n      eprint={2308.04026},\n      archivePrefix={arXiv},\n      primaryClass={cs.AI}\n}\n```","# AgentSims 快速上手指南\n\nAgentSims 是一个开源的大语言模型（LLM）评估沙盒。它允许研究人员在模拟环境中通过任务驱动的方式，自定义智能体（Agents）和建筑（Buildings），以客观评估 LLM 的各项能力。\n\n## 1. 环境准备\n\n**系统要求**\n- **操作系统**：推荐 macOS 或 Linux（以获得更好的稳定性）。\n- **Python**：3.9.x\n- **数据库**：MySQL 8.0.31\n\n**前置依赖**\n请确保已安装上述版本的 Python 和 MySQL，并启动 MySQL 服务。\n\n## 2. 安装步骤\n\n### 2.1 配置 API Key\n出于安全考虑，项目中未包含 API 密钥文件。请在项目根目录下手动创建 `config\u002Fapi_key.json` 文件，并填入你的模型密钥（切勿提交到 Git）：\n\n```json\n{\"gpt-4\": \"xxxx\", \"gpt-3.5\": \"xxxx\"}\n```\n*注：若需部署自有模型，请参考项目 Wiki 文档。*\n\n### 2.2 初始化目录\n在项目根目录下运行以下命令创建必要文件夹：\n\n```bash\nmkdir snapshot\nmkdir logs\n```\n\n### 2.3 初始化 MySQL 数据库\n登录 MySQL 并执行以下 SQL 语句以初始化所需数据库：\n\n```sql\nuse mysql\nALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY '';\nflush privileges;\n\ncreate database `llm_account` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game0001` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_game0002` default character set utf8mb4 collate utf8mb4_unicode_ci;\n```\n\n### 2.4 安装 Python 依赖\n建议使用国内镜像源加速安装（如清华源）：\n\n```bash\npip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n或者手动安装核心依赖：\n\n```bash\npip install tornado mysql-connector-python websockets openai_async -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n### 2.5 调整配置（可选）\n编辑 `config\u002Fapp.json`，根据实际需求修改 `count_limit`（单次运行循环次数）和 `cooldown`（运行间隔时间），以平衡 API 成本与实验效率。\n\n## 3. 基本使用\n\n### 3.1 启动服务端\n运行重启脚本启动服务器：\n\n```bash\n.\u002Frestart.sh\n```\n当终端显示 `--------Server Started--------` 时，表示服务端启动成功。\n\n### 3.2 启动客户端\n在浏览器中打开 `client\u002Findex.html`。\n*提示：若在 IDE 中直接打开失败，可右键选择\"Open in Browser\"或使用 Nginx 部署。*\n当服务端终端显示 `somebody linked.` 时，表示客户端连接成功。\n\n### 3.3 创建评估任务\n1. **创建实体**：在网页客户端界面中创建所需的 Agents（智能体）和 Buildings（建筑）。\n2. **配置评估指标**：编辑 `config\u002Feval.json` 定义评估逻辑。例如，以下配置将每隔 1 个时间步询问智能体 \"Alan\" 是否知道 pH 值：\n\n```json\n{\n  \"id\": \"know pH\",\n  \"target_nickname\": \"Alan\",\n  \"query\": \"Are you acquainted with pH ?\",\n  \"measurement\": \" 'Yes' in response\",\n  \"interval\": 1\n}\n```\n\n### 3.4 运行仿真\n你可以通过网页客户端点击按钮启动仿真，或在终端运行以下命令：\n\n```bash\npython -u tick.py\n```\n或\n```bash\npython -u mayor.py\n```\n\n### 3.5 重置环境（重新开始时必做）\n每次重新开始实验前，需清理快照并重置数据库：\n\n```bash\nrm -rf snapshot\u002Fapp.json\n```\n\n```bash\nsudo mysql\ndrop database llm_account;\ndrop database llm_game0001;\ncreate database `llm_game0001` default character set utf8mb4 collate utf8mb4_unicode_ci;\ncreate database `llm_account` default character set utf8mb4 collate utf8mb4_unicode_ci;\n```\n\n最后再次运行启动脚本：\n```bash\n.\u002Frestart.sh\n```","某高校认知科学实验室的研究团队正致力于评估大语言模型在复杂多轮对话中的长期记忆与规划能力，以验证其在心理治疗辅助场景下的表现。\n\n### 没有 AgentSims 时\n- **评测维度单一**：只能依赖静态数据集（如 MMLU）进行测试，无法模拟动态交互环境，难以考察模型在长周期任务中的持续表现。\n- **基准易被“作弊”**：现有公开基准容易因数据泄露导致模型“死记硬背”答案，无法客观反映真实的推理与泛化能力。\n- **定制开发门槛高**：若要构建特定的虚拟诊疗场景，需从零编写仿真环境代码和数据库逻辑，耗时数周且难以复用。\n- **指标主观性强**：缺乏统一的自动化评估框架，往往依赖人工打分，导致实验结果难以量化对比且效率低下。\n\n### 使用 AgentSims 后\n- **构建动态沙盒**：通过交互式 GUI 快速搭建包含“医生”与“患者”智能体的虚拟诊所，让模型在模拟的真实对话流中完成任务。\n- **杜绝数据污染**：采用基于任务的动态生成机制，每次测试场景参数随机变化，确保模型必须依靠实时推理而非背诵题库。\n- **低代码灵活定制**：仅需几行代码即可植入自定义的记忆系统或规划模块，或利用可视界面调整建筑与角色设定，半天内完成场景部署。\n- **客观量化评估**：系统自动记录完整交互日志并运行预设脚本，输出关于任务完成率、记忆准确度等客观指标，大幅提升实验信度。\n\nAgentSims 将原本繁琐的大模型评估工作转化为可灵活定制的动态沙盒实验，让研究人员能专注于核心能力验证而非底层基建搭建。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fpy499372727_AgentSims_d637ca57.png","py499372727","Haoran","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fpy499372727_4d591e24.jpg","Focus on LLM Application.",null,"https:\u002F\u002Fgithub.com\u002Fpy499372727",[21,25,29,33],{"name":22,"color":23,"percentage":24},"Python","#3572A5",97,{"name":26,"color":27,"percentage":28},"HTML","#e34c26",2.1,{"name":30,"color":31,"percentage":32},"CSS","#663399",0.6,{"name":34,"color":35,"percentage":36},"Shell","#89e051",0.3,944,120,"2026-04-12T01:02:24","MIT",4,"Linux, macOS","未说明",{"notes":45,"python":46,"dependencies":47},"必须安装并配置 MySQL 8.0.31，需手动创建特定数据库（llm_account, llm_game 等）；需自行创建 config\u002Fapi_key.json 文件配置 LLM API Key；运行前需手动创建 snapshot 和 logs 目录；重启服务时需执行特定的数据库重置脚本。","3.9.x",[48,49,50,51],"tornado","mysql-connector-python","websockets","openai_async",[53,54,55,56],"语言模型","开发框架","Agent","其他",2,"ready","2026-03-27T02:49:30.150509","2026-04-17T21:43:43.891340",[62,67,72,77,82,87,92,97],{"id":63,"question_zh":64,"answer_zh":65,"source_url":66},37951,"打开 index.html 后页面崩溃或不断刷新怎么办？","该问题通常是由 VSCode 的 Live Server 插件引起的。解决方案是不要使用 Live Server，而是通过部署客户端使用 http-server 来启动页面，这样问题即可解决。","https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fissues\u002F6",{"id":68,"question_zh":69,"answer_zh":70,"source_url":71},37952,"启动后小人不动、无法对话或报错 KeyError 怎么办？","这通常是数据库连接配置错误导致的。请检查 mysql.py 文件中的连接设置，确保将密码强制修改为您自己的 MySQL 密码（例如将密码字段改为您的实际密码），以解决 'Access denied' 错误并恢复小人行动和对话功能。","https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fissues\u002F2",{"id":73,"question_zh":74,"answer_zh":75,"source_url":76},37953,"NPC 不回复消息或返回 null 如何解决？","这个问题通常与 OpenAI API 的配置有关。请尝试更改代码中的 OpenAI API 链接（endpoint）或检查您的 API Key 是否正确，确保网络通畅且配额充足，修改后通常可以恢复正常聊天功能。","https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fissues\u002F4",{"id":78,"question_zh":79,"answer_zh":80,"source_url":81},37954,"前端提示\"WELLDONE Wallet is not initialized\"是什么意思？","这是一个前端钱包初始化相关的提示。根据社区反馈，该问题已被部分用户解决，但如果遇到角色无法长时间运行（即使点击 tick 或运行 tick.py），可能需要检查并调整代码中的 count_limit 和 cooldown 参数配置。","https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fissues\u002F7",{"id":83,"question_zh":84,"answer_zh":85,"source_url":86},37955,"如何在远程服务器部署时指定前端连接的服务器地址？","目前版本无法直接在前端配置文件中指定远程服务器地址，该设置硬编码在未开源的 Unity 源代码中。维护者计划在下一个版本（预计一个月左右）开源 Unity 客户端源码后解决此问题，届时将支持自定义服务器地址。","https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fissues\u002F8",{"id":88,"question_zh":89,"answer_zh":90,"source_url":91},37956,"Unity 客户端源码有计划开源吗？","由于团队目前对 Unity 引擎的熟悉程度有限，当前版本暂无开源计划。但预计在未来工作（大约一个月内）会开源 Unity 客户端，请关注项目的后续开发动态。","https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fissues\u002F5",{"id":93,"question_zh":94,"answer_zh":95,"source_url":96},37957,"默认 Agent 和建筑不加载，也无法自行创建是什么原因？","这通常不是项目本身的问题，而是由 ChatGPT API 调用失败引起的，具体原因包括网络连接问题或 API 配额限制。建议优先排查自身的网络环境和 API 配置，确保能正常调用 API。","https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fissues\u002F3",{"id":98,"question_zh":99,"answer_zh":100,"source_url":101},37958,"服务已启动但访问 localhost:8000 报 404 错误或页面无反应怎么办？","该问题多由本地环境配置差异引起。虽然具体个案已通过邮件沟通解决，但建议用户首先确认后端服务日志是否正常输出，检查端口占用情况，并确保前端文件路径配置正确。如遇此类问题，可查看其他类似 Issue 或联系维护者。","https:\u002F\u002Fgithub.com\u002Fpy499372727\u002FAgentSims\u002Fissues\u002F1",[],[104,115,123,131,141,149],{"id":105,"name":106,"github_repo":107,"description_zh":108,"stars":109,"difficulty_score":110,"last_commit_at":111,"category_tags":112,"status":58},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[55,54,113,114],"图像","数据工具",{"id":116,"name":117,"github_repo":118,"description_zh":119,"stars":120,"difficulty_score":110,"last_commit_at":121,"category_tags":122,"status":58},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[54,113,55],{"id":124,"name":125,"github_repo":126,"description_zh":127,"stars":128,"difficulty_score":57,"last_commit_at":129,"category_tags":130,"status":58},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",159267,"2026-04-17T11:29:14",[54,55,53],{"id":132,"name":133,"github_repo":134,"description_zh":135,"stars":136,"difficulty_score":137,"last_commit_at":138,"category_tags":139,"status":58},8272,"opencode","anomalyco\u002Fopencode","OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。\n\n这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。\n\n在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信",144296,1,"2026-04-16T14:50:03",[55,140],"插件",{"id":142,"name":143,"github_repo":144,"description_zh":145,"stars":146,"difficulty_score":57,"last_commit_at":147,"category_tags":148,"status":58},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[54,113,55],{"id":150,"name":151,"github_repo":152,"description_zh":153,"stars":154,"difficulty_score":57,"last_commit_at":155,"category_tags":156,"status":58},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[140,55,113,54]]