[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-Auromix--ROS-LLM":3,"tool-Auromix--ROS-LLM":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":75,"owner_avatar_url":76,"owner_bio":77,"owner_company":78,"owner_location":78,"owner_email":79,"owner_twitter":78,"owner_website":78,"owner_url":80,"languages":81,"stars":94,"forks":95,"last_commit_at":96,"license":97,"difficulty_score":98,"env_os":99,"env_gpu":100,"env_ram":101,"env_deps":102,"category_tags":111,"github_topics":112,"view_count":23,"oss_zip_url":78,"oss_zip_packed_at":78,"status":16,"created_at":117,"updated_at":118,"faqs":119,"releases":160},3563,"Auromix\u002FROS-LLM","ROS-LLM","ROS-LLM is a framework designed for embodied intelligence applications in ROS. It allows natural language interactions and leverages Large Language Models (LLMs) for decision-making and robot control. With an easy configuration process, this framework allows for swift integration, enabling your robot to operate with it in as little as ten minutes.","ROS-LLM 是一个专为 ROS（机器人操作系统）打造的具身智能框架，旨在让机器人能够“听懂”人类语言并自主执行任务。它通过集成 GPT-4、ChatGPT 等大语言模型，将自然的对话指令转化为具体的机器人决策与控制信号，从而解决了传统机器人交互方式生硬、编程控制门槛高以及难以灵活应对复杂场景的痛点。\n\n这款工具特别适合机器人开发者、科研人员以及希望快速验证具身智能应用的原型设计者使用。无论是学术探索还是工程落地，用户只需为机器人提供简单的功能接口，参照示例即可在十分钟内完成集成，大幅缩短了从想法到实物的开发周期。\n\nROS-LLM 的技术亮点在于其极高的灵活性与兼容性。它不仅支持基于大模型的运动规划与导航，还贴心地提供了云端与本地两种语音识别（ASR）方案：低算力的嵌入式设备可调用云服务减轻负担，而高性能主机则能利用本地部署实现更低延迟的响应。此外，框架内置了对话历史存储功能和丰富的教程案例，帮助用户轻松构建具备持续交互能力的智能机器人系统，让自然语言控制变得触手可及。","[![Official](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FOfficial%20-Auromix-blue?style=flat&logo=world&logoColor=white)](https:\u002F\u002Fgithub.com\u002FAuromix) &nbsp;\n[![ROS2 VERSION](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FROS-ROS%202%20Humble-brightgreen)](http:\u002F\u002Fdocs.ros.org\u002Fen\u002Fhumble\u002Findex.html) &nbsp;\n[![Ubuntu VERSION](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FUbuntu-22.04-green)](https:\u002F\u002Fubuntu.com\u002F) &nbsp; [![LICENSE](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-Apache--2.0-informational)](https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fblob\u002Fros2-humble\u002FLICENSE) &nbsp;\n[![GitHub Repo stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FAuromix\u002FROS-LLM?style=social)](https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fstargazers) &nbsp;\n[![Twitter Follow](https:\u002F\u002Fimg.shields.io\u002Ftwitter\u002Ffollow\u002FHermanye233?style=social)](https:\u002F\u002Ftwitter.com\u002FHermanye233) &nbsp;\n# ROS-LLM\nThe ROS-LLM project is a ROS framework for embodied intelligence applications. It enables natural language interactions and large model-based control of robot motion and navigation for any robot operating on ROS.\n\nROS-LLM empowers you to utilize functionalities based on Large Language Models, such as GPT-4 and ChatGPT, for robot decision-making and control. \n\nThis framework is designed to be easy to extend. By simply providing a function interface for your robot, following the provided example, you can integrate and use ROS-LLM within ten minutes. \n\nROS-LLM offers a simple solution for quickly creating interactive and control experiences with any robot.\n\n![Related Schematics](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAuromix_ROS-LLM_readme_a1ab47a7a28b.png)\n## 🚀 Features\n\n- 🤖 **ROS Integration**: Smoothly interacts with the Robot Operating System (ROS) for expansive robotic control. \n\n- 🧠 **Large Language Models Support**: Leverages GPT-4 and ChatGPT for enhanced decision-making and task management.\n\n- 🗣️ **Natural Interaction**: Facilitates intuitive communication with robots through conversational engagement.\n\n- 🔄 **Flexible Control**: Utilizes LLM-based systems for tasks such as motion and navigation based on language model interpretation.\n\n- 🔌 **Simplified Extensibility**: Provides an easy interface for seamless robot function integration. \n\n- 🛠️ **Quick Development**: Creates interactive robot control experiences swiftly, sometimes in under ten minutes.\n\n- 📚 **Instructional Examples**: Offers comprehensive tutorials and examples for easier understanding and implementation.\n\n- 🗃️ **History Storage**: Retains local chat histories for convenient review and reference.\n\n\n\n## 🔥 Quickstart Guide\n\nFollow the instructions below to set up ROS-LLM:\n\n**1. Clone the Repository:**\n\nUse the command below to clone the repository.\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM.git\n```\n\n**2. Install Dependencies:**\n\nNavigate to the `llm_install` directory and execute the installation script.\n```bash\ncd ROS-LLM\u002Fllm_install\nbash dependencies_install.sh\n```\n\n**3. Configure OpenAI Settings:**\n\nIf you don't have an OpenAI API key, you can obtain one from [OpenAI Platform](https:\u002F\u002Fplatform.openai.com). Use the script below to configure your OpenAI API key.\n```bash\ncd ROS-LLM\u002Fllm_install\nbash config_openai_api_key.sh\n```\n\n**4. Configure AWS Settings (Optional):**\n\nFor cloud natural interaction capabilities, configure the AWS settings. If you prefer to use local ASR, this step can be skipped.\n\nFor low-performance edge embedded platforms, it is recommended to use ASR cloud services to reduce computing pressure, and for high-performance personal hosts, it is recommended to use local ASR services to speed up response\n\n```bash\ncd ROS-LLM\u002Fllm_install\nbash config_aws.sh\n```\n\n**4. Configure OpenAI Whisper Settings (Optional):**\n\nFor local natural interaction capabilities, configure the OpenAI Whisper settings. If you prefer to use cloud ASR, this step can be skipped.\n\nFor low-performance edge embedded platforms, it is recommended to use ASR cloud services to reduce computing pressure, and for high-performance personal hosts, it is recommended to use local ASR services to speed up response\n```bash\npip install -U openai-whisper\npip install setuptools-rust\n```\n\n**5. Build the Workspace:**\n\nNavigate to your workspace directory and build the workspace.\n```bash\ncd \u003Cyour_ws>\nrosdep install --from-paths src --ignore-src -r -y  # Install dependencies\ncolcon build --symlink-install\n```\n\n**6. Run the Demo:**\n\nSource the setup script and launch the Turtlesim demo with cloud ASR.\n```bash\nsource \u003Cyour_ws>\u002Finstall\u002Fsetup.bash\nros2 launch llm_bringup chatgpt_with_turtle_robot.launch.py\n```\nstart listening\n```bash\nros2 topic pub \u002Fllm_state std_msgs\u002Fmsg\u002FString \"data: 'listening'\" -1\n```\n\n## ⚙️ Configure Your Own Robot (Optional)\n\nTo use the framework with your own robot, modify the `llm_robot` and `llm_config` packages to suit your robot's specifications. This allows you to customize the behavior of your robot.\n\n\n## 🧑‍💻 Future Development Plans\n\nWe are continuously striving to enhance ROS-LLM to better serve the developers and roboticists in the community. Below are the key developments we plan to undertake in the upcoming updates:\n\n- [ ] Agent Mechanism\n\nAdding an agent mechanism allows long sequence tasks to be well divided.\n\n- [ ] Feedback Channel from External Functions\n\nWe plan to add a feedback mechanism for the robot to receive information from external functions. This would significantly assist model-based decision-making processes.\n\n- [ ] Navigation Interface\n\nA new interface for robot navigation is also in the pipeline. It will enable the utilization of this framework in navigation-oriented tasks.\n\n- [ ] Sensor Input Interface\n\nThe addition of other sensor input interfaces is another major development. This will incorporate environmental perception into model decision premises, preparing for functionalities such as obstacle avoidance.\n\n- [ ] Integration with Vision-based Models like Palm-e\n\nWe aim to extend the capabilities of ROS-LLM by integrating models that allow for visual input, like Palm-e. This would enable the use of advanced computer vision technologies for better environment interaction.\n\n- [ ] Continuous Optimization\n\nLast but not least, we will focus on continuous optimization of the framework. We are committed to improving the rationality and extensibility of ROS-LLM to make it easier for developers to customize and extend the framework according to their needs.\n\nKeep an eye on this repo for updates. Your suggestions and contributions are always welcome!\n\n\n\n## 🙋 To user\nIf you find this project useful, please consider giving it a ⭐️ star on GitHub! Your support helps us improve the project and encourages further development. Don't forget to also share it with your friends and colleagues who might it beneficial. Thank you for your support! \n\n## 🏆 Contributing\nContributions are welcome! Please read the [contributing guidelines](CONTRIBUTING.md) before submitting a pull request.\n\n\n\n## 🪪 License\n```\nCopyright 2023 Herman Ye @Auromix\nLicensed under the Apache License, Version 2.0 (the \"License\");\nyou may not use this file except in compliance with the License.\nYou may obtain a copy of the License at\n    http:\u002F\u002Fwww.apache.org\u002Flicenses\u002FLICENSE-2.0\nUnless required by applicable law or agreed to in writing, software\ndistributed under the License is distributed on an \"AS IS\" BASIS,\nWITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.\nSee the License for the specific language governing permissions and\nlimitations under the License. \n```\n","[![官方](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FOfficial%20-Auromix-blue?style=flat&logo=world&logoColor=white)](https:\u002F\u002Fgithub.com\u002FAuromix) &nbsp;\n[![ROS2版本](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FROS-ROS%202%20Humble-brightgreen)](http:\u002F\u002Fdocs.ros.org\u002Fen\u002Fhumble\u002Findex.html) &nbsp;\n[![Ubuntu版本](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FUbuntu-22.04-green)](https:\u002F\u002Fubuntu.com\u002F) &nbsp; [![许可证](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-Apache--2.0-informational)](https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fblob\u002Fros2-humble\u002FLICENSE) &nbsp;\n[![GitHub仓库星标数](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FAuromix\u002FROS-LLM?style=social)](https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fstargazers) &nbsp;\n[![Twitter关注](https:\u002F\u002Fimg.shields.io\u002Ftwitter\u002Ffollow\u002FHermanye233?style=social)](https:\u002F\u002Ftwitter.com\u002FHermanye233) &nbsp;\n# ROS-LLM\nROS-LLM项目是一个用于具身智能应用的ROS框架。它使任何运行在ROS上的机器人能够实现自然语言交互，并基于大型模型进行机器人运动和导航控制。\n\nROS-LLM使您能够利用基于大型语言模型的功能，例如GPT-4和ChatGPT，来进行机器人决策和控制。\n\n该框架设计易于扩展。只需按照提供的示例为您的机器人提供一个函数接口，您就可以在十分钟内集成并使用ROS-LLM。\n\nROS-LLM为快速创建与任何机器人互动和控制体验提供了一个简单的解决方案。\n\n![相关示意图](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAuromix_ROS-LLM_readme_a1ab47a7a28b.png)\n## 🚀 特性\n\n- 🤖 **ROS集成**：与机器人操作系统（ROS）无缝交互，实现广泛的机器人控制。\n\n- 🧠 **大型语言模型支持**：利用GPT-4和ChatGPT增强决策能力和任务管理。\n\n- 🗣️ **自然交互**：通过对话式交流促进与机器人的直观沟通。\n\n- 🔄 **灵活控制**：利用基于LLM的系统，根据语言模型的解释执行运动和导航等任务。\n\n- 🔌 **简化扩展性**：提供易于使用的接口，实现机器人功能的无缝集成。\n\n- 🛠️ **快速开发**：迅速创建交互式的机器人控制体验，有时甚至不到十分钟。\n\n- 📚 **教学示例**：提供全面的教程和示例，便于理解和实施。\n\n- 🗃️ **历史存储**：保留本地聊天记录，方便查看和参考。\n\n\n\n## 🔥 快速入门指南\n\n请按照以下步骤设置ROS-LLM：\n\n**1. 克隆仓库：**\n\n使用以下命令克隆仓库。\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM.git\n```\n\n**2. 安装依赖：**\n\n进入`llm_install`目录并执行安装脚本。\n```bash\ncd ROS-LLM\u002Fllm_install\nbash dependencies_install.sh\n```\n\n**3. 配置OpenAI设置：**\n\n如果您没有OpenAI API密钥，可以从[OpenAI平台](https:\u002F\u002Fplatform.openai.com)获取。使用以下脚本配置您的OpenAI API密钥。\n```bash\ncd ROS-LLM\u002Fllm_install\nbash config_openai_api_key.sh\n```\n\n**4. 配置AWS设置（可选）：**\n\n为了实现云端自然交互功能，需要配置AWS设置。如果您更倾向于使用本地ASR，则可以跳过此步骤。\n\n对于低性能的边缘嵌入式平台，建议使用ASR云服务以减轻计算压力；而对于高性能的个人主机，则建议使用本地ASR服务以加快响应速度。\n\n```bash\ncd ROS-LLM\u002Fllm_install\nbash config_aws.sh\n```\n\n**4. 配置OpenAI Whisper设置（可选）：**\n\n为了实现本地自然交互功能，需要配置OpenAI Whisper设置。如果您更倾向于使用云ASR，则可以跳过此步骤。\n\n对于低性能的边缘嵌入式平台，建议使用ASR云服务以减轻计算压力；而对于高性能的个人主机，则建议使用本地ASR服务以加快响应速度。\n```bash\npip install -U openai-whisper\npip install setuptools-rust\n```\n\n**5. 构建工作空间：**\n\n进入您的工作空间目录并构建工作空间。\n```bash\ncd \u003Cyour_ws>\nrosdep install --from-paths src --ignore-src -r -y  # 安装依赖\ncolcon build --symlink-install\n```\n\n**6. 运行演示：**\n\n源设置脚本并启动带有云ASR的Turtlesim演示。\n```bash\nsource \u003Cyour_ws>\u002Finstall\u002Fsetup.bash\nros2 launch llm_bringup chatgpt_with_turtle_robot.launch.py\n```\n开始监听\n```bash\nros2 topic pub \u002Fllm_state std_msgs\u002Fmsg\u002FString \"data: 'listening'\" -1\n```\n\n## ⚙️ 配置您自己的机器人（可选）\n\n要将该框架用于您自己的机器人，可以修改`llm_robot`和`llm_config`包，以适应您机器人的规格。这使您可以自定义机器人的行为。\n\n\n## 🧑‍💻 未来发展规划\n\n我们不断努力提升ROS-LLM，以更好地服务于社区中的开发者和机器人专家。以下是我们在即将到来的更新中计划进行的主要开发：\n\n- [ ] 代理机制\n\n添加代理机制可以使长序列任务得到良好划分。\n\n- [ ] 外部函数反馈通道\n\n我们计划增加一种反馈机制，使机器人能够从外部函数接收信息。这将显著帮助基于模型的决策过程。\n\n- [ ] 导航接口\n\n一个新的机器人导航接口也正在开发中。它将使该框架能够在面向导航的任务中得到应用。\n\n- [ ] 传感器输入接口\n\n增加其他传感器输入接口是另一项重大开发。这将把环境感知纳入模型决策的前提条件中，为诸如避障等功能做好准备。\n\n- [ ] 与基于视觉的模型（如Palm-e）集成\n\n我们旨在通过集成允许视觉输入的模型（如Palm-e），来扩展ROS-LLM的功能。这将使先进的计算机视觉技术得以应用于更好的环境交互。\n\n- [ ] 持续优化\n\n最后但同样重要的是，我们将专注于该框架的持续优化。我们致力于提高ROS-LLM的合理性和可扩展性，以便开发者能够根据自身需求更轻松地定制和扩展该框架。\n\n请持续关注本仓库的更新。您的建议和贡献始终受到欢迎！\n\n\n\n## 🙋 致用户\n如果您觉得这个项目有用，请考虑在GitHub上给它点个⭐️！您的支持有助于我们改进项目并推动进一步开发。别忘了也把它分享给您可能受益的朋友和同事。感谢您的支持！\n\n## 🏆 贡献\n欢迎贡献！请在提交拉取请求之前阅读[贡献指南](CONTRIBUTING.md)。\n\n## 🪪 许可证\n```\n版权所有 © 2023 Herman Ye @Auromix\n根据 Apache 许可证第 2.0 版（“许可证”）授权；\n除非符合许可证的规定，否则不得使用本文件。\n您可以在以下网址获得许可证的副本：\n    http:\u002F\u002Fwww.apache.org\u002Flicenses\u002FLICENSE-2.0\n除非适用法律要求或书面同意，否则软件以“按原样”基础分发，\n不提供任何明示或暗示的保证或条件。\n有关权限和限制的具体规定，请参阅许可证。\n```","# ROS-LLM 快速上手指南\n\nROS-LLM 是一个基于 ROS 2 的具身智能框架，支持通过大语言模型（如 GPT-4、ChatGPT）实现机器人的自然语言交互、决策与控制。本指南将帮助你在 10 分钟内完成部署并运行示例。\n\n## 环境准备\n\n在开始之前，请确保你的开发环境满足以下要求：\n\n*   **操作系统**: Ubuntu 22.04\n*   **ROS 版本**: ROS 2 Humble Hawksbill\n*   **硬件建议**:\n    *   **高性能主机**: 推荐本地运行 ASR (语音识别) 以获得更快响应。\n    *   **低性能嵌入式设备**: 推荐使用云端 ASR 服务以减轻计算压力。\n*   **前置依赖**:\n    *   Git\n    *   Python3 及 pip\n    *   OpenAI API Key (用于大模型调用)\n    *   AWS 凭证 (可选，仅当使用云端语音交互时需要)\n\n## 安装步骤\n\n### 1. 克隆项目代码\n打开终端，执行以下命令克隆仓库：\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM.git\n```\n\n### 2. 安装基础依赖\n进入安装目录并运行脚本：\n```bash\ncd ROS-LLM\u002Fllm_install\nbash dependencies_install.sh\n```\n\n### 3. 配置 OpenAI API\n你需要配置 OpenAI API Key 才能使用大模型功能。如果尚未拥有，请前往 [OpenAI Platform](https:\u002F\u002Fplatform.openai.com) 获取。\n```bash\ncd ROS-LLM\u002Fllm_install\nbash config_openai_api_key.sh\n```\n*按提示输入你的 API Key。*\n\n### 4. 配置语音交互 (可选)\n根据硬件性能选择配置方案（二选一或全选）：\n\n*   **方案 A：使用云端 ASR (推荐低性能设备)**\n    配置 AWS 设置以启用云端语音识别：\n    ```bash\n    cd ROS-LLM\u002Fllm_install\n    bash config_aws.sh\n    ```\n\n*   **方案 B：使用本地 ASR (推荐高性能主机)**\n    安装 OpenAI Whisper 以实现本地语音识别：\n    ```bash\n    pip install -U openai-whisper\n    pip install setuptools-rust\n    ```\n\n### 5. 编译工作空间\n将项目源码链接到你的 ROS 2 工作空间并进行编译。假设你的工作空间目录为 `\u003Cyour_ws>`：\n\n```bash\n# 将 ROS-LLM 移动到 src 目录 (如果尚未移动)\nmv ~\u002FROS-LLM \u003Cyour_ws>\u002Fsrc\u002F\n\ncd \u003Cyour_ws>\n# 安装系统依赖\nrosdep install --from-paths src --ignore-src -r -y\n# 编译\ncolcon build --symlink-install\n```\n\n## 基本使用\n\n完成安装后，可以通过运行内置的 Turtlesim 演示来测试功能。\n\n### 1. 启动演示节点\n加载环境变量并启动带有云端 ASR 的 ChatGPT 小海龟演示：\n```bash\nsource \u003Cyour_ws>\u002Finstall\u002Fsetup.bash\nros2 launch llm_bringup chatgpt_with_turtle_robot.launch.py\n```\n\n### 2. 开始语音监听\n在新开的终端中发布话题以启动监听状态：\n```bash\nros2 topic pub \u002Fllm_state std_msgs\u002Fmsg\u002FString \"data: 'listening'\" -1\n```\n\n### 3. 交互测试\n现在你可以尝试通过语音或文本向机器人发送指令（例如：\"move forward\" 或 \"turn left\"），ROS-LLM 将解析指令并控制小海龟运动。\n\n---\n**自定义机器人**: 若要适配你自己的机器人，请修改 `llm_robot` 和 `llm_config` 功能包中的接口定义，参考官方示例即可快速集成。","某仓储物流团队正试图让一台基于 ROS 2 的自主移动机器人（AMR）在动态环境中执行复杂的货物分拣与运送任务。\n\n### 没有 ROS-LLM 时\n- **指令僵化**：操作员必须编写精确的代码或输入特定的命令字符串（如 `nav_to_point x,y`），无法使用“去货架 A 拿红色箱子”这类自然语言。\n- **开发周期长**：每新增一个业务场景（如“遇到障碍物绕行”或“优先处理紧急订单”），工程师都需要数小时重新编写状态机和逻辑判断代码。\n- **交互门槛高**：现场非技术人员无法直接指挥机器人，必须依赖专业工程师在场进行参数调整或脚本修改，响应滞后。\n- **决策缺乏灵活性**：面对未预设的突发状况（如通道临时堵塞），机器人只能报错停止，无法像人一样理解语境并自主规划替代方案。\n\n### 使用 ROS-LLM 后\n- **自然语言操控**：工作人员直接通过语音或文字下达“把三楼会议室的投影仪送到维修间”的指令，ROS-LLM 利用大模型自动解析意图并转化为导航目标。\n- **极速场景适配**：无需重写底层代码，仅需在配置中描述新规则，ROS-LLM 即可在十分钟内让机器人学会处理新的分拣逻辑或异常应对策略。\n- **人机协作流畅**：仓库管理员可直接与机器人对话查询状态或更改任务优先级，大幅降低了对专业开发人员的依赖，提升了现场响应速度。\n- **智能自主决策**：遇到突发障碍时，ROS-LLM 能结合上下文理解环境，自主决定是等待、绕行还是请求人工协助，显著提升了任务完成率。\n\nROS-LLM 通过将大模型的语义理解能力无缝接入 ROS 生态，彻底打破了传统机器人控制的代码壁垒，让具身智能真正实现了“所说即所得”。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FAuromix_ROS-LLM_57d7a948.png","Auromix","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FAuromix_bcb26785.jpg","",null,"hermanye233@icloud.com","https:\u002F\u002Fgithub.com\u002FAuromix",[82,86,90],{"name":83,"color":84,"percentage":85},"Python","#3572A5",88.9,{"name":87,"color":88,"percentage":89},"Shell","#89e051",9.8,{"name":91,"color":92,"percentage":93},"CMake","#DA3434",1.2,764,92,"2026-03-30T13:36:54","Apache-2.0",4,"Linux (Ubuntu 22.04)","未说明（若使用本地 OpenAI Whisper 进行语音识别，建议高性能主机；低性能边缘设备建议使用云端 ASR）","未说明",{"notes":103,"python":104,"dependencies":105},"必须运行在 Ubuntu 22.04 且已安装 ROS 2 Humble 的环境中。需要配置 OpenAI API Key。语音交互部分可选：低性能设备推荐使用云端 ASR（需配置 AWS），高性能主机可配置本地 OpenAI Whisper（需安装额外依赖）。","未说明（需支持 ROS 2 Humble 的 Python 版本，通常为 3.10）",[106,107,108,109,110],"ROS 2 Humble","openai-whisper","setuptools-rust","OpenAI API (GPT-4\u002FChatGPT)","AWS CLI (可选，用于云端 ASR)",[26,15,13],[113,114,115,116],"gpt","llm","ros","embodied-intelligence","2026-03-27T02:49:30.150509","2026-04-06T06:46:13.294280",[120,125,130,135,140,145,150,155],{"id":121,"question_zh":122,"answer_zh":123,"source_url":124},16316,"遇到 openai.RateLimitError (错误代码 429) 提示配额不足怎么办？","这通常意味着您的 OpenAI API 信用额度已用完或过期。请检查您的 OpenAI 账户账单详情并添加更多信用额度。如果您希望免费使用，可以考虑切换到开源免费的模型计划。","https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fissues\u002F7",{"id":126,"question_zh":127,"answer_zh":128,"source_url":129},16317,"运行启动文件时提示 'Package llm_bringup not found' 如何解决？","这通常是因为 ROS 工作空间的环境变量未正确加载。请执行以下命令将设置添加到 ~\u002F.bashrc 文件中（请替换 \u003Cyour_ros2_workspace_absolute_path> 为您的实际工作空间绝对路径）：\necho \"source \u003Cyour_ros2_workspace_absolute_path>\u002Finstall\u002Fsetup.bash\" >> ~\u002F.bashrc\necho \"source \u002Fopt\u002Fros\u002Fhumble\u002Fsetup.bash\" >> ~\u002F.bashrc\n然后重新加载配置或重启终端。","https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fissues\u002F2",{"id":131,"question_zh":132,"answer_zh":133,"source_url":134},16318,"构建工作空间时出现 ur_kinematics 和 ur_robot_driver 的 stderr 输出错误怎么办？","这两个包通常与您连接的 UR 机械臂有关，与 ros-llm 项目本身无关。出现此错误可能是因为您的工作空间目录结构混乱。建议重新整理工作空间内容，确保 ros-llm 相关包与其他机器人驱动包隔离或在正确的上下文中构建。","https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fissues\u002F4",{"id":136,"question_zh":137,"answer_zh":138,"source_url":139},16319,"该项目是否支持在虚拟机运行？是否需要 GPU？支持 ROS Noetic 吗？","1. 可以在虚拟机上运行，项目没有特定的硬件依赖包。\n2. 不需要 GPU 设备即可运行核心功能，但如果使用 Whisper 等特定语音包，需额外考虑其依赖环境。\n3. 目前尚未更新支持 ROS Noetic (ROS 1)，主要支持 ROS 2 (如 Humble\u002FFoxy)。未来计划可能会增加对 ROS 1 的多模态框架支持。","https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fissues\u002F1",{"id":141,"question_zh":142,"answer_zh":143,"source_url":144},16320,"如何更换或使用其他微调的大语言模型？","您可以使用其他模型，只需修改代码中调用 API 的部分，将其适配为您想要使用的模型的接口即可。","https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fissues\u002F6",{"id":146,"question_zh":147,"answer_zh":148,"source_url":149},16321,"升级 openai 库后出现 'NameError: name config is not defined' 错误如何修复？","这是因为代码执行顺序问题，导致在使用 config 变量前未定义。请检查 chatgpt.py 文件，调整代码顺序，确保 config 对象的定义在实例化 OpenAI client (即 `client = OpenAI(...)`) 之前。","https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fissues\u002F5",{"id":151,"question_zh":152,"answer_zh":153,"source_url":154},16322,"运行过程中出现 'TypeError: Object of type FunctionCall is not JSON serializable' 错误怎么办？","该错误发生在尝试将包含 FunctionCall 对象的聊天记录序列化到 JSON 时。由于 FunctionCall 对象默认不可 JSON 序列化，需要修改 write_chat_history_to_json 函数，在调用 json.dumps 之前处理或转换该对象（例如提取其必要属性或转换为字典），该问题已在后续版本中解决。","https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fissues\u002F8",{"id":156,"question_zh":157,"answer_zh":158,"source_url":159},16323,"在 Ubuntu 20.04 上使用 ROS 2 Humble 运行时发生进程崩溃错误如何处理？","ROS-LLM 包使用了简化的 ROS 2 语法，官方主要兼容 Ubuntu 20.04 上的 ROS 2 Foxy。虽然在 Ubuntu 20.04 上源码编译安装 ROS 2 Humble 是可行的，但未经过充分测试。如果遇到此类错误，建议尝试切换回 ROS 2 Foxy 环境，或提供更多调试信息以便排查兼容性问题。","https:\u002F\u002Fgithub.com\u002FAuromix\u002FROS-LLM\u002Fissues\u002F3",[]]