[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-icip-cas--PPTAgent":3,"tool-icip-cas--PPTAgent":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",140436,2,"2026-04-05T23:32:43",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":10,"last_commit_at":50,"category_tags":51,"status":17},4292,"Deep-Live-Cam","hacksider\u002FDeep-Live-Cam","Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。\n\n这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。\n\n其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。",88924,"2026-04-06T03:28:53",[14,15,13,52],"视频",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[14,35],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":76,"owner_email":76,"owner_twitter":77,"owner_website":78,"owner_url":79,"languages":80,"stars":101,"forks":102,"last_commit_at":103,"license":104,"difficulty_score":10,"env_os":105,"env_gpu":106,"env_ram":106,"env_deps":107,"category_tags":118,"github_topics":119,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":126,"updated_at":127,"faqs":128,"releases":163},4240,"icip-cas\u002FPPTAgent","PPTAgent","An Agentic Framework for Reflective PowerPoint Generation","PPTAgent 是一款基于智能体（Agentic）框架的开源工具，旨在实现具有“反思”能力的 PowerPoint 演示文稿自动生成。它不仅仅是将文字简单转换为幻灯片，而是模拟人类设计师的创作流程：先规划大纲，再自主搜索素材、生成图表甚至绘制图像，最后对成品进行自我审查与优化，从而解决传统 AI 生成 PPT 时内容空洞、排版混乱及缺乏逻辑连贯性的痛点。\n\n该工具特别适合需要高效制作高质量汇报材料的研究人员、职场人士，以及希望探索多智能体协作在文档生成领域应用的开发者。其核心技术亮点在于集成了深度研究能力与自由形式的视觉设计功能，内置沙箱环境并支持超过 20 种辅助工具，能够独立完成从资料搜集到图文匹配的全流程。此外，PPTAgent 支持命令行操作与离线模式，提供微调模型，并兼容 MCP 服务器协议，允许用户灵活扩展功能。无论是追求一键生成的普通用户，还是需要进行二次开发的技术团队，都能从中获得极大的效率提升。","\n\u003Cdiv align=\"right\">\n  \u003Cdetails>\n    \u003Csummary >🌐 Language\u003C\u002Fsummary>\n    \u003Cdiv>\n      \u003Cdiv align=\"center\">\n        \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=en\">English\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=zh-CN\">简体中文\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=zh-TW\">繁體中文\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=ja\">日本語\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=ko\">한국어\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=hi\">हिन्दी\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=th\">ไทย\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=fr\">Français\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=de\">Deutsch\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=es\">Español\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=it\">Italiano\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=ru\">Русский\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=pt\">Português\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=nl\">Nederlands\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=pl\">Polski\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=ar\">العربية\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=fa\">فارسی\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=tr\">Türkçe\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=vi\">Tiếng Việt\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=id\">Bahasa Indonesia\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=as\">অসমীয়া\u003C\u002Fa>\n      \u003C\u002Fdiv>\n    \u003C\u002Fdiv>\n  \u003C\u002Fdetails>\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_e91b8bee4a4b.jpg\" width=\"240px\" alt=\"https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\">\n\u003C\u002Fdiv>\n\n\u003Ctable>\n  \u003Ctr>\n    \u003Ctd width=\"50%\">\n      \u003Cvideo controls width=\"100%\" src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F314bed6a-185e-4c81-9de5-35728e83e22a\">\n      \u003C\u002Fvideo>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"50%\">\n      \u003Cvideo controls width=\"100%\" src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F96eee616-5f79-4ea1-bd7f-bcaa466eda9e\">\n      \u003C\u002Fvideo>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n## Contact 📫\n> The main contributor of this repo is a Master's student graduating in 2026, feel free to reach out for collaboration or opportunities.\n>\n> 本仓库的主要贡献者是一名 2026 届硕士毕业生，欢迎联系合作或交流机会。\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_d75067cc4e5e.jpg\" width=\"140px\">\n\u003C\u002Fdiv>\n\n## News 📅\n- [2026\u002F03]: We now support CLI and have released our fine-tuned models on [Hugging Face 🤗](https:\u002F\u002Fhuggingface.co\u002Fcollections\u002FICIP\u002Fdeeppresenter)!\n- [2026\u002F01]: We support freeform and template generation support PPTX export, offline mode now! Context management is added to avoid context overflow.\n- [2025\u002F12]: 🔥 Released V2 with major improvements - Deep Research Integration, Free-Form Visual Design, Autonomous Asset Creation, Text-to-Image Generation, and Agent Environment with sandbox & 20+ tools.\n- [2025\u002F09]: 🛠️ MCP server support added - see [MCP Server](PPTAgent\u002FDOC.md#mcp-server-) for configuration details\n- [2025\u002F09]: 🚀 Released v2 with major improvements - see [release notes](https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Freleases\u002Ftag\u002Fv0.2.0) for details\n- [2025\u002F08]: 🎉 Paper accepted to **EMNLP 2025**!\n- [2025\u002F05]: ✨ Released v1 with core functionality and 🌟 breakthrough: reached 1,000 stars on GitHub! - see [release notes](https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Freleases\u002Ftag\u002Fv0.1.0) for details\n- [2025\u002F01]: 🔓 Open-sourced the codebase, with experimental code archived at [experiment release](https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Freleases\u002Ftag\u002Fexperiment)\n\n## Usage 📖\n\n> [!IMPORTANT]\n> Windows is not supported. If you are on Windows, please use WSL.\n>\n> We strongly recommend starting with the CLI and minimum task to confirm dependencies and environment is configured correctly.\n\n### Configuration\n\nIf you use the CLI, `pptagent onboard` can help create and update these configurations interactively. If you use Docker Compose or build from source, you should prepare them manually:\n\n```bash\ncp deeppresenter\u002Fconfig.yaml.example deeppresenter\u002Fconfig.yaml\ncp deeppresenter\u002Fmcp.json.example deeppresenter\u002Fmcp.json\n```\n\n#### Optional Services That Improve Quality\n\nThe following services can noticeably improve generation quality, especially for research depth, PDF parsing, and visual asset creation:\n\n- **Tavily**: improves web search quality. Apply for an API key at [tavily.com](https:\u002F\u002Fwww.tavily.com\u002F), then set `TAVILY_API_KEY` in [`deeppresenter\u002Fmcp.json`](deeppresenter\u002Fmcp.json).\n- **MinerU**: improves PDF parsing quality. You can either apply for an API key at [mineru.net](https:\u002F\u002Fmineru.net\u002FapiManage\u002Fdocs) and set `MINERU_API_KEY` in [`deeppresenter\u002Fmcp.json`](deeppresenter\u002Fmcp.json), or deploy MinerU locally and set `MINERU_API_URL` instead.\n- **Text-to-image model**: improves image generation quality. Configure `t2i_model` in [`deeppresenter\u002Fconfig.yaml`](deeppresenter\u002Fconfig.yaml).\n\n\nIf you want a fully offline setup, deploy MinerU locally and set `offline_mode: true` in `deeppresenter\u002Fconfig.yaml` to avoid loading network-dependent tools such as web search.\n\nMore configurable variables can be found in [constants.py](deeppresenter\u002Futils\u002Fconstants.py).\n\n### 1. Personal Use \u002F OpenClaw Integration: CLI\n\n> [!NOTE]\n> On macOS, the CLI may automatically install several local dependencies, including Homebrew, Node.js, Docker, poppler, Playwright, and llama.cpp.\n>\n> On Linux, you should prepare the environment by yourself.\n\nUse this mode if you want the fastest local setup or want to plug DeepPresenter into OpenClaw through the CLI.\n\n```bash\n# Install uv\ncurl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh\n\n# First-time interactive setup\nuvx pptagent onboard\n\n# Generate a presentation\nuvx pptagent generate \"Single Page with Title: Hello World\" -o hello.pptx\n\n# Generate with attachments\nuvx pptagent generate \"Q4 Report\" \\\n  -f data.xlsx \\\n  -f charts.pdf \\\n  -p \"10-12\" \\\n  -o report.pptx\n```\n\n| Command             | Description                                       |\n| ------------------- | ------------------------------------------------- |\n| `pptagent onboard`  | Interactive configuration wizard                  |\n| `pptagent generate` | Generate presentations                            |\n| `pptagent config`   | View current configuration                        |\n| `pptagent reset`    | Reset configuration                               |\n| `pptagent serve`    | Start the local inference service used by the CLI |\n\n### 2. Minimal Setup \u002F Development: Build From Source\n\nUse this mode if you want the smallest abstraction layer and full control over dependencies during development.\n\n```bash\nuv pip install -e .\nplaywright install-deps\nplaywright install chromium\nnpm install --prefix deeppresenter\u002Fhtml2pptx\nmodelscope download forceless\u002Ffasttext-language-id\n\ndocker pull forceless\u002Fdeeppresenter-sandbox\ndocker pull forceless\u002Fdeeppresenter-host\ndocker tag forceless\u002Fdeeppresenter-sandbox deeppresenter-sandbox\n\n# or build from dockerfile\ndocker build -t deeppresenter-sandbox -f deeppresenter\u002Fdocker\u002FSandBox.Dockerfile .\n```\n\nStart the app:\n\n```bash\npython webui.py\n```\n\n### 3. Server Deployment: Docker Compose\n\nUse this mode for a stable server environment with explicit dependencies.\n\n```bash\n# Pull the public images to avoid build from source\ndocker pull forceless\u002Fdeeppresenter-sandbox\ndocker tag forceless\u002Fdeeppresenter-sandbox deeppresenter-sandbox\n\n# Or build from source\ndocker build -t deeppresenter-sandbox -f deeppresenter\u002Fdocker\u002FSandBox.Dockerfile .\n\n# Start the host service\ndocker compose up -d\n```\n\nThe service exposes the web UI on `http:\u002F\u002Flocalhost:7861`.\n\n## Case Study 💡\n\n- #### Prompt: Please present the given document to me.\n\n\u003Cdiv style=\"display: flex; flex-wrap: wrap; gap: 10px;\">\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_b5f89b791559.jpg\" alt=\"图片1\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_d350a42666d8.jpg\" alt=\"图片2\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_439e4acede7d.jpg\" alt=\"图片3\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_511bcb0db288.jpg\" alt=\"图片4\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_6f183fc5a10f.jpg\" alt=\"图片5\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_63a4fd7f1eea.jpg\" alt=\"图片6\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_f563282a38fb.jpg\" alt=\"图片7\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_526c2fb000db.jpg\" alt=\"图片8\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_1959e15bd103.jpg\" alt=\"图片9\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_4186285143a5.jpg\" alt=\"图片10\" width=\"200\"\u002F>\n\n\u003C\u002Fdiv>\n\n- #### Prompt: 请介绍小米 SU7 的外观和价格\n\n\u003Cdiv style=\"display: flex; flex-wrap: wrap; gap: 10px;\">\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_90073a529561.jpg\" alt=\"图片1\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_76b68e75efcf.jpg\" alt=\"图片2\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_d732dd4dcd88.jpg\" alt=\"图片3\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_0918c5457c9a.jpg\" alt=\"图片4\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_01d43f8c3c53.jpg\" alt=\"图片5\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_02a929237c9f.jpg\" alt=\"图片6\" width=\"200\"\u002F>\n\n\u003C\u002Fdiv>\n\n- #### Prompt: 请制作一份高中课堂展示课件，主题为“解码立法过程：理解其对国际关系的影响”\n\n\u003Cdiv style=\"display: flex; flex-wrap: wrap; gap: 10px;\">\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_e0bb7238daa1.jpg\" alt=\"图片1\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_a89c7a550d8b.jpg\" alt=\"图片2\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_40b91d333e35.jpg\" alt=\"图片3\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_cf438481a38e.jpg\" alt=\"图片4\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_c719fb686292.jpg\" alt=\"图片5\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_9000b82e100a.jpg\" alt=\"图片6\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_cad7e4f3ccb3.jpg\" alt=\"图片7\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_5dd375d1f4d5.jpg\" alt=\"图片8\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_5ef62b9fbe6c.jpg\" alt=\"图片9\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_9332c56b3289.jpg\" alt=\"图片10\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_27b700dc62f2.jpg\" alt=\"图片11\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_5166773e69dd.jpg\" alt=\"图片12\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_0768eae96222.jpg\" alt=\"图片13\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_a612346e219b.jpg\" alt=\"图片14\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_6e98c44f1af8.jpg\" alt=\"图片15\" width=\"200\"\u002F>\n\n\u003C\u002Fdiv>\n\n---\n\n## Contributors 🌟\n\n\u003Ctable>\n\u003Ctr>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FForce1ess>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F72636351?v=4 width=\"80;\"  alt=Force1ess\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Force1ess\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FPuellaquae>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F22560343?v=4 width=\"80;\"  alt=Puelloc\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Puelloc\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002Fhysyyds>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F80150669?v=4 width=\"80;\"  alt=hongyan\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>hongyan\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FDnoob>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F92987618?v=4 width=\"80;\"  alt=Dnoob\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Dnoob\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FSadahlu>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F126563707?v=4 width=\"80;\"  alt=Sadahlu\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Sadahlu\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FKurisuMakiseSame>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F168447425?v=4 width=\"80;\"  alt=KurisuMakiseSame\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>KurisuMakiseSame\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FAngelenx>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F39873863?v=4 width=\"80;\"  alt=Angelen\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Angelen\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002Fkylooh>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F26456650?v=4 width=\"80;\"  alt=Eliot White\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Eliot White\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FEvolvedGhost>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F92856393?v=4 width=\"80;\"  alt=EvolvedGhost\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>EvolvedGhost\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FISCAS-zwl>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F179820048?v=4 width=\"80;\"  alt=ISCAS-zwl\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>ISCAS-zwl\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FJames4Ever0>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F103997068?v=4 width=\"80;\"  alt=James Brown\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>James Brown\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FLasRuinasCirculares>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F119716645?v=4 width=\"80;\"  alt=JunZhang\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>JunZhang\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002Fopenaitx-system>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F215529505?v=4 width=\"80;\"  alt=Open AI Tx\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Open AI Tx\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002Fhaosenwang1018>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F167664334?v=4 width=\"80;\"  alt=Sense_wang\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Sense_wang\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FDeJeune>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F67425183?v=4 width=\"80;\"  alt=SuYao\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>SuYao\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FDormiveglia-elf>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F81767213?v=4 width=\"80;\"  alt=Zhenyu\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Zhenyu\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003C\u002Ftable>\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_ec53f2cc22dd.png)](https:\u002F\u002Fstar-history.com\u002F#icip-cas\u002FPPTAgent&Date)\n\n## Citation 🙏\n\nIf you find this project helpful, please use the following to cite it:\n```bibtex\n@inproceedings{zheng-etal-2025-pptagent,\n    title = \"{PPTA}gent: Generating and Evaluating Presentations Beyond Text-to-Slides\",\n    author = \"Zheng, Hao  and\n      Guan, Xinyan  and\n      Kong, Hao  and\n      Zhang, Wenkai  and\n      Zheng, Jia  and\n      Zhou, Weixiang  and\n      Lin, Hongyu  and\n      Lu, Yaojie  and\n      Han, Xianpei  and\n      Sun, Le\",\n    editor = \"Christodoulopoulos, Christos  and\n      Chakraborty, Tanmoy  and\n      Rose, Carolyn  and\n      Peng, Violet\",\n    booktitle = \"Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing\",\n    month = nov,\n    year = \"2025\",\n    address = \"Suzhou, China\",\n    publisher = \"Association for Computational Linguistics\",\n    url = \"https:\u002F\u002Faclanthology.org\u002F2025.emnlp-main.728\u002F\",\n    doi = \"10.18653\u002Fv1\u002F2025.emnlp-main.728\",\n    pages = \"14413--14429\",\n    ISBN = \"979-8-89176-332-6\",\n    abstract = \"Automatically generating presentations from documents is a challenging task that requires accommodating content quality, visual appeal, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, overlooking visual appeal and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to extract slide-level functional types and content schemas, then drafts an outline and iteratively generates editing actions based on selected reference slides to create new slides. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Results demonstrate that PPTAgent significantly outperforms existing automatic presentation generation methods across all three dimensions.\"\n}\n\n@misc{zheng2026deeppresenterenvironmentgroundedreflectionagentic,\n      title={DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation},\n      author={Hao Zheng and Guozhao Mo and Xinru Yan and Qianhao Yuan and Wenkai Zhang and Xuanang Chen and Yaojie Lu and Hongyu Lin and Xianpei Han and Le Sun},\n      year={2026},\n      eprint={2602.22839},\n      archivePrefix={arXiv},\n      primaryClass={cs.AI},\n      url={https:\u002F\u002Farxiv.org\u002Fabs\u002F2602.22839},\n}\n```\n","\u003Cdiv align=\"right\">\n  \u003Cdetails>\n    \u003Csummary >🌐 语言\u003C\u002Fsummary>\n    \u003Cdiv>\n      \u003Cdiv align=\"center\">\n        \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=en\">英语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=zh-CN\">简体中文\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=zh-TW\">繁體中文\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=ja\">日语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=ko\">韩语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=hi\">印地语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=th\">泰语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=fr\">法语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=de\">德语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=es\">西班牙语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=it\">意大利语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=ru\">俄语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=pt\">葡萄牙语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=nl\">荷兰语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=pl\">波兰语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=ar\">阿拉伯语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=fa\">波斯语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=tr\">土耳其语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=vi\">越南语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=id\">印尼语\u003C\u002Fa>\n        | \u003Ca href=\"https:\u002F\u002Fopenaitx.github.io\u002Fview.html?user=icip-cas&project=PPTAgent&lang=as\">阿萨姆语\u003C\u002Fa>\n      \u003C\u002Fdiv>\n    \u003C\u002Fdiv>\n  \u003C\u002Fdetails>\n\u003C\u002Fdiv>\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_e91b8bee4a4b.jpg\" width=\"240px\" alt=\"https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\">\n\u003C\u002Fdiv>\n\n\u003Ctable>\n  \u003Ctr>\n    \u003Ctd width=\"50%\">\n      \u003Cvideo controls width=\"100%\" src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F314bed6a-185e-4c81-9de5-35728e83e22a\">\n      \u003C\u002Fvideo>\n    \u003C\u002Ftd>\n    \u003Ctd width=\"50%\">\n      \u003Cvideo controls width=\"100%\" src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F96eee616-5f79-4ea1-bd7f-bcaa466eda9e\">\n      \u003C\u002Fvideo>\n    \u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n## 联系方式 📫\n> 本仓库的主要贡献者是一名 2026 届硕士毕业生，欢迎联系合作或交流机会。\n>\n> The main contributor of this repo is a Master's student graduating in 2026, feel free to reach out for collaboration or opportunities.\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_d75067cc4e5e.jpg\" width=\"140px\">\n\u003C\u002Fdiv>\n\n## 新闻 📅\n- [2026\u002F03]: 现已支持命令行界面，并在[Hugging Face 🤗](https:\u002F\u002Fhuggingface.co\u002Fcollections\u002FICIP\u002Fdeeppresenter)上发布了我们微调后的模型！\n- [2026\u002F01]: 支持自由格式和模板生成，新增 PPTX 导出功能，现已支持离线模式！增加了上下文管理功能，以避免上下文溢出。\n- [2025\u002F12]: 🔥 发布 V2 版本，带来重大改进——深度研究集成、自由形式视觉设计、自主资产创建、文本转图像生成以及带有沙盒和 20 多种工具的智能体环境。\n- [2025\u002F09]: 🛠️ 增加了 MCP 服务器支持——配置详情请参阅[PPTAgent\u002FDOC.md#mcp-server-]。\n- [2025\u002F09]: 🚀 发布 v2 版本，包含重大改进——详细信息请参阅[发布说明](https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Freleases\u002Ftag\u002Fv0.2.0)。\n- [2025\u002F08]: 🎉 论文已被 **EMNLP 2025** 接收！\n- [2025\u002F05]: ✨ 发布 v1 版本，具备核心功能，并取得了🌟突破：GitHub 上的星标数达到 1,000 颗！详细信息请参阅[发布说明](https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Freleases\u002Ftag\u002Fv0.1.0)。\n- [2025\u002F01]: 🔓 开源了代码库，实验性代码已归档至[实验版本](https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Freleases\u002Ftag\u002Fexperiment)。\n\n## 使用方法 📖\n\n> [!重要]\n> 不支持 Windows 系统。如果您使用的是 Windows，请使用 WSL。\n>\n> 我们强烈建议从命令行界面和最简单的任务开始，以确认依赖项和环境是否配置正确。\n\n### 配置\n\n如果您使用命令行界面，`pptagent onboard` 可以帮助您交互式地创建和更新这些配置。如果您使用 Docker Compose 或从源码构建，则需要手动准备：\n\n```bash\ncp deeppresenter\u002Fconfig.yaml.example deeppresenter\u002Fconfig.yaml\ncp deeppresenter\u002Fmcp.json.example deeppresenter\u002Fmcp.json\n```\n\n#### 可选服务以提升质量\n\n以下服务可以显著提高生成质量，尤其是在研究深度、PDF 解析和视觉资产创建方面：\n\n- **Tavily**: 提升网络搜索质量。请在[tavily.com](https:\u002F\u002Fwww.tavily.com\u002F)申请 API 密钥，然后在[`deeppresenter\u002Fmcp.json`](deeppresenter\u002Fmcp.json)中设置 `TAVILY_API_KEY`。\n- **MinerU**: 提升 PDF 解析质量。您可以选择在[mineru.net](https:\u002F\u002Fmineru.net\u002FapiManage\u002Fdocs)申请 API 密钥，并在[`deeppresenter\u002Fmcp.json`](deeppresenter\u002Fmcp.json)中设置 `MINERU_API_KEY`，或者将 MinerU 部署在本地，并设置 `MINERU_API_URL` 代替。\n- **文本转图像模型**: 提高图像生成质量。请在[`deeppresenter\u002Fconfig.yaml`](deeppresenter\u002Fconfig.yaml)中配置 `t2i_model`。\n\n如果您希望完全离线运行，请将 MinerU 部署在本地，并在`deeppresenter\u002Fconfig.yaml`中设置 `offline_mode: true`，以避免加载依赖于网络的工具，如网络搜索。\n\n更多可配置变量可在[constants.py](deeppresenter\u002Futils\u002Fconstants.py)中找到。\n\n### 1. 个人使用 \u002F OpenClaw 集成：命令行界面\n\n> [!注意]\n> 在 macOS 上，命令行界面可能会自动安装一些本地依赖项，包括 Homebrew、Node.js、Docker、Poppler、Playwright 和 llama.cpp。\n>\n> 在 Linux 上，您需要自行准备好环境。\n\n如果您希望以最快的方式进行本地部署，或者希望通过命令行界面将 DeepPresenter 插入 OpenClaw，可以使用此模式。\n\n```bash\n# 安装 uv\ncurl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh\n\n# 首次交互式设置\nuvx pptagent onboard\n\n# 生成演示文稿\nuvx pptagent generate \"单页标题：你好，世界\" -o hello.pptx\n\n# 使用附件生成\nuvx pptagent generate \"Q4报告\" \\\n  -f data.xlsx \\\n  -f charts.pdf \\\n  -p \"10-12\" \\\n  -o report.pptx\n```\n\n| 命令             | 描述                                       |\n| ------------------- | ------------------------------------------------- |\n| `pptagent onboard`  | 交互式配置向导                  |\n| `pptagent generate` | 生成演示文稿                            |\n| `pptagent config`   | 查看当前配置                        |\n| `pptagent reset`    | 重置配置                               |\n| `pptagent serve`    | 启动 CLI 使用的本地推理服务 |\n\n### 2. 最小化设置 \u002F 开发：从源码构建\n\n如果您希望在开发过程中拥有最小的抽象层和对依赖项的完全控制，请使用此模式。\n\n```bash\nuv pip install -e .\nplaywright install-deps\nplaywright install chromium\nnpm install --prefix deeppresenter\u002Fhtml2pptx\nmodelscope download forceless\u002Ffasttext-language-id\n\ndocker pull forceless\u002Fdeeppresenter-sandbox\ndocker pull forceless\u002Fdeeppresenter-host\ndocker tag forceless\u002Fdeeppresenter-sandbox deeppresenter-sandbox\n\n# 或者从 Dockerfile 构建\ndocker build -t deeppresenter-sandbox -f deeppresenter\u002Fdocker\u002FSandBox.Dockerfile .\n```\n\n启动应用：\n\n```bash\npython webui.py\n```\n\n### 3. 服务器部署：Docker Compose\n\n此模式适用于具有明确依赖关系的稳定服务器环境。\n\n```bash\n# 拉取公共镜像以避免从源码构建\ndocker pull forceless\u002Fdeeppresenter-sandbox\ndocker tag forceless\u002Fdeeppresenter-sandbox deeppresenter-sandbox\n\n# 或者从源码构建\ndocker build -t deeppresenter-sandbox -f deeppresenter\u002Fdocker\u002FSandBox.Dockerfile .\n\n# 启动主机服务\ndocker compose up -d\n```\n\n该服务在 `http:\u002F\u002Flocalhost:7861` 上公开 Web UI。\n\n## 案例研究 💡\n\n- #### 提示：请将给定的文档展示给我。\n\n\u003Cdiv style=\"display: flex; flex-wrap: wrap; gap: 10px;\">\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_b5f89b791559.jpg\" alt=\"图片1\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_d350a42666d8.jpg\" alt=\"图片2\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_439e4acede7d.jpg\" alt=\"图片3\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_511bcb0db288.jpg\" alt=\"图片4\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_6f183fc5a10f.jpg\" alt=\"图片5\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_63a4fd7f1eea.jpg\" alt=\"图片6\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_f563282a38fb.jpg\" alt=\"图片7\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_526c2fb000db.jpg\" alt=\"图片8\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_1959e15bd103.jpg\" alt=\"图片9\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_4186285143a5.jpg\" alt=\"图片10\" width=\"200\"\u002F>\n\n\u003C\u002Fdiv>\n\n- #### 提示：请介绍小米 SU7 的外观和价格\n\n\u003Cdiv style=\"display: flex; flex-wrap: wrap; gap: 10px;\">\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_90073a529561.jpg\" alt=\"图片1\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_76b68e75efcf.jpg\" alt=\"图片2\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_d732dd4dcd88.jpg\" alt=\"图片3\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_0918c5457c9a.jpg\" alt=\"图片4\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_01d43f8c3c53.jpg\" alt=\"图片5\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_02a929237c9f.jpg\" alt=\"图片6\" width=\"200\"\u002F>\n\n\u003C\u002Fdiv>\n\n- #### 提示：请制作一份高中课堂展示课件，主题为“解码立法过程：理解其对国际关系的影响”\n\n\u003Cdiv style=\"display: flex; flex-wrap: wrap; gap: 10px;\">\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_e0bb7238daa1.jpg\" alt=\"图片1\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_a89c7a550d8b.jpg\" alt=\"图片2\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_40b91d333e35.jpg\" alt=\"图片3\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_cf438481a38e.jpg\" alt=\"图片4\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_c719fb686292.jpg\" alt=\"图片5\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_9000b82e100a.jpg\" alt=\"图片6\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_cad7e4f3ccb3.jpg\" alt=\"图片7\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_5dd375d1f4d5.jpg\" alt=\"图片8\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_5ef62b9fbe6c.jpg\" alt=\"图片9\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_9332c56b3289.jpg\" alt=\"图片10\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_27b700dc62f2.jpg\" alt=\"图片11\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_5166773e69dd.jpg\" alt=\"图片12\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_0768eae96222.jpg\" alt=\"图片13\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_a612346e219b.jpg\" alt=\"图片14\" width=\"200\"\u002F>\n\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_6e98c44f1af8.jpg\" alt=\"图片15\" width=\"200\"\u002F>\n\n\u003C\u002Fdiv>\n\n---\n\n## 贡献者 🌟\n\n\u003Ctable>\n\u003Ctr>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FForce1ess>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F72636351?v=4 width=\"80;\"  alt=Force1ess\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Force1ess\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FPuellaquae>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F22560343?v=4 width=\"80;\"  alt=Puelloc\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Puelloc\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002Fhysyyds>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F80150669?v=4 width=\"80;\"  alt=hongyan\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>hongyan\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FDnoob>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F92987618?v=4 width=\"80;\"  alt=Dnoob\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Dnoob\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FSadahlu>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F126563707?v=4 width=\"80;\"  alt=Sadahlu\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Sadahlu\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FKurisuMakiseSame>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F168447425?v=4 width=\"80;\"  alt=KurisuMakiseSame\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>KurisuMakiseSame\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FAngelenx>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F39873863?v=4 width=\"80;\"  alt=Angelen\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Angelen\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002Fkylooh>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F26456650?v=4 width=\"80;\"  alt=Eliot White\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Eliot White\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FEvolvedGhost>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F92856393?v=4 width=\"80;\"  alt=EvolvedGhost\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>EvolvedGhost\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FISCAS-zwl>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F179820048?v=4 width=\"80;\"  alt=ISCAS-zwl\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>ISCAS-zwl\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FJames4Ever0>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F103997068?v=4 width=\"80;\"  alt=James Brown\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>James Brown\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FLasRuinasCirculares>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F119716645?v=4 width=\"80;\"  alt=JunZhang\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>JunZhang\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002Fopenaitx-system>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F215529505?v=4 width=\"80;\"  alt=Open AI Tx\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Open AI Tx\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002Fhaosenwang1018>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F167664334?v=4 width=\"80;\"  alt=Sense_wang\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Sense_wang\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FDeJeune>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F67425183?v=4 width=\"80;\"  alt=SuYao\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>SuYao\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n    \u003Ctd align=\"center\" style=\"word-wrap: break-word; width: 120.0; height: 120.0\">\n        \u003Ca href=https:\u002F\u002Fgithub.com\u002FDormiveglia-elf>\n            \u003Cimg src=https:\u002F\u002Favatars.githubusercontent.com\u002Fu\u002F81767213?v=4 width=\"80;\"  alt=Zhenyu\u002F>\n            \u003Cbr \u002F>\n            \u003Csub style=\"font-size:14px\">\u003Cb>Zhenyu\u003C\u002Fb>\u003C\u002Fsub>\n        \u003C\u002Fa>\n    \u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003C\u002Ftable>\n\n[![星级历史图表](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_readme_ec53f2cc22dd.png)](https:\u002F\u002Fstar-history.com\u002F#icip-cas\u002FPPTAgent&Date)\n\n## 引用 🙏\n\n如果您觉得本项目对您有帮助，请使用以下引用格式：\n```bibtex\n@inproceedings{zheng-etal-2025-pptagent,\n    title = \"{PPTA}gent: 生成与评估超越文本转幻灯片的演示文稿\",\n    author = \"Zheng, Hao 与 Guan, Xinyan 与 Kong, Hao 与 Zhang, Wenkai 与 Zheng, Jia 与 Zhou, Weixiang 与 Lin, Hongyu 与 Lu, Yaojie 与 Han, Xianpei 与 Sun, Le\",\n    editor = \"Christodoulopoulos, Christos 与 Chakraborty, Tanmoy 与 Rose, Carolyn 与 Peng, Violet\",\n    booktitle = \"2025年自然语言处理经验方法会议论文集\",\n    month = nov,\n    year = \"2025\",\n    address = \"苏州, 中国\",\n    publisher = \"计算语言学协会\",\n    url = \"https:\u002F\u002Faclanthology.org\u002F2025.emnlp-main.728\u002F\",\n    doi = \"10.18653\u002Fv1\u002F2025.emnlp-main.728\",\n    pages = \"14413--14429\",\n    ISBN = \"979-8-89176-332-6\",\n    abstract = \"从文档自动生成演示文稿是一项极具挑战性的任务，它需要同时兼顾内容质量、视觉吸引力和结构连贯性。现有的方法主要专注于单独提升和评估内容质量，而忽视了视觉吸引力和结构连贯性，这限制了它们的实际应用价值。为解决这些局限性，我们提出了 PPTAgent，该方法受人类工作流程启发，采用基于编辑的两阶段方法来全面改进演示文稿的生成过程。PPTAgent 首先分析参考演示文稿，提取幻灯片级别的功能类型和内容模式；然后拟定提纲，并基于选定的参考幻灯片迭代生成编辑操作以创建新幻灯片。为了全面评估生成的演示文稿质量，我们进一步提出了 PPTEval，这是一个从内容、设计和连贯性三个维度对演示文稿进行评估的框架。实验结果表明，PPTAgent 在这三个维度上均显著优于现有的自动演示文稿生成方法。\"\n}\n\n@misc{zheng2026deeppresenterenvironmentgroundedreflectionagentic,\n      title={DeepPresenter：面向智能体式演示文稿生成的环境感知反思},\n      author={Hao Zheng 和 Guozhao Mo 和 Xinru Yan 和 Qianhao Yuan 和 Wenkai Zhang 和 Xuanang Chen 和 Yaojie Lu 和 Hongyu Lin 和 Xianpei Han 和 Le Sun},\n      year={2026},\n      eprint={2602.22839},\n      archivePrefix={arXiv},\n      primaryClass={cs.AI},\n      url={https:\u002F\u002Farxiv.org\u002Fabs\u002F2602.22839},\n}\n```","# PPTAgent 快速上手指南\n\nPPTAgent 是一款基于 AI 的智能 PPT 生成工具，支持从文本、文档或自由指令自动生成高质量的演示文稿。它集成了深度研究、视觉设计和自主资产创建能力。\n\n## 环境准备\n\n### 系统要求\n- **操作系统**：Linux 或 macOS（**不支持原生 Windows**，Windows 用户请使用 WSL）。\n- **推荐配置**：具备 Docker 运行环境，拥有足够的内存以运行本地模型或容器。\n\n### 前置依赖\n在开始之前，请确保系统已安装以下基础工具：\n- `curl`\n- `git`\n- `Docker` & `Docker Compose` (用于服务器部署或沙箱环境)\n- `Node.js` & `npm` (部分前端组件需要)\n- `uv` (Python 包管理工具，安装步骤见下文)\n\n> **注意**：在 macOS 上，CLI 模式可能会自动检测并协助安装部分依赖（如 Homebrew, Playwright 等）；Linux 用户需手动确保环境就绪。\n\n## 安装步骤\n\n推荐使用 **CLI 模式** 进行快速体验，或通过 **Docker Compose** 进行稳定部署。\n\n### 方式一：CLI 快速安装（推荐个人使用）\n\n这是最快捷的本地启动方式，适合快速生成 PPT。\n\n1. **安装 uv 包管理器**\n   ```bash\n   curl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh\n   ```\n\n2. **交互式初始化配置**\n   运行以下命令，根据向导完成配置文件创建和 API Key 设置：\n   ```bash\n   uvx pptagent onboard\n   ```\n   *在此步骤中，你可以配置 Tavily (搜索)、MinerU (PDF 解析) 等可选服务以提升生成质量。*\n\n3. **验证安装**\n   配置完成后，即可直接使用生成命令。\n\n### 方式二：源码构建（适合开发者）\n\n如果你需要修改代码或进行二次开发：\n\n1. **克隆项目并安装依赖**\n   ```bash\n   git clone https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent.git\n   cd PPTAgent\n   uv pip install -e .\n   ```\n\n2. **安装浏览器驱动与前端依赖**\n   ```bash\n   playwright install-deps\n   playwright install chromium\n   npm install --prefix deeppresenter\u002Fhtml2pptx\n   modelscope download forceless\u002Ffasttext-language-id\n   ```\n\n3. **准备 Docker 沙箱环境**\n   ```bash\n   docker pull forceless\u002Fdeeppresenter-sandbox\n   docker tag forceless\u002Fdeeppresenter-sandbox deeppresenter-sandbox\n   # 或者从 Dockerfile 自行构建\n   # docker build -t deeppresenter-sandbox -f deeppresenter\u002Fdocker\u002FSandBox.Dockerfile .\n   ```\n\n4. **启动 Web UI**\n   ```bash\n   python webui.py\n   ```\n\n### 方式三：Docker Compose 部署（适合服务器）\n\n适合需要稳定服务环境的场景：\n\n```bash\n# 拉取镜像\ndocker pull forceless\u002Fdeeppresenter-sandbox\ndocker tag forceless\u002Fdeeppresenter-sandbox deeppresenter-sandbox\n\n# 启动服务\ndocker compose up -d\n```\n启动后，访问 `http:\u002F\u002Flocalhost:7861` 使用 Web 界面。\n\n## 基本使用\n\n安装配置完成后，你可以通过命令行快速生成 PPT。\n\n### 1. 生成简单幻灯片\n根据文本描述直接生成单页或多页 PPT：\n```bash\nuvx pptagent generate \"Single Page with Title: Hello World\" -o hello.pptx\n```\n\n### 2. 基于附件生成报告\n支持上传 Excel、PDF 等文件，并指定页码范围进行内容提取和生成：\n```bash\nuvx pptagent generate \"Q4 Report\" \\\n  -f data.xlsx \\\n  -f charts.pdf \\\n  -p \"10-12\" \\\n  -o report.pptx\n```\n\n### 3. 常用命令速查\n\n| 命令 | 说明 |\n| :--- | :--- |\n| `uvx pptagent onboard` | 交互式配置向导（首次使用必跑） |\n| `uvx pptagent generate` | 核心生成命令 |\n| `uvx pptagent config` | 查看当前配置信息 |\n| `uvx pptagent reset` | 重置配置 |\n| `uvx pptagent serve` | 启动 CLI 所需的本地推理服务 |\n\n### 💡 提升生成质量的小贴士\n- **联网搜索**：在 `deeppresenter\u002Fmcp.json` 中配置 `TAVILY_API_KEY` 可启用深度网络调研。\n- **PDF 解析**：配置 `MINERU_API_KEY` 或使用本地部署的 MinerU 可显著提升复杂 PDF 的解析效果。\n- **离线模式**：若需完全离线运行，请在 `deeppresenter\u002Fconfig.yaml` 中设置 `offline_mode: true` 并本地部署 MinerU。","某互联网公司的产品经理需要在 2 小时内向高层汇报一份包含最新市场数据、竞品分析及未来战略规划的季度复盘 PPT，时间紧迫且对逻辑严谨性要求极高。\n\n### 没有 PPTAgent 时\n- **资料整合耗时巨大**：需要手动从多个研报、数据库和内部文档中复制粘贴数据，极易出现格式错乱或数据引用错误。\n- **视觉设计重复劳动**：为了统一风格，需花费大量时间调整字体、配色和对齐方式，难以快速生成高质量的图表和示意图。\n- **逻辑迭代成本高昂**：一旦领导提出修改大纲或增删章节，整个幻灯片的页码、目录及关联内容都需要人工重新梳理，牵一发而动全身。\n- **缺乏深度洞察**：仅能罗列现有数据，难以在短时间内自动关联外部最新新闻或进行深度的竞品对比分析。\n\n### 使用 PPTAgent 后\n- **全自动深度研究**：PPTAgent 自主调用搜索工具和沙箱环境，实时抓取最新市场动态与竞品数据，自动完成信息清洗与整合。\n- **智能视觉生成**：基于自由形态设计理念，PPTAgent 自动生成符合公司品牌规范的排版，并即时将复杂数据转化为专业图表甚至定制插图。\n- **反射式逻辑优化**：利用其反思机制，PPTAgent 在生成过程中自我检查逻辑连贯性；若需调整大纲，它能自动重构全文结构而无需人工干预。\n- **资产自主创建**：遇到缺失的素材时，PPTAgent 能直接通过文生图功能创建专属配图，确保证据链完整且视觉丰富。\n\nPPTAgent 将原本需要数天协作完成的深度报告制作过程，压缩为一次指令驱动的自动化流程，让创作者从繁琐的排版中解放，专注于核心策略的思考。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ficip-cas_PPTAgent_e91b8bee.jpg","icip-cas","ICIP-CAS","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Ficip-cas_2a499426.png","Chinese Information Processing Laboratory, Institute of Software, Chinese Academy of Sciences",null,"icip_cas","https:\u002F\u002Fwww.icip.org.cn","https:\u002F\u002Fgithub.com\u002Ficip-cas",[81,85,89,93,97],{"name":82,"color":83,"percentage":84},"Python","#3572A5",71.4,{"name":86,"color":87,"percentage":88},"JavaScript","#f1e05a",20,{"name":90,"color":91,"percentage":92},"TypeScript","#3178c6",7.1,{"name":94,"color":95,"percentage":96},"Dockerfile","#384d54",1.3,{"name":98,"color":99,"percentage":100},"Shell","#89e051",0.1,3938,475,"2026-04-05T22:11:37","MIT","Linux, macOS","未说明",{"notes":108,"python":109,"dependencies":110},"不支持原生 Windows，需使用 WSL。macOS 下 CLI 会自动安装 Homebrew、Node.js、Docker、poppler、Playwright 和 llama.cpp 等依赖；Linux 需手动准备环境。支持离线模式（需本地部署 MinerU）。可选集成 Tavily（搜索）、MinerU（PDF 解析）及文生图模型以提升质量。","未说明 (通过 uv 管理)",[111,112,113,114,115,116,117],"uv","playwright","node.js","docker","poppler","llama.cpp","fasttext-language-id",[13,14,35],[120,121,122,123,124,125,6],"agent","llm","presentation","slide","agentic-ai","mcp","2026-03-27T02:49:30.150509","2026-04-06T15:19:06.013296",[129,134,139,144,149,154,159],{"id":130,"question_zh":131,"answer_zh":132,"source_url":133},19310,"安装依赖时遇到 'ModuleNotFoundError: No module named induct' 或 pip install -r requirements.txt 失败怎么办？","这通常是因为 pip 和 setuptools 版本过低导致的。部分云服务器默认的 pip (22.0) 和 setuptools (59.0) 版本无法成功安装。请升级到高版本的 pip 和 setuptools。此外，必须安装维护者提供的 patch 版本的 python-pptx 才能正常运行。","https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fissues\u002F41",{"id":135,"question_zh":136,"answer_zh":137,"source_url":138},19311,"Windows 平台是否支持运行该项目？如果 pip 找不到包怎么办？","PPTAgent 尚未上传到 PyPI，因此不能直接通过包名安装。你需要先克隆（clone）项目代码到本地，然后在项目根目录下运行 `pip install .` 进行安装。项目已修复相关路径问题，支持自行尝试安装。","https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fissues\u002F64",{"id":140,"question_zh":141,"answer_zh":142,"source_url":143},19312,"运行时报错 'Backend is not running or too busy' 或硬件不支持错误是什么原因？","该项目目前仅限 NVIDIA GPU 使用，因为代码中硬编码了 'cuda:0' 等设备调用，不支持其他显卡（如 AMD 或 Intel 集成显卡）。如果你使用的是非 NVIDIA 显卡（例如 780M），即使配置了 Docker 也会报错。请确保使用带有 NVIDIA 显卡的环境，并在 Docker 环境中正确安装 Nvidia Container Toolkit 以启用 GPU 支持。","https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fissues\u002F26",{"id":145,"question_zh":146,"answer_zh":147,"source_url":148},19313,"生成的 PPTX 文件只有标题，缺少图片和内容是怎么回事？","这可能是由于 command_generation 逻辑中的 bug 导致，当内容数量相同时应调用替换而非删除操作。建议检查日志中是否有相关错误信息。如果无法复现，可以尝试在代码中打断点调试。此外，确保使用的是项目 resource 文件夹中提供的最新解析过的 PDF 文件，旧版本文件可能导致解析异常。","https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fissues\u002F46",{"id":150,"question_zh":151,"answer_zh":152,"source_url":153},19314,"遇到 'AttributeError: SlidePlaceholder object has no attribute visible' 错误如何解决？","该错误通常与 python-pptx 库的版本兼容性有关。虽然 requirements.txt 中未明确指定版本，但建议参考相关 Issue（如 #30）确认推荐的 python-pptx 版本。确保安装了兼容的 python-pptx 版本通常可以解决此属性缺失问题。","https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fissues\u002F31",{"id":155,"question_zh":156,"answer_zh":157,"source_url":158},19315,"如何在 macOS 上部署 Ollama 并集成到项目中？","目前官方文档缺乏针对 macOS 的详细指南。用户需自行安装 Ollama 并拉取推荐模型（如 llama3:70b, mistral, qwen-vl）。配置项目时，需在 llms.py 或环境变量中设置 Ollama 的本地 endpoint。如果遇到缓存文件问题，请确保拉取了最新版本的资源文件，因为维护者会不定期更新解析后的缓存数据。","https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fissues\u002F86",{"id":160,"question_zh":161,"answer_zh":162,"source_url":153},19316,"项目推荐使用哪些大语言模型（LLM）和视觉模型？","根据社区反馈，常用的配置包括：语言模型使用 'THUDM\u002Fglm-4-9b-chat' 或 'Qwen\u002FQwen2.5-72B-Instruct'，视觉模型使用 'Qwen\u002FQwen2-VL-72B-Instruct'。API 基址通常设置为 SiliconFlow 的服务地址（如 https:\u002F\u002Fapi.siliconflow.cn\u002Fv1\u002F），具体取决于你使用的服务商。",[164,169,174,179,184],{"id":165,"version":166,"summary_zh":167,"released_at":168},117298,"v2.0.0","# 发布 v2.0.0\n\n\u003Ch2>✨ 新特性\u003C\u002Fh2>\n\u003Cp>PPTAgent V2 引入了革命性的 AI 功能：\u003Cstrong>深度研究集成\u003C\u002Fstrong>可实现智能的多源内容收集与整合，而\u003Cstrong>自由形式的视觉设计\u003C\u002Fstrong>则突破传统模板限制，提供更加灵活的布局。全新的\u003Cstrong>Agent 沙盒\u003C\u002Fstrong>在安全的执行环境中提供了 30 多种专业工具，用于自主创建素材。\u003Cstrong>AI 驱动的图像生成\u003C\u002Fstrong>能够将文本描述转化为定制插图，而\u003Cstrong>DeepPresenter 集成\u003C\u002Fstrong>则通过先进的内容优化功能提升演示文稿的质量。此外，还增强了对扩展模板、改进的 PDF 解析以及多种输入格式（doc、pdf 等）的支持，所有这些都基于更整洁、更易维护的代码库。\u003C\u002Fp>\n\n\u003Ch2>📋 功能支持矩阵\u003C\u002Fh2>\n\n特性 | 支持\n-- | --\n深度研究集成 | ✅ 是\n网页搜索 | ✅ 是\nAI 生成图像 | ✅ 是\nAgent 沙盒（20+ 工具）| ✅ 是\n参考演示文稿 | ✅ 是\n图片\u002F表格填充 | ✅ 是\n多种输入类型（doc、pdf、…）| ✅ 是\n\n## 🔧 技术改进\n\n### 依赖管理\n- 明确指定 python-pptx 版本以确保兼容性 (#153)\n- 移除 GitHub 依赖以提高稳定性\n- 更新 pre-commit 钩子配置\n\n### 代码质量\n- 优化项目结构\n- 改进日志级别控制\n- 修复后端问题\n- 清理遗留 UI 组件\n\n### 版本更新\n- 通过 v0.2.14 进行增量更新\n- 多次使用 pre-commit 自动更新以保持代码质量\n\n\n## 🐛 错误修复\n\n- 修复了后端相关问题\n- 修复了 PDF 解析功能\n- 修复了包数据配置\n\n## 📦 其他更新\n\n- 添加了模板归纳脚本\n- 移除了遗留思维模式组件\n- 调整了日志级别\n- 清理了项目结构以提高可维护性\n\n## 👥 贡献者\n\n### 新贡献者\n* @kylooh 在 #153 中做出了首次贡献\n\n### 核心贡献者\n* @Force1ess - 主要开发与架构设计（21 次提交）\n* @pre-commit-ci[bot] - 自动化维护\n\n感谢所有为本次发布做出贡献的开发者和用户！\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fcompare\u002Fv0.2.0...v2.0.0","2025-12-16T04:15:19",{"id":170,"version":171,"summary_zh":172,"released_at":173},117299,"v0.2.0","## 变更内容\n* 在 \u002Fpptagent_ui 中，由 @dependabot[bot] 将 axios 从 1.7.7 升级至 1.8.2，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F111\n* 功能：添加章节摘要；重构：采用基于规则的函数式布局插入；修复：深拷贝导致的数值不稳定问题，由 @Force1ess 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F113\n* 项目：添加最佳实践；功能：改进图片排版和 Markdown 解析，由 @Force1ess 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F114\n* 功能：改进生成的目录，由 @Force1ess 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F115\n* 【文档】添加推荐的文本嵌入模型，由 @Force1ess 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F116\n* 【文档】添加更多推荐模板，由 @Force1ess 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F122\n* 杂项：删除冗余的 Copilot 设置，由 @Dormiveglia-elf 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F125\n* 修复：Windows 下的编码问题，由 @EvolvedGhost 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F133\n* 【pre-commit.ci】pre-commit 自动更新，由 @pre-commit-ci[bot] 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F132 和 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F136\n* 文档：自动翻译 README 和 Wiki，由 @openaitx-system 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F138\n* 【pre-commit.ci】pre-commit 自动更新，由 @pre-commit-ci[bot] 提交，详见 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F140、https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F143 和 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F145\n\n## 新贡献者\n* @dependabot[bot] 在 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F111 中完成了首次贡献\n* @Dormiveglia-elf 在 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F125 中完成了首次贡献\n* @EvolvedGhost 在 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F133 中完成了首次贡献\n* @openaitx-system 在 https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fpull\u002F138 中完成了首次贡献\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Ficip-cas\u002FPPTAgent\u002Fcompare\u002Fv0.1.0...v0.2.0","2025-10-13T11:22:08",{"id":175,"version":176,"summary_zh":177,"released_at":178},117300,"v0.1.0","📦 更改日志 - v0.1.0\n\n🚀 功能\n- 添加 ModelManager 以实现模型的集中化管理 (3cd629d)\n- 添加 shape_filter.return_father、check_schema 和 small_pic_filter (f24ec16)\n- 为更丰富的形状处理添加 show_empty 和 shape.text 字段 (231d084)\n- 添加 validate_length 工具函数 (42edac1)\n- 支持单张幻灯片聚类及幻灯片交互功能 (2de6898)\n- 支持基于环境变量的配置 (3a51a3e)\n- 在幻灯片编辑中支持可编辑表格 (f2a0e39)\n\n🛠 修复\n- 修复 Presentation 的 pickle 问题 (2c12347)\n- 修复 deepcopy 和长度因子相关的 bug (732dfe0, 28c812c)\n- 修复异步代理排序及 Markdown 分割相关的问题 (de4c5cb)\n- 修复图片去重、占位符路径和形状排序问题 (2de6898)\n- 修复后端导入错误及 JSON 解析问题 (03cedef, 3e0a57a)\n- 修复 CORS、内联样式及重复 API 的问题 (d0ccc40, 3000f8e, b191a54)\n- 修复代理重试及日志级别问题 (231d084)\n\n🔧 改进\n- 通过 LLM 提升文档解析与分块处理能力 (8387aa3)\n- 改进 PPTGen、字体及 ShapeElement 的处理 (b1ed2ca, 3e0a57a)\n- 将幻灯片归纳过程并行化 (498b8d7)\n- 优化文档检索与结构 (60dda0f)\n- 改进断言与日志记录 (f3b52e6, cf34173)\n\n🧪 测试\n- 添加测试：test_document、test_induct 和 test_multimodal (732dfe0, 498b8d7, f2a0e39)\n\n🧱 重构\n- 重构 presentation、pptgen 和 content_induct 模块 (3223e44, 2de6898, 044d7e2)\n\n📦 杂项\n- CI：添加 PR CI 和 push CI 工作流 (2c12347, 94b4227)\n- 添加 PR 模板及 Python 版本检查 (d0f883c)\n- 更新 pre-commit 并进行小幅修复 (f33b0e4, bc8e46b)","2025-04-18T07:17:19",{"id":180,"version":181,"summary_zh":182,"released_at":183},117301,"v0.0.1","| 功能                     | 支持 |\n|-----------------------------|---------|\n| 图片集成                | 是     |\n| 引用演示文稿导入 | 是     |\n| 实验可复现        | 否     |\n| Docker                      | 是     |\n| 图片填充                | 是      |\n| 表格                       | 是      |\n| 异步                       | 是      |\n| 基于图片位置              | 是      |\n| 多文档              | 否      |\n| 外部来源内容        | 否      |\n| AI生成的图片          | 否      |\n| 文本自动适配        | 否      |","2025-03-21T13:57:24",{"id":185,"version":186,"summary_zh":187,"released_at":188},117302,"experiment","这是 `PPTAgent` 的初始版本，包含用于实验、评估和分析的实验性代码。该代码库为本版本所独有。\n\n| 功能                     | 支持 |\n|-----------------------------|---------|\n| 图片集成                | 是     |\n| 参考演示文稿归纳 | 是     |\n| 论文实验        | 是     |\n| Docker                      | 是     |\n| 图片填充                | 否      |\n| 表格                       | 否      |\n| 异步                       | 否      |\n| 多文档              | 否      |\n| 外部来源内容        | 否      |\n| AI生成图片          | 否      |\n| 图片位置感知        | 否      |\n| 文本自动适应        | 否      |","2025-03-21T06:47:06"]