[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"tool-sligter--LandPPT":3,"similar-sligter--LandPPT":129},{"id":4,"github_repo":5,"name":6,"description_en":7,"description_zh":8,"ai_summary_zh":8,"readme_en":9,"readme_zh":10,"quickstart_zh":11,"use_case_zh":12,"hero_image_url":13,"owner_login":14,"owner_name":15,"owner_avatar_url":16,"owner_bio":15,"owner_company":15,"owner_location":15,"owner_email":15,"owner_twitter":15,"owner_website":15,"owner_url":17,"languages":18,"stars":38,"forks":39,"last_commit_at":40,"license":41,"difficulty_score":42,"env_os":43,"env_gpu":44,"env_ram":45,"env_deps":46,"category_tags":60,"github_topics":65,"view_count":42,"oss_zip_url":15,"oss_zip_packed_at":15,"status":69,"created_at":70,"updated_at":71,"faqs":72,"releases":108},5560,"sligter\u002FLandPPT","LandPPT","一个基于LLM的演示文稿生成平台，能够自动将文档内容转换为专业的PPT演示文稿。平台支持多种AI模型，提供丰富的模板和样式选择，让用户能够创建高质量的演示文稿。","LandPPT 是一款基于大语言模型（LLM）的智能演示文稿生成平台，旨在将繁琐的 PPT 制作过程自动化。它能够将 PDF、Word、Markdown 等多种格式的文档内容，一键转换为结构清晰、设计专业的幻灯片，并自动配套生成演讲备注，有效解决了用户从零开始构思大纲、搜集素材及排版设计的痛点，大幅提升了内容创作效率。\n\n这款工具非常适合需要频繁进行汇报的学生、职场人士、教育工作者以及希望快速原型化的研究人员使用。无论是制作学术报告、商业计划书还是教学课件，LandPPT 都能提供得力辅助。同时，由于其支持本地部署和灵活的 API 配置，也深受关注数据安全的开发者和企业团队青睐。\n\n在技术亮点方面，LandPPT 展现了强大的兼容性与智能化能力。它不仅支持 OpenAI、Claude、Gemini 及本地 Ollama 等三十余种主流 AI 模型，允许用户按需定制以平衡成本与效果，还集成了深度研究功能，能联网获取最新信息。其独特的智能配图系统可结合本地图库、网络搜索与 AI 生成技术自动匹配图像，配合响应式模板引擎，确保生成的每一页幻灯片都兼具美观与专业性。","# LandPPT - AI驱动的PPT生成平台\n\n[![GitHub stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fsligter\u002FLandPPT?style=flat-square)](https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fstargazers)\n[![GitHub forks](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002Fsligter\u002FLandPPT?style=flat-square)](https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fnetwork)\n[![GitHub issues](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002Fsligter\u002FLandPPT?style=flat-square)](https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues)\n[![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-Apache%202.0-blue.svg?style=flat-square)](LICENSE)\n[![Python](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpython-3.11+-blue.svg?style=flat-square)](https:\u002F\u002Fwww.python.org)\n[![FastAPI](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FFastAPI-0.104+-green.svg?style=flat-square)](https:\u002F\u002Ffastapi.tiangolo.com)\n[![Docker](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fdocker-supported-blue.svg?style=flat-square)](https:\u002F\u002Fhub.docker.com\u002Fr\u002Fbradleylzh\u002Flandppt)\n[![Ask DeepWiki](https:\u002F\u002Fdeepwiki.com\u002Fbadge.svg)](https:\u002F\u002Fdeepwiki.com\u002Fsligter\u002FLandPPT)\n\n---\n\n##  Open to Opportunities\n\n如果你对我的项目感兴趣，欢迎联系我！\n\n[![Email](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002F_Email-ai%40yydsapp.com-blue?style=for-the-badge)](mailto:ai@yydsapp.com)\n\n---\n\n\n[English](README_EN.md) | **中文**\n\n---\n\n##  目录\n\n- [项目简介](#-项目简介)\n- [功能亮点](#-功能亮点)\n- [核心功能](#-核心功能)\n- [快速开始](#-快速开始)\n- [使用指南](#-使用指南)\n- [配置说明](#-配置说明)\n- [API文档](#-api文档)\n- [技术栈](#-技术栈)\n- [常见问题](#-常见问题)\n- [许可证](#-许可证)\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_dd58139c204b.png\" width=\"180\" alt=\"LandPPT Logo\" \u002F>\n  \u003Cp>\n    \u003Cb>基于大语言模型（LLM）的智能演示文稿生成平台\u003C\u002Fb>\n  \u003C\u002Fp>\n\u003C\u002Fdiv>\n\nLandPPT 是一个基于大语言模型（LLM）的智能演示文稿生成平台，能够自动将文档内容转换为专业的PPT演示文稿。平台集成了多种AI模型、智能图像处理、深度研究功能和丰富的模板系统，让用户能够轻松创建高质量的演示文稿\n\n[在线体验站](https:\u002F\u002Fcloud.landppt.com) | [文档指南](http:\u002F\u002Flandppt-doc.52yyds.top\u002Fdocs)\n\n### 主界面\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_d8c5f92e3e58.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_45f4c479885a.png)\n\n### 生成大纲\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_d19d07ccda0e.png)\n\n### 生成效果\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_e6caeb7eaf30.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_0a23583109fb.png)\n\n### 在线编辑\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_dbe28fd7cb08.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_e1a402cf69c6.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_4d555f8629e7.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_f2f16de8ec66.png)\n\n### 讲稿生成\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_84806a94291a.png)\n\n### 导出效果\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_f1d56e65be15.png)\n\n### 模板生成\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_5b072c367914.png)\n\n##  功能亮点\n\n- **一键生成**：从主题到完整PPT，全程AI自动化处理\n- **智能配图**：AI自动匹配最适合的图像，支持多源获取和参考图片生成\n- **TODO 任务板**：全新交互式任务管理界面，实时追踪生成进度，支持复杂动画反馈\n- **深度研究**：集成多个搜索引擎，获取最新最全面的信息\n- **并行生成**：支持幻灯片内容并行生成，配合增强型 AI 服务显著提升构建速度\n- **演讲稿生成**：智能生成配套演讲稿，支持多种导出格式\n- **视觉参考**：AI编辑助手支持图像上传和视觉内容分析\n- **多文件上传**：支持同时上传多个文件，批量处理更高效\n- **模型自定义**：按功能自定义模型选择，精准控制成本\n- **配置中心**：可视化配置AI提供商与模型，支持一键测试、模型列表获取，并支持按任务角色指定不同提供商\u002F模型\n- **自由模板**：AI自动生成项目专属母版模板，支持响应式16:9铺满展示，并适配标题\u002F目录\u002F内容\u002F结尾等页面类型\n- **备注导出**：支持将演讲稿导出至PPT备注栏\n- **图片导出**：支持以图片格式导出PPT页面\n- **企业级安全**：支持本地部署，数据安全可控\n\n##  核心功能\n\n###  多AI提供商支持\n- **OpenAI GPT系列**：GPT-4o、GPT-4o-mini 等模型，支持官方 Responses API 与 reasoning effort 推理程度参数\n- **OpenAI兼容提供商**：DeepSeek、Kimi、MiniMax（M2.7 \u002F M2.5）等（通过 Base URL + API Key 接入）\n- **Anthropic Claude**：Claude-4 Sonnet、Claude-4 Haiku 系列模型\n- **Google Gemini**：Gemini-2.5 Flash、Gemini-2.5 Pro 系列模型，支持自定义端点配置\n- **Ollama**：本地部署的开源模型，支持 Llama、Mistral 等\n- **302.AI**：OpenAI兼容接口\n\n###  强大的文件处理能力\n- **多格式支持**：PDF、Word、Markdown、TXT、Excel 等多种格式\n- **智能解析**：使用 MinerU 和 MarkItDown 进行高质量内容提取\n- **深度研究**：集成 Tavily API 和 SearXNG 的多源研究功能\n- **内容增强**：自动网页内容提取和智能摘要生成\n\n###  智能图像处理系统\n- **多源图像获取**：本地图库、网络搜索、AI生成三合一\n- **网络图像搜索**：支持 Pixabay、Unsplash 等图库\n- **AI图像生成**：集成 DALL-E、SiliconFlow、Pollinations、 Openai、Gemini等服务\n- **智能图像选择**：AI自动匹配最适合的图像内容\n- **图像处理优化**：自动尺寸调整、格式转换、质量优化\n\n###  增强研究功能\n- **多引擎搜索**：Tavily 和 SearXNG 双引擎支持\n- **深度内容提取**：智能网页内容解析和结构化处理\n- **多语言支持**：支持中英文等多语言研究内容\n- **实时信息获取**：获取最新的网络信息和数据\n\n###  丰富的模板系统\n- **全局主模板**：统一的HTML模板系统，支持响应式设计\n- **多样化布局**：AI生成多种创意页面布局和设计风格\n- **场景化模板**：通用、旅游、教育等多种专业场景模板\n- **项目适配模板**：新增针对项目的适配模板生成\n- **自定义模板**：支持导入和创建个性化模板\n- **参考图片生成**：AI模板生成支持参考图片，智能匹配设计风格\n\n###  完整的项目管理\n- **四阶段工作流**：需求确认  大纲生成  TODO 进度追踪  PPT生成\n- **TODO 任务看板**：集成式任务管理，实时显示生成状态、日志与动画\n- **可视化编辑**：直观的大纲编辑器和实时预览\n- **批量操作**：支持批量生成和处理多个项目\n\n###  现代化Web界面\n- **直观操作**：用户友好的响应式Web界面\n- **AI聊天编辑**：侧边栏AI编辑功能，支持实时对话和视觉参考\n- **演讲稿生成**：支持单页\u002F多页\u002F全部幻灯片的演讲稿生成，导出为DOCX\u002FMarkdown格式\n- **多格式导出**：PDF\u002FHTML\u002FPPTX 多种格式导出支持\n- **实时预览**：16:9 标准比例的实时页面预览\n\n##  快速开始\n\n### 系统要求\n- Python 3.11+\n- SQLite 3\n- Docker (可选)\n\n### 本地安装\n\n#### 方法一：uv（推荐）\n\n```bash\n# 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT.git\ncd LandPPT\n\n# 安装uv（如果尚未安装）\n# Windows (PowerShell)\npowershell -ExecutionPolicy ByPass -c \"irm https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.ps1 | iex\"\n# macOS\u002FLinux\ncurl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh\n\n# 使用uv同步环境\nuv sync\n\n# 安装额外依赖（可选，用于标准PPTX导出）\nuv pip install apryse-sdk --extra-index-url=https:\u002F\u002Fpypi.apryse.com\n\n# 配置环境变量\ncp .env.example .env\n# 编辑 .env 文件，配置你的AI API密钥\n\n# 启动服务\nuv run python run.py\n```\n\n#### 方法二：传统pip安装\n\n```bash\n# 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT.git\ncd LandPPT\n\n# 创建虚拟环境\npython -m venv venv\n# 激活虚拟环境\n# Windows\nvenv\\Scripts\\activate\n# macOS\u002FLinux\nsource venv\u002Fbin\u002Factivate\n\n# 安装依赖\npip install -e .\n\n# 配置环境变量\ncp .env.example .env\n# 编辑 .env 文件，配置你的AI API密钥\n\n# 启动服务\npython run.py\n```\n\n### Docker部署\n\n#### 使用预构建镜像（推荐）\n\n```bash\n# 拉取最新镜像\ndocker pull bradleylzh\u002Flandppt:latest\n\n# 运行容器\ndocker run -d \\\n  --name landppt \\\n  -p 8000:8000 \\\n  -v $(pwd)\u002F.env:\u002Fapp\u002F.env \\\n  -v landppt_data:\u002Fapp\u002Fdata \\\n  -v landppt_reports:\u002Fapp\u002Fresearch_reports \\\n  -v landppt_cache:\u002Fapp\u002Ftemp \\\n  bradleylzh\u002Flandppt:latest\n\n# 查看日志\ndocker logs -f landppt\n```\n\n> **注意**: 确保在运行前创建并配置好 `.env` 文件，包含必要的API密钥。\n\n\n##  使用指南\n\n### 1. 访问Web界面\n启动服务后，访问以下地址：\n- **Web界面**: http:\u002F\u002Flocalhost:8000\n- **API文档**: http:\u002F\u002Flocalhost:8000\u002Fdocs\n- **健康检查**: http:\u002F\u002Flocalhost:8000\u002Fhealth\n\n(初始账号`admin`密码`admin123`)\n\n### 2. 配置AI提供商\n在设置页面配置你的AI API密钥：\n- OpenAI API Key(支持openai 兼容model api，例如deepseek、moonshot、qwen等等)\n- Anthropic API Key\n- Google API Key\n- 302.AI API Key\n- 或配置本地Ollama服务\n\n### 3. 创建PPT项目\n1. **需求确认**：输入主题、选择受众、设置页数范围、选择场景模板\n2. **大纲生成**：AI智能生成结构化大纲，支持可视化编辑\n3. **内容研究**：可选择启用深度研究功能，获取最新相关信息\n4. **图像配置**：配置图像获取方式（本地\u002F网络\u002FAI生成）\n5. **PPT生成**：基于大纲生成完整的HTML演示文稿\n\n### 4. 编辑和导出\n- 使用AI聊天功能实时编辑内容和样式，支持图像上传进行视觉参考\n- 支持图像替换和优化，AI模板生成可参考上传的图片\n- 生成配套演讲稿，支持单页\u002F多页\u002F全部幻灯片模式\n- 导出为PDF、HTML、PPTX、演讲稿DOCX\u002FMarkdown格式\n- 保存项目版本和历史记录\n- 支持批量处理和模板复用\n\n##  配置说明\n\n### 环境变量配置\n\n主要配置项（详见 `.env.example`）：\n\n```bash\n# AI提供商配置\nDEFAULT_AI_PROVIDER=openai  # openai \u002F deepseek \u002F kimi \u002F minimax \u002F anthropic \u002F google \u002F ollama \u002F 302ai\n\n# OpenAI\nOPENAI_API_KEY=your_openai_api_key_here\nOPENAI_BASE_URL=https:\u002F\u002Fapi.openai.com\u002Fv1\nOPENAI_MODEL=gpt-4o\nOPENAI_USE_RESPONSES_API=false  # 使用 OpenAI 官方 \u002Fv1\u002Fresponses 接口\nOPENAI_ENABLE_REASONING=false   # 启用 OpenAI reasoning 参数\nOPENAI_REASONING_EFFORT=medium  # low \u002F medium \u002F high\n\n# OpenAI兼容提供商（通过 Base URL + API Key 接入）\nDEEPSEEK_API_KEY=\nDEEPSEEK_BASE_URL=https:\u002F\u002Fapi.deepseek.com\u002Fv1\nDEEPSEEK_MODEL=deepseek-chat\n\nKIMI_API_KEY=\nKIMI_BASE_URL=https:\u002F\u002Fapi.moonshot.cn\u002Fv1\nKIMI_MODEL=kimi-k2.5\n\nMINIMAX_API_KEY=\nMINIMAX_BASE_URL=https:\u002F\u002Fapi.minimax.io\u002Fv1\nMINIMAX_MODEL=MiniMax-M2.7\n\n# 302.AI（OpenAI兼容）\n302AI_API_KEY=\n302AI_BASE_URL=https:\u002F\u002Fapi.302.ai\u002Fv1\n302AI_MODEL=gpt-4o\n\n# Anthropic\nANTHROPIC_API_KEY=your_anthropic_api_key_here\nANTHROPIC_BASE_URL=https:\u002F\u002Fapi.anthropic.com\nANTHROPIC_MODEL=claude-3-5-sonnet-20241022\n\n# Google Gemini\nGOOGLE_API_KEY=your_google_api_key_here\nGOOGLE_BASE_URL=https:\u002F\u002Fgenerativelanguage.googleapis.com  # 自定义Gemini端点\nGOOGLE_MODEL=gemini-2.5-flash\n\n# 服务器配置\nHOST=0.0.0.0\nPORT=8000\nSECRET_KEY=your-secure-secret-key\n\n# 研究功能配置\nTAVILY_API_KEY=your_tavily_api_key_here        # Tavily 搜索引擎\nSEARXNG_HOST=http:\u002F\u002Flocalhost:8888             # SearXNG 实例地址\nRESEARCH_PROVIDER=tavily                       # 研究提供商：tavily, searxng, both\n\n# 图像服务配置\nENABLE_IMAGE_SERVICE=true                      # 启用图像服务\nPIXABAY_API_KEY=your_pixabay_api_key_here     # Pixabay 图库\nUNSPLASH_ACCESS_KEY=your_unsplash_key_here    # Unsplash 图库\nSILICONFLOW_API_KEY=your_siliconflow_key_here # AI图像生成\nPOLLINATIONS_API_BASE=https:\u002F\u002Fgen.pollinations.ai # Pollinations 图片接口\nPOLLINATIONS_API_TOKEN=your_pollinations_api_key # Pollinations API Key（Authorization: Bearer 或 ?key=）\nPOLLINATIONS_MODEL=flux                       # Pollinations 图片模型（flux\u002Fkontext\u002Fturbo 等）\n\n# 导出功能配置\nAPRYSE_LICENSE_KEY=your_apryse_key_here       # PPTX导出\n\n# 生成参数\nMAX_TOKENS=8192\nTEMPERATURE=0.7\n```\n\n说明：OpenAI 提供商可通过 `OPENAI_USE_RESPONSES_API=true` 切换到官方 `\u002Fv1\u002Fresponses` 接口，并在启用 `OPENAI_ENABLE_REASONING=true` 后使用 `OPENAI_REASONING_EFFORT=low|medium|high` 配置推理程度。\n\n##  API文档\n\n启动服务后访问：\n- **Swagger UI**: `http:\u002F\u002Flocalhost:8000\u002Fdocs`\n- **ReDoc**: `http:\u002F\u002Flocalhost:8000\u002Fredoc`\n\n##  技术栈\n\n### 后端技术\n- **FastAPI**: 现代化的Python Web框架，支持异步处理\n- **SQLAlchemy**: ORM数据库操作，支持多种数据库\n- **Pydantic**: 数据验证和序列化，类型安全\n- **Uvicorn**: 高性能ASGI服务器\n\n### AI集成\n- **OpenAI**: GPT-4o、GPT-4o-mini 等最新模型\n- **OpenAI-Compatible**: DeepSeek \u002F Kimi \u002F MiniMax \u002F 302.AI（通过 OpenAI SDK 的 Base URL 接入）\n- **Anthropic**: Claude-4.5 系列模型\n- **Google AI**: Gemini-2.5 系列模型\n- **LangChain**: AI应用开发框架和工具链\n- **Ollama**: 本地模型部署和管理\n\n### 文件处理\n- **MinerU**: 高质量PDF智能解析和结构化提取\n- **MarkItDown**: 多格式文档转换（Word、Excel、PowerPoint等）\n- **BeautifulSoup4**: HTML\u002FXML解析和处理\n\n### 图像处理\n- **Pillow**: 图像处理和格式转换\n- **OpenAI DALL-E**: AI图像生成\n- **SiliconFlow**: 国产AI图像生成服务\n- **Pollinations**: gen.pollinations.ai 图片生成 API，支持多模型\n\n### 研究功能\n- **Tavily**: 专业搜索引擎API\n- **SearXNG**: 开源元搜索引擎\n- **Playwright**: 网页内容提取\n\n### 导出功能\n- **Playwright**: HTML转PDF高质量导出\n- **Apryse SDK**: 专业PPT生成和转换\n\n##  贡献指南\n\n欢迎所有形式的贡献！\n\n### 如何贡献\n1. Fork 本仓库\n2. 创建特性分支 (`git checkout -b feature\u002FAmazingFeature`)\n3. 提交更改 (`git commit -m 'Add some AmazingFeature'`)\n4. 推送到分支 (`git push origin feature\u002FAmazingFeature`)\n5. 开启 Pull Request\n\n详情请见 [贡献指南](CONTRIBUTING.md)。\n\n### 报告问题\n如果你发现了bug或有功能建议，请在 [Issues](https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues) 页面创建新的issue。\n\n##  常见问题\n\n### Q: 支持哪些AI模型？\nA: 支持 OpenAI、Anthropic Claude、Google Gemini、Ollama，以及 OpenAI 兼容提供商（DeepSeek \u002F Kimi \u002F MiniMax \u002F 302.AI）。可以在配置页面切换不同的AI提供商。其中 OpenAI 提供商支持 Responses API 请求模式和 reasoning effort 推理程度参数。\n\n### Q: 如何配置图像功能？\nA: 在 `.env` 文件中配置相应的API密钥：\n- Pixabay: `PIXABAY_API_KEY`\n- Unsplash: `UNSPLASH_ACCESS_KEY`\n- AI生成: `SILICONFLOW_API_KEY` 或 `POLLINATIONS_API_TOKEN`\n\n### Q:在使用反向代理（如Nginx、Apache等）时，如果没有正确配置`base_url`，会出现以下问题：\n- 图片链接仍然显示为`localhost:8000`\n- 前端无法正确加载图片\n- 图片预览、下载等功能异常\n\nA:  通过Web界面配置\n\n1. 访问系统配置页面：`https:\u002F\u002Fyour-domain.com\u002Fai-config`\n2. 切换到\"应用配置\"标签页\n3. 在\"基础URL (BASE_URL)\"字段中输入您的代理域名\n4. 例如：`https:\u002F\u002Fyour-domain.com` 或 `http:\u002F\u002Fyour-domain.com:8080`\n5. 点击\"保存应用配置\"\n\n### Q: 研究功能如何使用？\nA: 配置 `TAVILY_API_KEY` 或部署 SearXNG 实例，然后在创建PPT时启用研究功能即可自动获取相关信息。\n\n### Q: 支持本地部署吗？\nA: 完全支持本地部署，可以使用 Docker 或直接安装。支持 Ollama 本地模型，无需依赖外部API。\n\n### Q: 如何导出PPTX格式？\nA: 需要配置 `APRYSE_LICENSE_KEY`，然后在导出选项中选择PPTX格式。\n\n### Q: 并行生成会影响PPT质量吗？\nA: 不会。并行生成只是改变了生成顺序，每页的生成逻辑和质量保持不变。\n\n### Q: 所有AI提供商都支持批量生成吗？\nA: 大多数AI提供商支持并发请求，但可能有不同的限制。建议查看您使用的AI服务的API文档。\n\n##  许可证\n\n本项目采用 Apache License 2.0 许可证。详情请见 [LICENSE](LICENSE) 文件。\n\n## Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_074d31938c45.png)](https:\u002F\u002Fwww.star-history.com\u002F#sligter\u002FLandPPT&Date)\n\n##  联系我们\n\n- **项目主页**: https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\n- **问题反馈**: https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\n- **讨论区**: https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fdiscussions\n\n---\n\n\u003Cdiv align=\"center\">\n\n**如果这个项目对你有帮助，请给我们一个  Star！**\n\nMade with  by the LandPPT Team\n\n\u003C\u002Fdiv>\n","# LandPPT - 基于AI的PPT生成平台\n\n[![GitHub 星标](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fsligter\u002FLandPPT?style=flat-square)](https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fstargazers)\n[![GitHub 分支](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fforks\u002Fsligter\u002FLandPPT?style=flat-square)](https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fnetwork)\n[![GitHub 问题](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fissues\u002Fsligter\u002FLandPPT?style=flat-square)](https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues)\n[![许可证](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-Apache%202.0-blue.svg?style=flat-square)](LICENSE)\n[![Python](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpython-3.11+-blue.svg?style=flat-square)](https:\u002F\u002Fwww.python.org)\n[![FastAPI](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FFastAPI-0.104+-green.svg?style=flat-square)](https:\u002F\u002Ffastapi.tiangolo.com)\n[![Docker](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fdocker-supported-blue.svg?style=flat-square)](https:\u002F\u002Fhub.docker.com\u002Fr\u002Fbradleylzh\u002Flandppt)\n[![Ask DeepWiki](https:\u002F\u002Fdeepwiki.com\u002Fbadge.svg)](https:\u002F\u002Fdeepwiki.com\u002Fsligter\u002FLandPPT)\n\n---\n\n##  欢迎交流合作\n\n如果你对我的项目感兴趣，欢迎联系我！\n\n[![Email](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002F_Email-ai%40yydsapp.com-blue?style=for-the-badge)](mailto:ai@yydsapp.com)\n\n---\n\n\n[English](README_EN.md) | **中文**\n\n---\n\n##  目录\n\n- [项目简介](#-项目简介)\n- [功能亮点](#-功能亮点)\n- [核心功能](#-核心功能)\n- [快速开始](#-快速开始)\n- [使用指南](#-使用指南)\n- [配置说明](#-配置说明)\n- [API文档](#-API文档)\n- [技术栈](#-技术栈)\n- [常见问题](#-常见问题)\n- [许可证](#-许可证)\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_dd58139c204b.png\" width=\"180\" alt=\"LandPPT Logo\" \u002F>\n  \u003Cp>\n    \u003Cb>基于大语言模型（LLM）的智能演示文稿生成平台\u003C\u002Fb>\n  \u003C\u002Fp>\n\u003C\u002Fdiv>\n\nLandPPT 是一个基于大语言模型（LLM）的智能演示文稿生成平台，能够自动将文档内容转换为专业的PPT演示文稿。平台集成了多种AI模型、智能图像处理、深度研究功能和丰富的模板系统，让用户能够轻松创建高质量的演示文稿\n\n[在线体验站](https:\u002F\u002Fcloud.landppt.com) | [文档指南](http:\u002F\u002Flandppt-doc.52yyds.top\u002Fdocs)\n\n### 主界面\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_d8c5f92e3e58.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_45f4c479885a.png)\n\n### 生成大纲\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_d19d07ccda0e.png)\n\n### 生成效果\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_e6caeb7eaf30.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_0a23583109fb.png)\n\n### 在线编辑\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_dbe28fd7cb08.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_e1a402cf69c6.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_4d555f8629e7.png)\n\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_f2f16de8ec66.png)\n\n### 讲稿生成\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_84806a94291a.png)\n\n### 导出效果\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_f1d56e65be15.png)\n\n### 模板生成\n![image](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_5b072c367914.png)\n\n##  功能亮点\n\n- **一键生成**：从主题到完整PPT，全程AI自动化处理\n- **智能配图**：AI自动匹配最适合的图像，支持多源获取和参考图片生成\n- **TODO 任务板**：全新交互式任务管理界面，实时追踪生成进度，支持复杂动画反馈\n- **深度研究**：集成多个搜索引擎，获取最新最全面的信息\n- **并行生成**：支持幻灯片内容并行生成，配合增强型 AI 服务显著提升构建速度\n- **演讲稿生成**：智能生成配套演讲稿，支持多种导出格式\n- **视觉参考**：AI编辑助手支持图像上传和视觉内容分析\n- **多文件上传**：支持同时上传多个文件，批量处理更高效\n- **模型自定义**：按功能自定义模型选择，精准控制成本\n- **配置中心**：可视化配置AI提供商与模型，支持一键测试、模型列表获取，并支持按任务角色指定不同提供商\u002F模型\n- **自由模板**：AI自动生成项目专属母版模板，支持响应式16:9铺满展示，并适配标题\u002F目录\u002F内容\u002F结尾等页面类型\n- **备注导出**：支持将演讲稿导出至PPT备注栏\n- **图片导出**：支持以图片格式导出PPT页面\n- **企业级安全**：支持本地部署，数据安全可控\n\n##  核心功能\n\n###  多AI提供商支持\n- **OpenAI GPT系列**：GPT-4o、GPT-4o-mini 等模型，支持官方 Responses API 与 reasoning effort 推理程度参数\n- **OpenAI兼容提供商**：DeepSeek、Kimi、MiniMax（M2.7 \u002F M2.5）等（通过 Base URL + API Key 接入）\n- **Anthropic Claude**：Claude-4 Sonnet、Claude-4 Haiku 系列模型\n- **Google Gemini**：Gemini-2.5 Flash、Gemini-2.5 Pro 系列模型，支持自定义端点配置\n- **Ollama**：本地部署的开源模型，支持 Llama、Mistral 等\n- **302.AI**：OpenAI兼容接口\n\n###  强大的文件处理能力\n- **多格式支持**：PDF、Word、Markdown、TXT、Excel 等多种格式\n- **智能解析**：使用 MinerU 和 MarkItDown 进行高质量内容提取\n- **深度研究**：集成 Tavily API 和 SearXNG 的多源研究功能\n- **内容增强**：自动网页内容提取和智能摘要生成\n\n###  智能图像处理系统\n- **多源图像获取**：本地图库、网络搜索、AI生成三合一\n- **网络图像搜索**：支持 Pixabay、Unsplash 等图库\n- **AI图像生成**：集成 DALL-E、SiliconFlow、Pollinations、 Openai、Gemini 等服务\n- **智能图像选择**：AI自动匹配最适合的图像内容\n- **图像处理优化**：自动尺寸调整、格式转换、质量优化\n\n###  增强研究功能\n- **多引擎搜索**：Tavily 和 SearXNG 双引擎支持\n- **深度内容提取**：智能网页内容解析和结构化处理\n- **多语言支持**：支持中英文等多语言研究内容\n- **实时信息获取**：获取最新的网络信息和数据\n\n###  丰富的模板系统\n- **全局主模板**：统一的HTML模板系统，支持响应式设计\n- **多样化布局**：AI生成多种创意页面布局和设计风格\n- **场景化模板**：通用、旅游、教育等多种专业场景模板\n- **项目适配模板**：新增针对项目的适配模板生成\n- **自定义模板**：支持导入和创建个性化模板\n- **参考图片生成**：AI模板生成支持参考图片，智能匹配设计风格\n\n###  完整的项目管理\n- **四阶段工作流**：需求确认  大纲生成  TODO 进度追踪  PPT生成\n- **TODO 任务看板**：集成式任务管理，实时显示生成状态、日志与动画\n- **可视化编辑**：直观的大纲编辑器和实时预览\n- **批量操作**：支持批量生成和处理多个项目\n\n###  现代化Web界面\n- **直观操作**：用户友好的响应式Web界面\n- **AI聊天编辑**：侧边栏AI编辑功能，支持实时对话和视觉参考\n- **演讲稿生成**：支持单页\u002F多页\u002F全部幻灯片的演讲稿生成，导出为DOCX\u002FMarkdown格式\n- **多格式导出**：PDF\u002FHTML\u002FPPTX 多种格式导出支持\n- **实时预览**：16:9 标准比例的实时页面预览\n\n##  快速开始\n\n### 系统要求\n- Python 3.11+\n- SQLite 3\n- Docker (可选)\n\n### 本地安装\n\n#### 方法一：uv（推荐）\n\n```bash\n# 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT.git\ncd LandPPT\n\n# 安装uv（如果尚未安装）\n# Windows (PowerShell)\npowershell -ExecutionPolicy ByPass -c \"irm https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.ps1 | iex\"\n# macOS\u002FLinux\ncurl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh\n\n# 使用uv同步环境\nuv sync\n\n# 安装额外依赖（可选，用于标准PPTX导出）\nuv pip install apryse-sdk --extra-index-url=https:\u002F\u002Fpypi.apryse.com\n\n# 配置环境变量\ncp .env.example .env\n# 编辑 .env 文件，配置你的AI API密钥\n\n# 启动服务\nuv run python run.py\n```\n\n#### 方法二：传统pip安装\n\n```bash\n# 克lon项目\ngit clone https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT.git\ncd LandPPT\n\n# 创建虚拟环境\npython -m venv venv\n# 激活虚拟环境\n# Windows\nvenv\\Scripts\\activate\n# macOS\u002FLinux\nsource venv\u002Fbin\u002Factivate\n\n# 安装依赖\npip install -e .\n\n# 配置环境变量\ncp .env.example .env\n# 编辑 .env 文件，配置你的AI API密钥\n\n# 启动服务\npython run.py\n```\n\n### Docker部署\n\n#### 使用预构建镜像（推荐）\n\n```bash\n# 拉取最新镜像\ndocker pull bradleylzh\u002Flandppt:latest\n\n# 运行容器\ndocker run -d \\\n  --name landppt \\\n  -p 8000:8000 \\\n  -v $(pwd)\u002F.env:\u002Fapp\u002F.env \\\n  -v landppt_data:\u002Fapp\u002Fdata \\\n  -v landppt_reports:\u002Fapp\u002Fresearch_reports \\\n  -v landppt_cache:\u002Fapp\u002Ftemp \\\n  bradleylzh\u002Flandppt:latest\n\n# 查看日志\ndocker logs -f landppt\n```\n\n> **注意**: 确保在运行前创建并配置好 `.env` 文件，包含必要的API密钥。\n\n\n##  使用指南\n\n### 1. 访问Web界面\n启动服务后，访问以下地址：\n- **Web界面**: http:\u002F\u002Flocalhost:8000\n- **API文档**: http:\u002F\u002Flocalhost:8000\u002Fdocs\n- **健康检查**: http:\u002F\u002Flocalhost:8000\u002Fhealth\n\n(初始账号`admin`密码`admin123`)\n\n### 2. 配置AI提供商\n在设置页面配置你的AI API密钥：\n- OpenAI API Key(支持openai 兼容model api，例如deepseek、moonshot、qwen等等)\n- Anthropic API Key\n- Google API Key\n- 302.AI API Key\n- 或配置本地Ollama服务\n\n### 3. 创建PPT项目\n1. **需求确认**：输入主题、选择受众、设置页数范围、选择场景模板\n2. **大纲生成**：AI智能生成结构化大纲，支持可视化编辑\n3. **内容研究**：可选择启用深度研究功能，获取最新相关信息\n4. **图像配置**：配置图像获取方式（本地\u002F网络\u002FAI生成）\n5. **PPT生成**：基于大纲生成完整的HTML演示文稿\n\n### 4. 编辑和导出\n- 使用AI聊天功能实时编辑内容和样式，支持图像上传进行视觉参考\n- 支持图像替换和优化，AI模板生成可参考上传的图片\n- 生成配套演讲稿，支持单页\u002F多页\u002F全部幻灯片模式\n- 导出为PDF、HTML、PPTX、演讲稿DOCX\u002FMarkdown格式\n- 保存项目版本和历史记录\n- 支持批量处理和模板复用\n\n##  配置说明\n\n### 环境变量配置\n\n主要配置项（详见 `.env.example`）：\n\n```bash\n# AI提供商配置\nDEFAULT_AI_PROVIDER=openai  # openai \u002F deepseek \u002F kimi \u002F minimax \u002F anthropic \u002F google \u002F ollama \u002F 302ai\n\n# OpenAI\nOPENAI_API_KEY=your_openai_api_key_here\nOPENAI_BASE_URL=https:\u002F\u002Fapi.openai.com\u002Fv1\nOPENAI_MODEL=gpt-4o\nOPENAI_USE_RESPONSES_API=false  # 使用 OpenAI 官方 \u002Fv1\u002Fresponses 接口\nOPENAI_ENABLE_REASONING=false   # 启用 OpenAI reasoning 参数\nOPENAI_REASONING_EFFORT=medium  # low \u002F medium \u002F high\n\n# OpenAI兼容提供商（通过 Base URL + API Key 接入）\nDEEPSEEK_API_KEY=\nDEEPSEEK_BASE_URL=https:\u002F\u002Fapi.deepseek.com\u002Fv1\nDEEPSEEK_MODEL=deepseek-chat\n\nKIMI_API_KEY=\nKIMI_BASE_URL=https:\u002F\u002Fapi.moonshot.cn\u002Fv1\nKIMI_MODEL=kimi-k2.5\n\nMINIMAX_API_KEY=\nMINIMAX_BASE_URL=https:\u002F\u002Fapi.minimax.io\u002Fv1\nMINIMAX_MODEL=MiniMax-M2.7\n\n# 302.AI（OpenAI兼容）\n302AI_API_KEY=\n302AI_BASE_URL=https:\u002F\u002Fapi.302.ai\u002Fv1\n302AI_MODEL=gpt-4o\n\n# Anthropic\nANTHROPIC_API_KEY=your_anthropic_api_key_here\nANTHROPIC_BASE_URL=https:\u002F\u002Fapi.anthropic.com\nANTHROPIC_MODEL=claude-3-5-sonnet-20241022\n\n# Google Gemini\nGOOGLE_API_KEY=your_google_api_key_here\nGOOGLE_BASE_URL=https:\u002F\u002Fgenerativelanguage.googleapis.com  # 自定义Gemini端点\nGOOGLE_MODEL=gemini-2.5-flash\n\n# 服务器配置\nHOST=0.0.0.0\nPORT=8000\nSECRET_KEY=your-secure-secret-key\n\n# 研究功能配置\nTAVILY_API_KEY=your_tavily_api_key_here        # Tavily 搜索引擎\nSEARXNG_HOST=http:\u002F\u002Flocalhost:8888             # SearXNG 实例地址\nRESEARCH_PROVIDER=tavily                       # 研究提供商：tavily, searxng, both\n\n# 图像服务配置\nENABLE_IMAGE_SERVICE=true                      # 启用图像服务\nPIXABAY_API_KEY=your_pixabay_api_key_here     # Pixabay 图库\nUNSPLASH_ACCESS_KEY=your_unsplash_key_here    # Unsplash 图库\nSILICONFLOW_API_KEY=your_siliconflow_key_here # AI图像生成\nPOLLINATIONS_API_BASE=https:\u002F\u002Fgen.pollinations.ai # Pollinations 图片接口\nPOLLINATIONS_API_TOKEN=your_pollinations_api_key # Pollinations API Key（Authorization: Bearer 或 ?key=）\nPOLLINATIONS_MODEL=flux                       # Pollinations 图片模型（flux\u002Fkontext\u002Fturbo 等）\n\n# 导出功能配置\nAPRYSE_LICENSE_KEY=your_apryse_key_here       # PPTX导出\n\n# 生成参数\nMAX_TOKENS=8192\nTEMPERATURE=0.7\n```\n\n说明：OpenAI 提供商可通过 `OPENAI_USE_RESPONSES_API=true` 切换到官方 `\u002Fv1\u002Fresponses` 接口，并在启用 `OPENAI_ENABLE_REASONING=true` 后使用 `OPENAI_REASONING_EFFORT=low|medium|high` 配置推理程度。\n\n##  API文档\n\n启动服务后访问：\n- **Swagger UI**: `http:\u002F\u002Flocalhost:8000\u002Fdocs`\n- **ReDoc**: `http:\u002F\u002Flocalhost:8000\u002Fredoc`\n\n##  技术栈\n\n### 后端技术\n- **FastAPI**: 现代化的Python Web框架，支持异步处理\n- **SQLAlchemy**: ORM数据库操作，支持多种数据库\n- **Pydantic**: 数据验证和序列化，类型安全\n- **Uvicorn**: 高性能ASGI服务器\n\n### AI集成\n- **OpenAI**: GPT-4o、GPT-4o-mini 等最新模型\n- **OpenAI-Compatible**: DeepSeek \u002F Kimi \u002F MiniMax \u002F 302.AI（通过 OpenAI SDK 的 Base URL 接入）\n- **Anthropic**: Claude-4.5 系列模型\n- **Google AI**: Gemini-2.5 系列模型\n- **LangChain**: AI应用开发框架和工具链\n- **Ollama**: 本地模型部署和管理\n\n### 文件处理\n- **MinerU**: 高质量PDF智能解析和结构化提取\n- **MarkItDown**: 多格式文档转换（Word、Excel、PowerPoint等）\n- **BeautifulSoup4**: HTML\u002FXML解析和处理\n\n### 图像处理\n- **Pillow**: 图像处理和格式转换\n- **OpenAI DALL-E**: AI图像生成\n- **SiliconFlow**: 国产AI图像生成服务\n- **Pollinations**: gen.pollinations.ai 图片生成 API，支持多模型\n\n### 研究功能\n- **Tavily**: 专业搜索引擎API\n- **SearXNG**: 开源元搜索引擎\n- **Playwright**: 网页内容提取\n\n### 导出功能\n- **Playwright**: HTML转PDF高质量导出\n- **Apryse SDK**: 专业PPT生成和转换\n\n##  贡献指南\n\n欢迎所有形式的贡献！\n\n### 如何贡献\n1. Fork 本仓库\n2. 创建特性分支 (`git checkout -b feature\u002FAmazingFeature`)\n3. 提交更改 (`git commit -m 'Add some AmazingFeature'`)\n4. 推送到分支 (`git push origin feature\u002FAmazingFeature`)\n5. 开启 Pull Request\n\n详情请见 [贡献指南](CONTRIBUTING.md)。\n\n### 报告问题\n如果你发现了bug或有功能建议，请在 [Issues](https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues) 页面创建新的issue。\n\n##  常见问题\n\n### Q: 支持哪些AI模型？\nA: 支持 OpenAI、Anthropic Claude、Google Gemini、Ollama，以及 OpenAI 兼容提供商（DeepSeek \u002F Kimi \u002F MiniMax \u002F 302.AI）。可以在配置页面切换不同的AI提供商。其中 OpenAI 提供商支持 Responses API 请求模式和 reasoning effort 推理程度参数。\n\n### Q: 如何配置图像功能？\nA: 在 `.env` 文件中配置相应的API密钥：\n- Pixabay: `PIXABAY_API_KEY`\n- Unsplash: `UNSPLASH_ACCESS_KEY`\n- AI生成: `SILICONFLOW_API_KEY` 或 `POLLINATIONS_API_TOKEN`\n\n### Q:在使用反向代理（如Nginx、Apache等）时，如果没有正确配置`base_url`，会出现以下问题：\n- 图片链接仍然显示为`localhost:8000`\n- 前端无法正确加载图片\n- 图片预览、下载等功能异常\n\nA:  通过Web界面配置\n\n1. 访问系统配置页面：`https:\u002F\u002Fyour-domain.com\u002Fai-config`\n2. 切换到\"应用配置\"标签页\n3. 在\"基础URL (BASE_URL)\"字段中输入您的代理域名\n4. 例如：`https:\u002F\u002Fyour-domain.com` 或 `http:\u002F\u002Fyour-domain.com:8080`\n5. 点击\"保存应用配置\"\n\n### Q: 研究功能如何使用？\nA: 配置 `TAVILY_API_KEY` 或部署 SearXNG 实例，然后在创建PPT时启用研究功能即可自动获取相关信息。\n\n### Q: 支持本地部署吗？\nA: 完全支持本地部署，可以使用 Docker 或直接安装。支持 Ollama 本地模型，无需依赖外部API。\n\n### Q: 如何导出PPTX格式？\nA: 需要配置 `APRYSE_LICENSE_KEY`，然后在导出选项中选择PPTX格式。\n\n### Q: 并行生成会影响PPT质量吗？\nA: 不会。并行生成只是改变了生成顺序，每页的生成逻辑和质量保持不变。\n\n### Q: 所有AI提供商都支持批量生成吗？\nA: 大多数AI提供商支持并发请求，但可能有不同的限制。建议查看您使用的AI服务的API文档。\n\n##  许可证\n\n本项目采用 Apache License 2.0 许可证。详情请见 [LICENSE](LICENSE) 文件。\n\n## Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_readme_074d31938c45.png)](https:\u002F\u002Fwww.star-history.com\u002F#sligter\u002FLandPPT&Date)\n\n##  联系我们\n\n- **项目主页**: https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\n- **问题反馈**: https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\n- **讨论区**: https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fdiscussions\n\n---\n\n\u003Cdiv align=\"center\">\n\n**如果这个项目对你有帮助，请给我们一个  Star！**\n\nMade with  by the LandPPT Team\n\n\u003C\u002Fdiv>","# LandPPT 快速上手指南\n\nLandPPT 是一个基于大语言模型（LLM）的智能演示文稿生成平台，支持一键将文档或主题转换为专业的 PPT。\n\n## 环境准备\n\n### 系统要求\n- **操作系统**: Windows, macOS, 或 Linux\n- **Python**: 3.11 或更高版本\n- **数据库**: SQLite 3 (通常随 Python 自带)\n- **可选**: Docker (用于容器化部署)\n\n### 前置依赖\n确保已安装 `git`。若选择使用 `uv` 进行包管理（推荐，速度更快），需先安装 uv。\n\n## 安装步骤\n\n### 方法一：使用 uv 安装（推荐）\n\n```bash\n# 1. 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT.git\ncd LandPPT\n\n# 2. 安装 uv (如未安装)\n# Windows (PowerShell)\npowershell -ExecutionPolicy ByPass -c \"irm https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.ps1 | iex\"\n# macOS\u002FLinux\ncurl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh\n\n# 3. 同步依赖环境\nuv sync\n\n# 4. (可选) 安装标准 PPTX 导出依赖\nuv pip install apryse-sdk --extra-index-url=https:\u002F\u002Fpypi.apryse.com\n\n# 5. 配置环境变量\ncp .env.example .env\n# 请编辑 .env 文件，填入你的 AI API Key (如 OPENAI_API_KEY 等)\n\n# 6. 启动服务\nuv run python run.py\n```\n\n### 方法二：使用 Docker 部署\n\n```bash\n# 1. 准备配置文件\ncp .env.example .env\n# 编辑 .env 文件配置 API Key\n\n# 2. 拉取并运行镜像\ndocker run -d \\\n  --name landppt \\\n  -p 8000:8000 \\\n  -v $(pwd)\u002F.env:\u002Fapp\u002F.env \\\n  -v landppt_data:\u002Fapp\u002Fdata \\\n  -v landppt_reports:\u002Fapp\u002Fresearch_reports \\\n  -v landppt_cache:\u002Fapp\u002Ftemp \\\n  bradleylzh\u002Flandppt:latest\n\n# 3. 查看运行日志\ndocker logs -f landppt\n```\n\n## 基本使用\n\n### 1. 访问平台\n服务启动后，在浏览器打开：\n- **Web 界面**: http:\u002F\u002Flocalhost:8000\n- **默认账号**: `admin`\n- **默认密码**: `admin123`\n\n### 2. 配置 AI 模型\n首次使用前，需进入设置页面配置至少一个 AI 提供商：\n- 支持 OpenAI、DeepSeek、Kimi、MiniMax、Claude、Gemini 及本地 Ollama。\n- 填入对应的 `API Key` 和 `Base URL`（如需）。\n\n### 3. 生成 PPT\n1. **新建项目**：输入演示主题，选择受众群体和页数范围。\n2. **生成大纲**：点击生成，AI 将自动创建结构化大纲，支持手动编辑调整。\n3. **深度研究**（可选）：开启后可自动联网搜索最新资料补充内容。\n4. **开始生成**：确认大纲后，系统将并行生成幻灯片内容、智能配图及排版。\n5. **编辑与导出**：\n   - 在线预览并使用右侧 AI 助手微调内容或替换图片。\n   - 生成配套演讲稿。\n   - 点击导出，支持下载为 **PPTX**、**PDF**、**HTML** 或 **图片** 格式。","某科技公司产品经理需要在 2 小时内，将一份 50 页的杂乱市场调研 PDF 和最新竞品新闻，转化为一份用于向高管汇报的专业 PPT。\n\n### 没有 LandPPT 时\n- **内容提炼耗时**：需人工通读几十页文档手动摘录重点，再绞尽脑汁构思大纲逻辑，极易遗漏关键数据。\n- **素材搜集困难**：为了匹配每页主题，要在多个图库网站反复搜索高清配图，还要担心版权风险，耗时且效果参差不齐。\n- **排版美化繁琐**：花费大量时间调整字体、对齐文本框和统一配色，往往因为格式错乱导致演示文稿显得不够专业。\n- **讲稿准备脱节**：写完 PPT 后还需单独撰写演讲备注，内容与幻灯片经常对不上，增加排练时的认知负担。\n- **响应速度滞后**：从拿到资料到产出初稿通常需要半天甚至一天，无法应对突发的紧急汇报需求。\n\n### 使用 LandPPT 后\n- **智能大纲生成**：上传 PDF 后，LandPPT 利用深度研究功能自动提取核心观点并生成逻辑严密的大纲，瞬间完成内容结构化。\n- **自动配图优化**：系统根据每页语义自动从多源图库匹配或生成高质量图片，并智能调整尺寸，确保视觉风格统一且无版权顾虑。\n- **一键模板适配**：选择“商务汇报”场景，LandPPT 自动生成专属母版，所有页面布局、字体和配色即刻呈现专业级视觉效果。\n- **同步讲稿输出**：在生成幻灯片的同时，自动产出配套的详细演讲稿并填入备注栏，实现“页 - 稿”完美对应，随时可上台演示。\n- **极速交付成果**：从上传文件到导出完整 PPT 仅需几分钟，让产品经理能将宝贵时间集中在策略思考而非机械制作上。\n\nLandPPT 将原本需要数小时的文档转 PPT 流程压缩至分钟级，让创作者真正专注于内容价值而非形式堆砌。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsligter_LandPPT_d8c5f92e.png","sligter",null,"https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fsligter_5aa132a6.png","https:\u002F\u002Fgithub.com\u002Fsligter",[19,23,27,31,35],{"name":20,"color":21,"percentage":22},"JavaScript","#f1e05a",41.4,{"name":24,"color":25,"percentage":26},"Python","#3572A5",32.8,{"name":28,"color":29,"percentage":30},"HTML","#e34c26",25.6,{"name":32,"color":33,"percentage":34},"Shell","#89e051",0.1,{"name":36,"color":37,"percentage":34},"Dockerfile","#384d54",2793,388,"2026-04-08T10:38:43","NOASSERTION",2,"Linux, macOS, Windows","非必需。若使用本地 Ollama 部署开源模型，建议配备 NVIDIA GPU，具体显存需求取决于所选模型大小；若仅调用云端 API（如 OpenAI, Claude 等）则无 GPU 要求。","未说明（建议至少 4GB，若运行本地大模型需 16GB+）",{"notes":47,"python":48,"dependencies":49},"1. 支持 Docker 部署或直接通过 uv\u002Fpip 安装。2. 核心功能依赖外部 AI API（如 OpenAI, Anthropic, Google 等），需在 .env 文件中配置对应的 API Key。3. 若需导出 PPTX 格式，需额外安装 apryse-sdk 并配置许可证。4. 支持通过 Ollama 完全本地化部署，无需外部 API。5. 图像生成和研究功能需配置相应的第三方服务密钥（如 Tavily, Pixabay, SiliconFlow 等）。","3.11+",[50,51,52,53,54,55,56,57,58,59],"FastAPI>=0.104","uv","SQLAlchemy","Pydantic","Uvicorn","LangChain","MinerU","MarkItDown","Pillow","Playwright",[61,62,63,64],"开发框架","语言模型","图像","Agent",[66,67,68],"ai","llm","ppt","ready","2026-03-27T02:49:30.150509","2026-04-08T22:42:17.546830",[73,78,83,88,93,98,103],{"id":74,"question_zh":75,"answer_zh":76,"source_url":77},25217,"PPT 生成时日志报 401 Unauthorized 错误，但大纲生成正常，如何解决？","这通常是因为登录状态过期导致的。请尝试重新登录系统。如果问题依旧，请检查浏览器缓存或尝试强制刷新页面（Ctrl+F5）。","https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\u002F29",{"id":79,"question_zh":80,"answer_zh":81,"source_url":82},25218,"PPT 生成后，点击页面底部的导出按钮没有任何反应怎么办？","首先检查最开始的提示词内容中是否包含换行符，这可能导致解析失败。其次，尝试更换网络环境并强制刷新页面（Ctrl+F5）以清除可能的缓存问题。","https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\u002F18",{"id":84,"question_zh":85,"answer_zh":86,"source_url":87},25219,"下载 Word 文档失败或转换超时（Timeout 60000ms），且图片显示异常，如何处理？","1. 在应用配置中正确设置 BASE_URL 环境变量。\n2. 如果仍然超时，可以尝试修改代码中的超时时间设置。\n3. 图片显示异常通常是网络问题导致资源加载失败，建议更换网络环境重试。","https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\u002F17",{"id":89,"question_zh":90,"answer_zh":91,"source_url":92},25220,"进入编辑页面后，所有功能按钮（如编辑、导出 PDF、AI 编辑）均不可用或无反应，原因是什么？","这是由于前端 CDN 资源（如 bootstrap, chart.js, tailwindcss）加载失败造成的，常见于国内网络无法访问 jsdelivr 等国外源。\n解决方案：将源码中的 jsdelivr CDN 地址修改为国内可访问的镜像地址，修改后需要重新生成 PPT 才能生效。","https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\u002F11",{"id":94,"question_zh":95,"answer_zh":96,"source_url":97},25221,"PPT 生成成功后，在哪里可以找到导出按钮？导出的文件包含过渡动画吗？","导出按钮通常位于预览页面的底部或操作栏中（具体位置可参考项目截图）。\n注意：导出的 PPT 文件默认不包含预览时的过渡动画，这是正常现象。","https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\u002F51",{"id":99,"question_zh":100,"answer_zh":101,"source_url":102},25222,"为什么导出的文件是 HTML 压缩包而不是 PPT 文件，且布局错乱？","1. 导出正式 PPT 文件需要配置 Apryse Key（可申请免费 key）。\n2. 如果遇到布局错乱，可以尝试使用更强的 AI 模型，或开启多模态模型的自动修复排版功能。\n3. 也可以在生成后使用内置的快速编辑功能手动修正布局元素。","https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\u002F43",{"id":104,"question_zh":105,"answer_zh":106,"source_url":107},25223,"Docker 版本生成的 PPT 第一页重复，但本地源码运行正常，如何解决？","该问题特定于某些 Docker 镜像版本（如 0.1.4）。如果遇到此问题，建议暂时放弃使用 Docker 部署，改为在本地环境中通过 `uv run` 直接运行源码，通常可以解决该生成重复页的问题。","https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fissues\u002F24",[109,114,119,124],{"id":110,"version":111,"summary_zh":112,"released_at":113},154599,"v0.1.8","* 支持幻灯片批量重新生成；\n* 优化：快速编辑支持更多元素操作；\n* 新增对 mineru API 的支持，显著减小 Docker 镜像体积；\n* 修复 bug。\n\n## 变更内容\n* 更新：由 @sligter 在 https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fpull\u002F47 中完成；\n* 变量 `model_str` 未定义：由 @liunux4odoo 在 https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fpull\u002F55 中修复。\n\n## 新贡献者\n* @sligter 在 https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fpull\u002F47 中完成了首次贡献。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fcompare\u002Fv0.1.7...v0.1.8","2026-01-17T04:00:48",{"id":115,"version":116,"summary_zh":117,"released_at":118},154600,"v0.1.7","- 修复：修复了语言参数被错误禁用的问题。\n- 新增功能：图像服务现在支持自定义提供商和自定义尺寸参数。\n- 新增功能：支持直接根据需求和大纲生成模板。\n\n## 变更内容\n* 修复：由 @liunux4odoo 在 https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fpull\u002F40 中修复的 AI 图像生成错误。\n\n## 新贡献者\n* @liunux4odoo 在 https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fpull\u002F40 中完成了首次贡献。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fcompare\u002Fv0.1.6...v0.1.7","2025-12-21T07:10:22",{"id":120,"version":121,"summary_zh":122,"released_at":123},154601,"v0.1.6","- 优化了界面样式\n- 支持配置图片生成服务提供商\n- 优化了图片托管系统\n- 修复了若干 bug\n\n\n\n**完整更新日志**: https:\u002F\u002Fgithub.com\u002Fsligter\u002FLandPPT\u002Fcompare\u002Fv0.1.5...v0.1.6","2025-11-30T11:56:57",{"id":125,"version":126,"summary_zh":127,"released_at":128},154602,"v0.1.5","- 支持实时可视化修复\n- 支持AI辅助的轮廓编辑\n- 支持版面修复\n- 修复了若干Bug","2025-11-01T10:15:49",[130,140,148,156,164,173],{"id":131,"name":132,"github_repo":133,"description_zh":134,"stars":135,"difficulty_score":136,"last_commit_at":137,"category_tags":138,"status":69},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[64,61,63,139],"数据工具",{"id":141,"name":142,"github_repo":143,"description_zh":144,"stars":145,"difficulty_score":136,"last_commit_at":146,"category_tags":147,"status":69},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[61,63,64],{"id":149,"name":150,"github_repo":151,"description_zh":152,"stars":153,"difficulty_score":42,"last_commit_at":154,"category_tags":155,"status":69},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",145895,"2026-04-08T11:32:59",[61,64,62],{"id":157,"name":158,"github_repo":159,"description_zh":160,"stars":161,"difficulty_score":42,"last_commit_at":162,"category_tags":163,"status":69},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108111,"2026-04-08T11:23:26",[61,63,64],{"id":165,"name":166,"github_repo":167,"description_zh":168,"stars":169,"difficulty_score":42,"last_commit_at":170,"category_tags":171,"status":69},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[172,61],"插件",{"id":174,"name":175,"github_repo":176,"description_zh":177,"stars":178,"difficulty_score":136,"last_commit_at":179,"category_tags":180,"status":69},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[62,63,64,61]]