[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-SamurAIGPT--Text-To-Video-AI":3,"tool-SamurAIGPT--Text-To-Video-AI":62},[4,18,26,35,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,2,"2026-04-10T11:39:34",[14,15,13],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":32,"last_commit_at":41,"category_tags":42,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[43,13,15,14],"插件",{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":10,"last_commit_at":50,"category_tags":51,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[52,15,13,14],"语言模型",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4292,"Deep-Live-Cam","hacksider\u002FDeep-Live-Cam","Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。\n\n这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。\n\n其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。",88924,"2026-04-06T03:28:53",[14,15,13,61],"视频",{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":75,"owner_location":75,"owner_email":75,"owner_twitter":75,"owner_website":75,"owner_url":76,"languages":77,"stars":86,"forks":87,"last_commit_at":88,"license":89,"difficulty_score":32,"env_os":90,"env_gpu":91,"env_ram":92,"env_deps":93,"category_tags":107,"github_topics":108,"view_count":32,"oss_zip_url":75,"oss_zip_packed_at":75,"status":17,"created_at":122,"updated_at":123,"faqs":124,"releases":155},8028,"SamurAIGPT\u002FText-To-Video-AI","Text-To-Video-AI","Generate video from text using AI","Text-To-Video-AI 是一款强大的开源工具，旨在帮助用户仅通过输入文字提示即可自动生成完整的视频内容。它有效解决了传统视频制作中脚本撰写、素材搜集、配音录制及字幕合成等环节耗时费力、门槛较高的问题，让创作短视频变得高效便捷。\n\n这款工具特别适合内容创作者、社交媒体运营者以及希望自动化视频流程的开发者使用。无论是制作 YouTube Shorts、Instagram Reels 还是 TikTok 视频，用户都能轻松上手。其技术亮点在于高度模块化的设计：支持接入 OpenAI、Groq 或 Google Gemini 等多种大语言模型来智能生成脚本；提供 EdgeTTS（免费）和 ElevenLabs 等多种语音合成方案，确保配音自然流畅；还能自动从 Pexels 抓取契合主题的背景素材，并允许用户深度自定义字幕样式与视频画幅（横屏或竖屏）。此外，项目不仅提供了详细的本地部署指南，还准备了 Google Colab 笔记本和付费 API 选项，兼顾了技术爱好者的探索需求与普通用户的即时使用场景。","# Text To Video AI\n\nGenerate engaging videos from text prompts using AI. Perfect for creating YouTube Shorts, Instagram Reels, TikTok videos, and more.\n\n[![GitHub stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FSamurAIGPT\u002FText-To-Video-AI?style=social)](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fstargazers)\n\n> **Want to skip the setup?** Use our [Premium API](https:\u002F\u002Fdocs.vadoo.tv\u002Fdocs\u002Fguide\u002Fai-story\u002Fcreate-an-ai-video) to generate videos instantly - no installation required, production-ready, and scales with your needs.\n\n## Demo\n\nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F1e440ace-8560-4e12-850e-c532740711e7\n\n## Features\n\n- **AI-Powered Script Generation** - Automatically generates engaging scripts from any topic\n- **Multiple LLM Providers** - Choose from OpenAI, Groq, or Google Gemini\n- **Text-to-Speech** - Natural-sounding voiceovers with EdgeTTS (free) or ElevenLabs\n- **Automatic B-Roll** - Fetches relevant background videos from Pexels\n- **Customizable Captions** - Full control over font, color, position, and styling\n- **Multiple Orientations** - Portrait (9:16) for shorts or Landscape (16:9) for traditional video\n- **Speech-to-Text** - Accurate caption timing with Whisper or Deepgram\n\n## Quick Start\n\n**Option 1: Use the Premium API (Recommended)**\n\nSkip all setup and generate videos with a single API call:\n- [Premium API Documentation](https:\u002F\u002Fdocs.vadoo.tv\u002Fdocs\u002Fguide\u002Fai-story\u002Fcreate-an-ai-video)\n\n**Option 2: Google Colab**\n\nRun directly in your browser with our [Colab Notebook](Text_to_Video_example.ipynb)\n\n**Option 3: Local Installation**\n\nSee installation instructions below.\n\n## Installation\n\n### Prerequisites\n\n- Python 3.8+\n- FFmpeg\n- ImageMagick\n\n**Windows users:** See [INSTALL_WINDOWS.md](INSTALL_WINDOWS.md) for detailed setup instructions.\n\n### Setup\n\n```bash\n# Clone the repository\ngit clone https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI.git\ncd Text-To-Video-AI\n\n# Install dependencies\npip install -r requirements.txt\n\n# Create your configuration file\ncp .env.example .env\n```\n\nEdit `.env` with your API keys (see Configuration below).\n\n### Usage\n\n```bash\npython app.py \"Your topic here\"\n```\n\nOutput will be saved as `rendered_video.mp4`\n\n## Configuration\n\nAll settings are configured via the `.env` file. Copy `.env.example` to get started.\n\n### API Keys\n\n| Service | Required | Get API Key |\n|---------|----------|-------------|\n| Pexels | Always | [pexels.com\u002Fapi](https:\u002F\u002Fwww.pexels.com\u002Fapi\u002Fnew\u002F) |\n| OpenAI | If using OpenAI | [platform.openai.com](https:\u002F\u002Fplatform.openai.com\u002Fapi-keys) |\n| Groq | If using Groq | [console.groq.com](https:\u002F\u002Fconsole.groq.com\u002Fkeys) |\n| Google Gemini | If using Gemini | [makersuite.google.com](https:\u002F\u002Fmakersuite.google.com\u002Fapp\u002Fapikey) |\n| Deepgram | If using Deepgram STT | [console.deepgram.com](https:\u002F\u002Fconsole.deepgram.com\u002F) |\n| ElevenLabs | If using ElevenLabs TTS | [elevenlabs.io](https:\u002F\u002Felevenlabs.io\u002F) |\n\n### Provider Selection\n\n```env\n# LLM Provider: openai, groq, or gemini\nLLM_PROVIDER=openai\n\n# Text-to-Speech: edgetts (free) or elevenlabs\nTTS_PROVIDER=edgetts\n\n# Speech-to-Text: whisper (free) or deepgram\nSTT_PROVIDER=whisper\n```\n\n### Video Settings\n\n```env\n# Orientation: portrait (1080x1920) or landscape (1920x1080)\n# Portrait recommended for YouTube Shorts, Instagram Reels, TikTok\nVIDEO_ORIENTATION=portrait\n```\n\n### Caption Settings\n\n```env\n# Enable or disable captions\nCAPTIONS_ENABLED=true\n\n# Caption styling\nCAPTION_FONT_SIZE=100\nCAPTION_FONT_COLOR=white\nCAPTION_FONT_FACE=Arial-Bold\nCAPTION_STROKE_WIDTH=3\nCAPTION_STROKE_COLOR=black\nCAPTION_POSITION=bottom_center\n```\n\n**Caption Position Options:** `center`, `top`, `bottom`, `bottom_center`, `bottom_left`, `bottom_right`\n\n**Font Color Options:** `white`, `yellow`, `cyan`, `red`, `green`, `blue`, `magenta`\n\n### Voice Configuration\n\n**EdgeTTS (Free):**\n```env\nEDGETTS_VOICE=en-AU-WilliamNeural\n```\n\nPopular voices:\n- `en-US-ChristopherNeural` - American male\n- `en-US-JennyNeural` - American female\n- `en-GB-RyanNeural` - British male\n- `en-GB-SoniaNeural` - British female\n- `en-AU-WilliamNeural` - Australian male\n\n**ElevenLabs:**\n```env\nELEVENLABS_API_KEY=your_key\nELEVENLABS_VOICE_ID=your_voice_id\n```\n\n## Tutorials\n\n- [YouTube Tutorial](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=AXo6VfRUgic)\n- [Medium Guide](https:\u002F\u002Fmedium.com\u002F@anilmatcha\u002Ftext-to-video-ai-how-to-create-videos-for-free-a-complete-guide-a25c91de50b8)\n\n## Contributing\n\nWe welcome contributions! To get started:\n\n1. Fork the repository\n2. Create your feature branch (`git checkout -b feature\u002Famazing-feature`)\n3. Commit your changes (`git commit -m 'Add amazing feature'`)\n4. Push to the branch (`git push origin feature\u002Famazing-feature`)\n5. Open a Pull Request\n\n---\n\n## Premium API\n\nLooking for a production-ready solution? Our [Premium API](https:\u002F\u002Fdocs.vadoo.tv\u002Fdocs\u002Fguide\u002Fai-story\u002Fcreate-an-ai-video) offers:\n\n- No installation or setup required\n- Multiple video durations (30s to 10 minutes)\n- Advanced voice and language options\n- Custom styling and branding\n- Scalable infrastructure\n\n[Get Started with the API](https:\u002F\u002Fdocs.vadoo.tv\u002Fdocs\u002Fguide\u002Fai-story\u002Fcreate-an-ai-video)\n\n---\n\n## Related Projects\n\n| Project | Description |\n|---------|-------------|\n| [AI Influencer Generator](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FAI-Influencer-Generator) | Create AI-powered virtual influencers |\n| [AI YouTube Shorts Generator](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FAI-Youtube-Shorts-Generator\u002F) | Automated YouTube Shorts creation |\n| [Faceless Video Generator](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FFaceless-Video-Generator) | Create videos without showing your face |\n| [AI B-roll Generator](https:\u002F\u002Fgithub.com\u002FAnil-matcha\u002FAI-B-roll) | Generate B-roll footage with AI |\n\n### Vadoo AI Tools\n\n- [AI Video Generator](https:\u002F\u002Fwww.vadoo.tv\u002Fai-video-generator)\n- [Text to Video AI](https:\u002F\u002Fwww.vadoo.tv\u002Ftext-to-video-ai)\n- [Autoshorts AI](https:\u002F\u002Fwww.vadoo.tv\u002Fautoshorts-ai)\n- [Pixverse Alternative](https:\u002F\u002Fwww.vadoo.tv\u002Fpixverse-ai)\n- [Hailuo AI Alternative](https:\u002F\u002Fwww.vadoo.tv\u002Fhailuo-ai)\n- [Minimax AI Alternative](https:\u002F\u002Fwww.vadoo.tv\u002Fminimax-ai)\n\n---\n\n## Support\n\nIf you find this project useful, please consider giving it a star! Your support helps us continue improving the project.\n\n[![GitHub stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FSamurAIGPT\u002FText-To-Video-AI?style=social)](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fstargazers)\n","# 文本转视频 AI\n\n使用 AI 根据文本提示生成引人入胜的视频。非常适合制作 YouTube Shorts、Instagram Reels、TikTok 视频等。\n\n[![GitHub 星标](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FSamurAIGPT\u002FText-To-Video-AI?style=social)](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fstargazers)\n\n> **想跳过设置吗？** 使用我们的 [高级 API](https:\u002F\u002Fdocs.vadoo.tv\u002Fdocs\u002Fguide\u002Fai-story\u002Fcreate-an-ai-video) 即刻生成视频——无需安装，开箱即用，并可根据您的需求扩展。\n\n## 演示\n\nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F1e440ace-8560-4e12-850e-c532740711e7\n\n## 功能\n\n- **AI 驱动的脚本生成**：自动从任何主题生成吸引人的脚本\n- **多 LLM 提供商**：可选择 OpenAI、Groq 或 Google Gemini\n- **文本转语音**：使用 EdgeTTS（免费）或 ElevenLabs 提供自然流畅的配音\n- **自动 B-Roll**：从 Pexels 获取相关背景视频\n- **可定制字幕**：完全控制字体、颜色、位置和样式\n- **多种方向**：竖屏 (9:16) 适用于短视频，横屏 (16:9) 适用于传统视频\n- **语音转文字**：使用 Whisper 或 Deepgram 实现精准的字幕时间同步\n\n## 快速开始\n\n**选项 1：使用高级 API（推荐）**\n\n跳过所有设置，只需一次 API 调用即可生成视频：\n- [高级 API 文档](https:\u002F\u002Fdocs.vadoo.tv\u002Fdocs\u002Fguide\u002Fai-story\u002Fcreate-an-ai-video)\n\n**选项 2：Google Colab**\n\n通过我们的 [Colab 笔记本](Text_to_Video_example.ipynb) 直接在浏览器中运行\n\n**选项 3：本地安装**\n\n请参阅下方的安装说明。\n\n## 安装\n\n### 先决条件\n\n- Python 3.8+\n- FFmpeg\n- ImageMagick\n\n**Windows 用户：** 请参阅 [INSTALL_WINDOWS.md](INSTALL_WINDOWS.md) 获取详细的设置说明。\n\n### 设置\n\n```bash\n# 克隆仓库\ngit clone https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI.git\ncd Text-To-Video-AI\n\n# 安装依赖\npip install -r requirements.txt\n\n# 创建配置文件\ncp .env.example .env\n```\n\n编辑 `.env` 文件以填写您的 API 密钥（见下文配置部分）。\n\n### 使用\n\n```bash\npython app.py \"您的主题在这里\"\n```\n\n输出将保存为 `rendered_video.mp4`\n\n## 配置\n\n所有设置均通过 `.env` 文件进行配置。复制 `.env.example` 即可开始。\n\n### API 密钥\n\n| 服务 | 是否必需 | 获取 API 密钥 |\n|---------|----------|-------------|\n| Pexels | 始终需要 | [pexels.com\u002Fapi](https:\u002F\u002Fwww.pexels.com\u002Fapi\u002Fnew\u002F) |\n| OpenAI | 如果使用 OpenAI | [platform.openai.com](https:\u002F\u002Fplatform.openai.com\u002Fapi-keys) |\n| Groq | 如果使用 Groq | [console.groq.com](https:\u002F\u002Fconsole.groq.com\u002Fkeys) |\n| Google Gemini | 如果使用 Gemini | [makersuite.google.com](https:\u002F\u002Fmakersuite.google.com\u002Fapp\u002Fapikey) |\n| Deepgram | 如果使用 Deepgram STT | [console.deepgram.com](https:\u002F\u002Fconsole.deepgram.com\u002F) |\n| ElevenLabs | 如果使用 ElevenLabs TTS | [elevenlabs.io](https:\u002F\u002Felevenlabs.io\u002F) |\n\n### 提供商选择\n\n```env\n# LLM 提供商：openai、groq 或 gemini\nLLM_PROVIDER=openai\n\n# 文本转语音：edgetts（免费）或 elevenlabs\nTTS_PROVIDER=edgetts\n\n# 语音转文字：whisper（免费）或 deepgram\nSTT_PROVIDER=whisper\n```\n\n### 视频设置\n\n```env\n# 方向：竖屏（1080x1920）或横屏（1920x1080）\n# 竖屏推荐用于 YouTube Shorts、Instagram Reels、TikTok\nVIDEO_ORIENTATION=portrait\n```\n\n### 字幕设置\n\n```env\n# 启用或禁用字幕\nCAPTIONS_ENABLED=true\n\n# 字幕样式\nCAPTION_FONT_SIZE=100\nCAPTION_FONT_COLOR=white\nCAPTION_FONT_FACE=Arial-Bold\nCAPTION_STROKE_WIDTH=3\nCAPTION_STROKE_COLOR=black\nCAPTION_POSITION=bottom_center\n```\n\n**字幕位置选项：** `center`、`top`、`bottom`、`bottom_center`、`bottom_left`、`bottom_right`\n\n**字体颜色选项：** `white`、`yellow`、`cyan`、`red`、`green`、`blue`、`magenta`\n\n### 音色配置\n\n**EdgeTTS（免费）：**\n```env\nEDGETTS_VOICE=en-AU-WilliamNeural\n```\n\n热门音色：\n- `en-US-ChristopherNeural` - 美国男性\n- `en-US-JennyNeural` - 美国女性\n- `en-GB-RyanNeural` - 英国男性\n- `en-GB-SoniaNeural` - 英国女性\n- `en-AU-WilliamNeural` - 澳大利亚男性\n\n**ElevenLabs：**\n```env\nELEVENLABS_API_KEY=your_key\nELEVENLABS_VOICE_ID=your_voice_id\n```\n\n## 教程\n\n- [YouTube 教程](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=AXo6VfRUgic)\n- [Medium 指南](https:\u002F\u002Fmedium.com\u002F@anilmatcha\u002Ftext-to-video-ai-how-to-create-videos-for-free-a-complete-guide-a25c91de50b8)\n\n## 贡献\n\n我们欢迎贡献！开始方法如下：\n\n1. 分支仓库\n2. 创建功能分支 (`git checkout -b feature\u002Famazing-feature`)\n3. 提交更改 (`git commit -m '添加超赞功能'`)\n4. 推送到分支 (`git push origin feature\u002Famazing-feature`)\n5. 打开拉取请求\n\n---\n\n## 高级 API\n\n寻找生产就绪的解决方案吗？我们的 [高级 API](https:\u002F\u002Fdocs.vadoo.tv\u002Fdocs\u002Fguide\u002Fai-story\u002Fcreate-an-ai-video) 提供：\n\n- 无需安装或设置\n- 多种视频时长（30 秒至 10 分钟）\n- 高级音色和语言选项\n- 自定义样式和品牌化\n- 可扩展的基础架构\n\n[开始使用 API](https:\u002F\u002Fdocs.vadoo.tv\u002Fdocs\u002Fguide\u002Fai-story\u002Fcreate-an-ai-video)\n\n---\n\n## 相关项目\n\n| 项目 | 描述 |\n|---------|-------------|\n| [AI 影响力者生成器](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FAI-Influencer-Generator) | 创建 AI 驱动的虚拟影响力者 |\n| [AI YouTube Shorts 生成器](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FAI-Youtube-Shorts-Generator\u002F) | 自动化 YouTube Shorts 创作 |\n| [无脸视频生成器](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FFaceless-Video-Generator) | 创建不露脸的视频 |\n| [AI B-roll 生成器](https:\u002F\u002Fgithub.com\u002FAnil-matcha\u002FAI-B-roll) | 使用 AI 生成 B-roll 素材 |\n\n### Vadoo AI 工具\n\n- [AI 视频生成器](https:\u002F\u002Fwww.vadoo.tv\u002Fai-video-generator)\n- [文本转视频 AI](https:\u002F\u002Fwww.vadoo.tv\u002Ftext-to-video-ai)\n- [Autoshorts AI](https:\u002F\u002Fwww.vadoo.tv\u002Fautoshorts-ai)\n- [Pixverse 替代品](https:\u002F\u002Fwww.vadoo.tv\u002Fpixverse-ai)\n- [Hailuo AI 替代品](https:\u002F\u002Fwww.vadoo.tv\u002Fhailuo-ai)\n- [Minimax AI 替代品](https:\u002F\u002Fwww.vadoo.tv\u002Fminimax-ai)\n\n---\n\n## 支持\n\n如果您觉得这个项目有用，请考虑给它点个星！您的支持将帮助我们持续改进该项目。\n\n[![GitHub 星标](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FSamurAIGPT\u002FText-To-Video-AI?style=social)](https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fstargazers)","# Text-To-Video-AI 快速上手指南\n\n本工具可利用 AI 将文本提示词自动转化为引人入胜的视频，非常适合制作 YouTube Shorts、Instagram Reels、TikTok 及抖音短视频。\n\n## 环境准备\n\n在开始之前，请确保您的系统满足以下要求：\n\n*   **操作系统**：Windows, macOS 或 Linux\n    *   *Windows 用户注意*：详细的环境配置（特别是 ImageMagick 和 FFmpeg）请参考项目内的 `INSTALL_WINDOWS.md` 文件。\n*   **Python**：版本 3.8 或更高\n*   **前置依赖**：\n    *   `FFmpeg` (用于视频处理)\n    *   `ImageMagick` (用于字幕渲染)\n\n> **提示**：国内开发者在安装 Python 依赖时，建议使用清华源或阿里源以加速下载：\n> `pip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple`\n\n## 安装步骤\n\n### 1. 克隆项目\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI.git\ncd Text-To-Video-AI\n```\n\n### 2. 安装依赖\n```bash\npip install -r requirements.txt\n```\n\n### 3. 配置环境变量\n复制示例配置文件并编辑其中的 API 密钥：\n```bash\ncp .env.example .env\n```\n\n使用文本编辑器打开 `.env` 文件，填入必要的 API Key。至少需要配置 **Pexels** (用于素材) 和 **LLM 提供商** (如 OpenAI\u002FGroq\u002FGemini)。\n\n**必要配置示例 (.env)：**\n```env\n# Pexels API (必填，用于获取背景视频)\nPEXELS_API_KEY=your_pexels_api_key\n\n# 选择 LLM 提供商 (openai, groq, 或 gemini)\nLLM_PROVIDER=openai\nOPENAI_API_KEY=your_openai_api_key\n\n# 选择语音合成 (edgetts 免费，或 elevenlabs)\nTTS_PROVIDER=edgetts\n\n# 选择语音识别 (whisper 免费，或 deepgram)\nSTT_PROVIDER=whisper\n```\n\n*   **Pexels Key 获取**: [pexels.com\u002Fapi](https:\u002F\u002Fwww.pexels.com\u002Fapi\u002Fnew\u002F)\n*   **OpenAI Key 获取**: [platform.openai.com](https:\u002F\u002Fplatform.openai.com\u002Fapi-keys)\n*   其他提供商密钥请参考 README 中的链接。\n\n## 基本使用\n\n配置完成后，运行以下命令即可生成视频。将 `\"Your topic here\"` 替换为您想要的视频主题。\n\n```bash\npython app.py \"人工智能如何改变未来生活\"\n```\n\n*   **输出文件**：生成的视频将保存为当前目录下的 `rendered_video.mp4`。\n*   **默认设置**：默认生成竖屏视频 (9:16)，适合短视频平台。如需横屏，请在 `.env` 中设置 `VIDEO_ORIENTATION=landscape`。\n\n---\n*注：若不想本地部署，也可使用该项目提供的 Premium API 或直接运行官方 Google Colab Notebook (`Text_to_Video_example.ipynb`) 进行体验。*","某小型旅游博主团队希望每天快速产出多条高质量的短视频，以覆盖抖音、TikTok 和 YouTube Shorts 等平台的流量红利。\n\n### 没有 Text-To-Video-AI 时\n- **脚本创作耗时**：编剧需花费数小时查阅资料并撰写分镜脚本，难以维持日更频率。\n- **素材搜集繁琐**：剪辑师要在多个图库网站手动搜索匹配的风景视频，版权确认过程复杂且低效。\n- **配音与字幕割裂**：需分别使用不同工具录制旁白、生成字幕并调整时间轴，人工对齐口型极易出错。\n- **多平台适配困难**：为适应不同平台的竖屏或横屏要求，必须重复调整工程文件尺寸和构图，工作量翻倍。\n- **制作成本高昂**：若外包给专业团队，单条视频成本过高，严重压缩了初创团队的利润空间。\n\n### 使用 Text-To-Video-AI 后\n- **一键生成脚本**：输入“冰岛极光旅行攻略”，Text-To-Video-AI 利用 OpenAI 或 Gemini 瞬间产出结构完整、吸引人的视频脚本。\n- **自动匹配素材**：工具自动从 Pexels 抓取与脚本内容高度相关的无版权背景视频，无需人工逐帧筛选。\n- **音画字幕同步**：内置 EdgeTTS 或 ElevenLabs 生成自然旁白，并通过 Whisper 自动识别语音生成精准时间轴字幕，风格可自定义。\n- **灵活切换画幅**：只需在配置文件中将 `VIDEO_ORIENTATION` 设为 portrait 或 landscape，即可一键输出适配各平台的视频格式。\n- **零边际成本量产**：本地部署或调用 API 后，团队能以极低成本实现批量生产，将精力集中于内容策划而非机械制作。\n\nText-To-Video-AI 将原本需要数小时的视频制作流程压缩至几分钟，让个人创作者也能拥有专业级的内容生产力。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FSamurAIGPT_Text-To-Video-AI_17a498dd.png","SamurAIGPT","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FSamurAIGPT_e72b3e66.png",null,"https:\u002F\u002Fgithub.com\u002FSamurAIGPT",[78,82],{"name":79,"color":80,"percentage":81},"Jupyter Notebook","#DA5B0B",99.8,{"name":83,"color":84,"percentage":85},"Python","#3572A5",0.2,716,274,"2026-04-14T17:50:59","MIT","Windows, Linux, macOS","未说明 (主要依赖外部 API 和本地轻量工具，非本地大模型推理)","未说明",{"notes":94,"python":95,"dependencies":96},"该工具主要通过调用外部 API（如 OpenAI, Pexels, ElevenLabs 等）完成核心生成任务，本地仅需运行编排脚本。必须安装系统级依赖 FFmpeg 和 ImageMagick 用于视频渲染和字幕处理。Windows 用户需参考专门的安装文档。配置需通过 .env 文件设置各类服务的 API Key。","3.8+",[97,98,99,100,101,102,103,104,105,106],"FFmpeg","ImageMagick","EdgeTTS","Whisper","OpenAI API","Groq API","Google Gemini API","ElevenLabs API","Deepgram API","Pexels API",[15,61],[109,110,111,112,113,114,115,116,117,118,119,120,121],"ai-video-generator","artificial-intelligence","image-to-video","image-to-video-generation","sora-video-ai","stable-diffusion","text-to-image","text-to-video","text-to-video-generation","video-diffusion","video-diffusion-model","video-editing","video-generation","2026-03-27T02:49:30.150509","2026-04-16T15:50:28.475778",[125,130,135,140,145,150],{"id":126,"question_zh":127,"answer_zh":128,"source_url":129},35933,"如何修复 Pexels API 返回的 403 错误或 JSON 解析错误？","该问题通常是由于请求头中缺少 User-Agent 导致的。需要在发送请求的代码（如 background_video_generator.search_videos 或 download_file 函数）中添加 headers，设置 User-Agent 为浏览器标识。具体代码如下：\nheaders = {\n    \"User-Agent\": \"Mozilla\u002F5.0 (Windows NT 10.0; Win64; x64) AppleWebKit\u002F537.36 (KHTML, like Gecko) Chrome\u002F91.0.4472.124 Safari\u002F537.36\"\n}\nresponse = requests.get(url, headers=headers)","https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fissues\u002F5",{"id":131,"question_zh":132,"answer_zh":133,"source_url":134},35934,"遇到 'MoviePy error: failed to read the duration of file' 错误怎么办？","这通常是因为下载视频文件时缺少必要的请求头导致文件损坏或为空。解决方法是在 render_engine.py 文件的 download_file 函数中，为 requests.get 添加 User-Agent 请求头。修改后的代码示例：\ndef download_file(url, filename):\n    with open(filename, 'wb') as f:\n        headers = {\n            \"User-Agent\": \"Mozilla\u002F5.0 (Windows NT 10.0; Win64; x64) AppleWebKit\u002F537.36 (KHTML, like Gecko) Chrome\u002F91.0.4472.124 Safari\u002F537.36\"\n        }\n        response = requests.get(url, headers=headers)\n        f.write(response.content)","https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fissues\u002F14",{"id":136,"question_zh":137,"answer_zh":138,"source_url":139},35935,"收到 OpenAI 'Error code: 429' 或配额超出错误如何解决？","出现此错误意味着您的 OpenAI 账户当前配额已用尽或余额不足。您需要登录 OpenAI 账户检查账单详情，并充值（添加 credits\u002Fdeposit）才能继续使用该服务。","https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fissues\u002F13",{"id":141,"question_zh":142,"answer_zh":143,"source_url":144},35936,"是否支持使用本地部署的开源模型（如 LLAMA）代替付费的 OpenAI API？","是的，支持。您可以本地运行 Ollama，然后将代码中的 OpenAI API URL 替换为本地的 Ollama URL 即可使用自托管模型，无需支付 OpenAI 费用。","https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fissues\u002F9",{"id":146,"question_zh":147,"answer_zh":148,"source_url":149},35937,"目前的视频素材来源仅限于 Pexels 吗？能否使用 AI 生成的图像？","默认配置使用的是 Pexels 库存视频，目前不直接内置 AI 生成功能。但是，代码架构允许替换，您可以将 Pexels API 的连接部分替换为任何图像生成 API（如 Stable Diffusion API），程序将以相同的方式工作并生成 AI 图像视频。","https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fissues\u002F10",{"id":151,"question_zh":152,"answer_zh":153,"source_url":154},35938,"如何禁用字幕或调整视频方向等选项？","维护者已确认将添加禁用字幕的选项。如果您遇到字幕显示扭曲的问题，请确保使用的是最新版本的代码，因为相关显示问题已在最近的更新中修复。","https:\u002F\u002Fgithub.com\u002FSamurAIGPT\u002FText-To-Video-AI\u002Fissues\u002F1",[]]