autoclip

3.5k 733 较难 1 次阅读今天MITAgent图像语言模型开发框架视频

AI 解读由 AI 自动生成，仅供参考

AutoClip 是一款基于人工智能的视频高光自动提取与剪辑工具，旨在帮助创作者高效完成视频二创工作。它支持从 YouTube、B 站等平台一键下载视频，或利用本地文件，通过集成通义千问大语言模型深度理解视频内容，智能识别精彩片段并自动切割，最终生成逻辑连贯的视频合集。

这款工具主要解决了传统视频剪辑中人工观看耗时久、精彩点位难捕捉以及合集整理繁琐的痛点，将原本需要数小时的手工筛选与剪辑过程自动化，大幅提升了内容生产效率和一致性。

AutoClip 非常适合视频博主、自媒体运营者以及希望快速产出高质量切片内容的创作者使用。同时，由于其采用前后端分离的现代架构，也适合对视频处理流程感兴趣的开发者进行二次开发或部署研究。

在技术亮点方面，AutoClip 构建了强大的异步任务队列系统，利用 Celery 和 Redis 实现任务的实时调度与进度反馈，确保长视频处理稳定流畅。其前端基于 React 与 TypeScript 打造，提供直观易用的 Web 界面；后端则依托 FastAPI 与 FFmpeg，结合 AI 模型实现从字幕分析到内容理解的全链路智能化。此外，项目支持 Docker 一键部署，降低了使用门槛，让用户能轻松搭建属于自己的智能剪辑工作站。

使用场景

某游戏解说博主每周需从长达 3 小时的直播录像中提炼精彩操作，制作成短视频分发至 B 站和抖音以维持粉丝活跃度。

没有 autoclip 时

人工审片耗时极长：博主需全程观看数小时原始素材，凭肉眼标记高光时刻，单次剪辑准备时间超过 4 小时。
切片标准主观且不稳定：依赖人工判断容易遗漏隐蔽的精彩配合或反转瞬间，导致视频内容质量忽高忽低。
多平台适配繁琐：下载源视频、手动切割、重新封装字幕及调整格式需切换多个软件，操作流程割裂且易出错。
合集整理困难：面对海量碎片化片段，难以快速按主题（如“极限反杀”、“搞笑失误”）归类并生成系列合集。

使用 autoclip 后

AI 自动提取提效显著：只需输入直播链接，autoclip 利用通义千问模型自动分析内容，15 分钟内即可输出所有潜在高光片段。
智能识别覆盖全面：基于语义理解精准捕捉团战爆发、逆风翻盘等关键节点，确保精彩镜头零遗漏，内容质量标准化。
一站式自动化流程：autoclip 内置下载、切片、字幕同步功能，一键生成符合各平台规范的成品视频，无需人工干预格式转换。
动态合集智能生成：系统自动将切片按游戏角色或事件类型聚类，博主仅需在 Web 界面拖拽排序即可发布专题合集。

autoclip 将视频二创的生产模式从“劳动密集型”转变为"AI 驱动型”，让创作者将精力回归内容策划而非机械剪辑。

运行环境要求

操作系统

Linux
macOS
Windows (WSL)

GPU

未说明

内存

最低 4GB，推荐 8GB+

依赖

notes后端依赖 Redis 6.0+ 和 FFmpeg；AI 分析使用通义千问大模型（需配置 DashScope API Key）；支持 Docker 一键部署（需 Docker 20.10+ 和 Docker Compose 2.0+）；数据库默认为 SQLite，生产环境建议升级为 PostgreSQL。

python3.8+ (推荐 3.9+)

FastAPI

Celery

Redis

yt-dlp

React 18+

TypeScript 5.0+

FFmpeg

Node.js 16+

快速开始

AutoClip - 视频高光切片自动化工具

支持YouTube/B站视频下载、自动切片、智能合集生成

语言: English | 中文

🎯 项目简介

AutoClip是一个基于AI的智能视频切片处理系统，能够自动从YouTube、B站等平台下载视频，通过AI分析提取精彩片段，并智能生成合集。系统采用现代化的前后端分离架构，提供直观的Web界面和强大的后端处理能力。

✨ 核心特性

🎬 多平台支持: YouTube、B站视频一键下载，支持本地文件上传
🤖 AI智能分析: 基于通义千问大语言模型的视频内容理解
✂️ 自动切片: 智能识别精彩片段并自动切割，支持多种视频分类
📚 智能合集: AI推荐和手动创建视频合集，支持拖拽排序
🚀 实时处理: 异步任务队列，实时进度反馈，WebSocket通信
🎨 现代界面: React + TypeScript + Ant Design，响应式设计
📱 移动端支持【开发中】: 响应式设计，正在完善移动端体验
🔐 账号管理【开发中】: 支持B站多账号管理，自动健康检查
📊 数据统计: 完整的项目管理和数据统计功能
🛠️ 易于部署: 一键启动脚本，Docker支持，详细文档
📤 B站上传【开发中】: 自动上传切片视频到B站
✏️ 字幕编辑【开发中】: 可视化字幕编辑和同步功能

🏗️ 系统架构

graph TB
    A[用户界面] --> B[FastAPI后端]
    B --> C[Celery任务队列]
    B --> D[Redis缓存]
    B --> E[SQLite数据库]
    C --> F[AI处理引擎]
    F --> G[视频处理]
    F --> H[字幕分析]
    F --> I[内容理解]
    B --> J[文件存储]
    K[YouTube API] --> B
    L[B站API] --> B

技术栈

后端技术

FastAPI: 现代化Python Web框架，自动API文档生成
Celery: 分布式任务队列，支持异步处理
Redis: 消息代理和缓存，任务状态管理
SQLite: 轻量级数据库，支持升级到PostgreSQL
yt-dlp: YouTube视频下载，支持多种格式
通义千问: AI内容分析，支持多种模型
WebSocket: 实时通信，进度推送
Pydantic: 数据验证和序列化

前端技术

React 18: 用户界面框架，Hooks和函数组件
TypeScript: 类型安全，更好的开发体验
Ant Design: 企业级UI组件库
Vite: 快速构建工具，热重载
Zustand: 轻量级状态管理
React Router: 路由管理
Axios: HTTP客户端
React Player: 视频播放器

🚀 快速开始

环境要求

Docker部署（推荐）

Docker: 20.10+
Docker Compose: 2.0+
内存: 最少 4GB，推荐 8GB+
存储: 最少 10GB 可用空间

本地部署

操作系统: macOS / Linux / Windows (WSL)
Python: 3.8+ (推荐 3.9+)
Node.js: 16+ (推荐 18+)
Redis: 6.0+ (推荐 7.0+)
FFmpeg: 视频处理依赖
内存: 最少 4GB，推荐 8GB+
存储: 最少 10GB 可用空间

一键启动

方式一：Docker部署（推荐）

# 克隆项目
git clone https://github.com/zhouxiaoka/autoclip.git
cd autoclip

# Docker一键启动
./docker-start.sh

# 开发环境启动
./docker-start.sh dev

# 停止服务
./docker-stop.sh

# 检查服务状态
./docker-status.sh

方式二：本地部署

# 克隆项目
git clone https://github.com/zhouxiaoka/autoclip.git
cd autoclip

# 一键启动（推荐，包含完整检查和监控）
./start_autoclip.sh

# 快速启动（开发环境，跳过详细检查）
./quick_start.sh

# 检查系统状态
./status_autoclip.sh

# 停止系统
./stop_autoclip.sh

手动安装

# 1. 创建虚拟环境
python3 -m venv venv
source venv/bin/activate  # Linux/macOS
# 或 venv\Scripts\activate  # Windows

# 2. 安装Python依赖
pip install -r requirements.txt

# 3. 安装前端依赖
cd frontend && npm install && cd ..

# 4. 安装Redis
# macOS
brew install redis
brew services start redis

# Ubuntu/Debian
sudo apt update
sudo apt install redis-server
sudo systemctl start redis-server

# CentOS/RHEL
sudo yum install redis
sudo systemctl start redis

# 5. 安装FFmpeg
# macOS
brew install ffmpeg

# Ubuntu/Debian
sudo apt install ffmpeg

# CentOS/RHEL
sudo yum install ffmpeg

# 6. 配置环境变量
cp env.example .env
# 编辑 .env 文件，填入API密钥等配置

🎬 功能演示

主要功能展示

视频下载与处理
- 支持YouTube、B站视频链接解析
- 自动下载视频和字幕文件
- 支持本地文件上传
AI智能分析
- 自动提取视频大纲
- 智能识别话题时间点
- 对片段进行精彩度评分
视频切片与合集
- 自动生成精彩片段
- 智能推荐合集组合
- 支持手动编辑和排序
实时进度监控
- WebSocket实时进度推送
- 详细的任务状态显示
- 错误处理和重试机制
B站上传功能【开发中】
- 自动上传切片视频到B站
- 支持多账号管理
- 批量上传和队列管理
字幕编辑功能【开发中】
- 可视化字幕编辑器
- 字幕同步和调整
- 多语言字幕支持

📖 使用指南

1. 视频下载

YouTube视频

在首页点击"新建项目"
选择"YouTube链接"
粘贴视频URL
选择浏览器Cookie（可选）
点击"开始下载"

B站视频

在首页点击"新建项目"
选择"B站链接"
粘贴视频URL
选择登录账号
点击"开始下载"

本地文件

在首页点击"新建项目"
选择"文件上传"
拖拽或选择视频文件
上传字幕文件（可选）
点击"开始处理"

2. 智能处理

系统会自动执行以下步骤：

素材准备: 下载视频和字幕文件
内容分析: AI提取视频大纲和关键信息
时间线提取: 识别话题时间区间
精彩评分: 对每个片段进行AI评分
标题生成: 为精彩片段生成吸引人标题
合集推荐: AI推荐视频合集
视频生成: 生成切片视频和合集视频

3. 结果管理

查看切片: 在项目详情页查看所有生成的视频片段
编辑信息: 修改片段标题、描述等信息
创建合集: 手动创建或使用AI推荐的合集
下载导出: 下载单个片段或完整合集
B站上传【开发中】: 一键上传切片视频到B站
字幕编辑【开发中】: 可视化编辑和同步字幕文件

🔧 配置说明

环境变量配置

创建 .env 文件：

# 数据库配置
DATABASE_URL=sqlite:///./data/autoclip.db

# Redis配置
REDIS_URL=redis://localhost:6379/0

# AI API配置
API_DASHSCOPE_API_KEY=your_dashscope_api_key
API_MODEL_NAME=qwen-plus

# 日志配置
LOG_LEVEL=INFO
ENVIRONMENT=development
DEBUG=true

# 文件存储
UPLOAD_DIR=./data/uploads
PROJECT_DIR=./data/projects

B站账号配置【开发中】

在设置页面点击"B站账号管理"
选择登录方式：
- Cookie导入（推荐）：从浏览器导出Cookie
- 账号密码：直接输入账号密码
- 二维码登录：扫描二维码登录
添加成功后系统会自动管理账号健康状态

📁 项目结构

autoclip/
├── backend/                 # 后端代码
│   ├── api/                # API路由
│   │   ├── v1/            # API v1版本
│   │   │   ├── youtube.py # YouTube下载API
│   │   │   ├── bilibili.py # B站下载API
│   │   │   ├── projects.py # 项目管理API
│   │   │   ├── clips.py   # 视频片段API
│   │   │   ├── collections.py # 合集管理API
│   │   │   └── settings.py # 系统设置API
│   │   └── upload_queue.py # 上传队列管理
│   ├── core/              # 核心配置
│   │   ├── database.py    # 数据库配置
│   │   ├── celery_app.py  # Celery配置
│   │   ├── config.py      # 系统配置
│   │   └── llm_manager.py # AI模型管理
│   ├── models/            # 数据模型
│   │   ├── project.py     # 项目模型
│   │   ├── clip.py        # 片段模型
│   │   ├── collection.py  # 合集模型
│   │   └── bilibili.py    # B站账号模型
│   ├── services/          # 业务逻辑
│   │   ├── video_service.py # 视频处理服务
│   │   ├── ai_service.py  # AI分析服务
│   │   └── upload_service.py # 上传服务
│   ├── tasks/             # Celery任务
│   │   ├── processing.py  # 处理任务
│   │   ├── upload.py      # 上传任务
│   │   └── maintenance.py # 维护任务
│   ├── pipeline/          # 处理流水线
│   │   ├── step1_outline.py # 大纲提取
│   │   ├── step2_timeline.py # 时间线分析
│   │   ├── step3_scoring.py # 精彩度评分
│   │   └── step6_video.py # 视频生成
│   └── utils/             # 工具函数
├── frontend/              # 前端代码
│   ├── src/
│   │   ├── components/    # React组件
│   │   │   ├── UploadModal.tsx # 上传模态框
│   │   │   ├── ClipCard.tsx # 片段卡片
│   │   │   ├── CollectionCard.tsx # 合集卡片
│   │   │   └── BilibiliManager.tsx # B站管理
│   │   ├── pages/         # 页面组件
│   │   │   ├── HomePage.tsx # 首页
│   │   │   ├── ProjectDetailPage.tsx # 项目详情
│   │   │   └── SettingsPage.tsx # 设置页面
│   │   ├── services/      # API服务
│   │   │   └── api.ts     # API客户端
│   │   └── stores/        # 状态管理
│   └── package.json
├── data/                  # 数据存储
│   ├── projects/          # 项目数据
│   ├── uploads/           # 上传文件
│   ├── temp/              # 临时文件
│   ├── output/            # 输出文件
│   └── autoclip.db        # 数据库文件
├── scripts/               # 工具脚本
│   ├── start_autoclip.sh  # 启动脚本
│   ├── stop_autoclip.sh   # 停止脚本
│   └── status_autoclip.sh # 状态检查
├── docs/                  # 文档
│   ├── README.md          # 文档中心
│   ├── i18n.md           # 国际化配置
│   └── *.md              # 其他文档
├── logs/                  # 日志文件
├── Dockerfile             # Docker镜像构建文件
├── Dockerfile.dev         # 开发环境Docker文件
├── docker-compose.yml     # 生产环境Docker编排
├── docker-compose.dev.yml # 开发环境Docker编排
├── docker-start.sh        # Docker启动脚本
├── docker-stop.sh         # Docker停止脚本
├── docker-status.sh       # Docker状态检查脚本
├── .dockerignore          # Docker忽略文件
├── DOCKER.md              # Docker部署文档
└── *.sh                   # 启动脚本

🌐 API文档

启动系统后访问以下地址查看API文档：

Swagger UI: http://localhost:8000/docs (本地开发环境)
ReDoc: http://localhost:8000/redoc (本地开发环境)

主要API端点

端点	方法	描述
`/api/v1/projects`	GET	获取项目列表
`/api/v1/projects`	POST	创建新项目
`/api/v1/projects/{id}`	GET	获取项目详情
`/api/v1/youtube/parse`	POST	解析YouTube视频信息
`/api/v1/youtube/download`	POST	下载YouTube视频
`/api/v1/bilibili/download`	POST	下载B站视频
`/api/v1/projects/{id}/process`	POST	开始处理项目
`/api/v1/projects/{id}/status`	GET	获取处理状态

🔍 故障排除

常见问题

1. 端口被占用

# 检查端口占用
lsof -i :8000  # 后端端口
lsof -i :3000  # 前端端口

# 停止占用进程
kill -9 <PID>

2. Redis连接失败

# 检查Redis状态
redis-cli ping

# 启动Redis服务
brew services start redis  # macOS
systemctl start redis      # Linux

3. YouTube下载失败

检查网络连接
更新yt-dlp版本：pip install --upgrade yt-dlp
尝试使用浏览器Cookie
检查视频是否可用

4. B站下载失败

检查账号登录状态
更新账号Cookie
检查视频权限设置

日志查看

# 查看所有日志
tail -f logs/*.log

# 查看特定服务日志
tail -f logs/backend.log    # 后端日志
tail -f logs/frontend.log   # 前端日志
tail -f logs/celery.log     # 任务队列日志

系统状态检查

# 详细状态检查
./status_autoclip.sh

# 手动检查服务
curl http://localhost:8000/api/v1/health/  # 后端健康检查
curl http://localhost:3000/                # 前端访问测试
redis-cli ping                             # Redis连接测试

🛠️ 开发指南

后端开发

# 激活虚拟环境
source venv/bin/activate

# 设置Python路径
export PYTHONPATH="${PWD}:${PYTHONPATH}"

# 启动后端开发服务器
python -m uvicorn backend.main:app --reload --port 8000

前端开发

# 进入前端目录
cd frontend

# 启动开发服务器
npm run dev

Celery Worker

# 启动Worker
celery -A backend.core.celery_app worker --loglevel=info

# 启动Beat调度器
celery -A backend.core.celery_app beat --loglevel=info

# 启动Flower监控
celery -A backend.core.celery_app flower --port=5555

📊 性能优化

生产环境配置

数据库优化
- 使用PostgreSQL替代SQLite
- 配置连接池
- 启用查询缓存
Redis优化
- 配置内存限制
- 启用持久化
- 设置过期策略
Celery优化
- 调整并发数
- 配置任务路由
- 启用结果后端

🔒 安全配置

生产环境安全

环境变量
- 使用强密码
- 定期轮换密钥
- 限制API访问
网络安全
- 配置防火墙
- 使用HTTPS
- 限制CORS
数据安全
- 定期备份
- 加密敏感数据
- 访问控制

🚀 部署指南

Docker部署

快速启动

# 克隆项目
git clone https://github.com/zhouxiaoka/autoclip.git
cd autoclip

# 配置环境变量
cp env.example .env
# 编辑 .env 文件，填入必要的配置

# 启动所有服务
docker-compose up -d

# 查看服务状态
docker-compose ps

访问服务

前端界面: http://localhost:3000 (本地开发环境)
后端API: http://localhost:8000 (本地开发环境)
API文档: http://localhost:8000/docs (本地开发环境)
Flower监控: http://localhost:5555 (本地开发环境)

开发环境

# 使用开发环境配置
docker-compose -f docker-compose.dev.yml up -d

# 实时查看日志
docker-compose -f docker-compose.dev.yml logs -f

详细说明

完整的Docker部署指南请参考 DOCKER.md 文档。

系统服务

# 创建systemd服务文件
sudo nano /etc/systemd/system/autoclip.service

[Unit]
Description=AutoClip Video Processing System
After=network.target redis.service

[Service]
Type=forking
User=autoclip
WorkingDirectory=/opt/autoclip
ExecStart=/opt/autoclip/start_autoclip.sh
ExecStop=/opt/autoclip/stop_autoclip.sh
Restart=always

[Install]
WantedBy=multi-user.target

📈 路线图

即将推出

B站上传功能: 自动上传切片视频到B站，支持多账号管理
字幕编辑功能: 可视化字幕编辑器和同步功能
多语言支持: 支持更多语言的视频处理
云端存储: 集成云存储服务
批量处理: 支持批量视频处理
API开放: 提供公开API接口
移动应用: 开发移动端应用

长期规划

AI模型优化: 集成更多AI模型
实时协作: 支持多用户协作
插件系统: 支持第三方插件
企业版: 企业级功能和服务

🤝 贡献指南

我们欢迎所有形式的贡献！无论是代码贡献、文档改进、问题报告还是功能建议。

如何贡献

Fork 项目到您的GitHub账户

克隆您的Fork到本地：

git clone https://github.com/zhouxiaoka/autoclip.git
cd autoclip

创建功能分支：

git checkout -b feature/amazing-feature

进行开发和测试

提交更改：

git add .
git commit -m 'feat: add amazing feature'

推送分支：

git push origin feature/amazing-feature

在GitHub上创建 Pull Request

开发规范

代码规范

后端：遵循PEP 8 Python代码规范
前端：使用TypeScript，遵循ESLint规则
提交信息：使用约定式提交格式（feat, fix, docs, style, refactor, test, chore）

开发流程

确保所有测试通过
添加必要的测试用例
更新相关文档
确保代码质量检查通过

提交信息格式

<type>(<scope>): <description>

[optional body]

[optional footer(s)]

示例：

feat(api): add video download endpoint
fix(ui): resolve upload modal display issue
docs(readme): update installation instructions

📄 许可证

本项目采用 MIT License 许可证。

❓ 常见问题

安装和启动问题

Q: 启动时提示端口被占用怎么办？ A: 使用以下命令检查并停止占用端口的进程：

# 检查端口占用
lsof -i :8000  # 后端端口
lsof -i :3000  # 前端端口

# 停止进程
kill -9 <PID>

Q: Redis连接失败怎么办？ A: 确保Redis服务正在运行：

# 检查Redis状态
redis-cli ping

# 启动Redis服务
brew services start redis  # macOS
sudo systemctl start redis-server  # Linux

Q: 前端依赖安装失败怎么办？ A: 尝试清理缓存后重新安装：

cd frontend
rm -rf node_modules package-lock.json
npm cache clean --force
npm install

功能使用问题

Q: YouTube视频下载失败怎么办？ A:

检查网络连接
更新yt-dlp：pip install --upgrade yt-dlp
尝试使用浏览器Cookie
检查视频是否可用或需要登录

Q: B站视频下载失败怎么办？ A:

检查账号登录状态
更新账号Cookie
检查视频权限设置
尝试使用其他账号

Q: AI处理速度慢怎么办？ A:

检查API密钥配置
调整处理参数（减少chunk_size）
检查网络连接
考虑使用更快的AI模型

Q: B站上传功能什么时候可以使用？ A: B站上传功能正在开发中，预计在下一个版本中发布。该功能将支持：

自动上传切片视频到B站
多账号管理和切换
批量上传和队列管理
上传进度监控

Q: 字幕编辑功能什么时候可以使用？ A: 字幕编辑功能正在开发中，预计在下一个版本中发布。该功能将支持：

可视化字幕编辑器
字幕时间轴同步
多语言字幕支持
字幕格式转换

性能优化

Q: 如何提高处理速度？ A:

增加Celery Worker并发数
使用SSD存储
增加系统内存
优化视频质量设置

Q: 如何减少存储空间占用？ A:

定期清理临时文件
压缩输出视频
删除不需要的项目
使用外部存储

📞 支持与反馈

获取帮助

问题反馈: GitHub Issues
功能建议: GitHub Discussions (仓库创建后可用)
Bug报告: 请使用GitHub Issues模板
文档: 项目文档

联系方式

如有问题或建议，请通过以下方式联系：

💬 QQ

📱 飞书

📧 其他联系方式

提交 GitHub Issue
发送邮件至：christine_zhouye@163.com
添加上述QQ或飞书联系

🙏 致谢

感谢以下开源项目和服务的支持：

核心技术栈

FastAPI - 现代化Python Web框架
React - 用户界面库
Ant Design - 企业级UI设计语言
TypeScript - JavaScript的超集
Celery - 分布式任务队列
Redis - 内存数据结构存储

视频处理

yt-dlp - YouTube视频下载工具
FFmpeg - 音视频处理框架

AI服务

通义千问 - 阿里云大语言模型服务
DashScope - 阿里云AI服务平台

开发工具

Vite - 前端构建工具
Zustand - 状态管理库
Pydantic - 数据验证库

特别感谢

所有为开源社区贡献的开发者
提供反馈和建议的用户
参与测试和贡献代码的社区成员

如果这个项目对你有帮助，请给我们一个 ⭐ Star

Made with ❤️ by AutoClip Team

⭐ 如果觉得有用，请给个Star支持一下！

AutoClip 快速上手指南

AutoClip 是一个基于 AI 的智能视频切片处理系统，支持从 YouTube、B 站下载视频，自动分析内容并生成精彩片段合集。

环境准备

在开始之前，请确保您的系统满足以下要求：

系统要求

操作系统: macOS / Linux / Windows (推荐 WSL)
内存: 最少 4GB，推荐 8GB+
存储: 最少 10GB 可用空间

前置依赖

方案一：Docker 部署（推荐）

Docker 20.10+
Docker Compose 2.0+

方案二：本地部署

Python: 3.8+ (推荐 3.9+)
Node.js: 16+ (推荐 18+)
Redis: 6.0+ (推荐 7.0+)
FFmpeg: 视频处理核心依赖
Git: 代码克隆

国内加速提示：

Python 包安装建议使用清华源：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

Node.js 包安装建议配置淘宝镜像：npm config set registry https://registry.npmmirror.com

安装步骤

方式一：Docker 一键启动（推荐）

# 1. 克隆项目
git clone https://github.com/zhouxiaoka/autoclip.git
cd autoclip

# 2. 一键启动服务
./docker-start.sh

# 3. 查看服务状态
./docker-status.sh

方式二：本地手动安装

# 1. 克隆项目
git clone https://github.com/zhouxiaoka/autoclip.git
cd autoclip

# 2. 使用脚本一键安装和启动（包含环境检查）
./start_autoclip.sh

若需手动分步安装：

# 1. 创建并激活 Python 虚拟环境
python3 -m venv venv
source venv/bin/activate  # Windows 使用: venv\Scripts\activate

# 2. 安装后端依赖 (推荐使用国内镜像)
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

# 3. 安装前端依赖 (推荐使用国内镜像)
cd frontend
npm config set registry https://registry.npmmirror.com
npm install
cd ..

# 4. 安装系统组件 (以 Ubuntu 为例)
sudo apt update
sudo apt install redis-server ffmpeg -y
sudo systemctl start redis-server

# 5. 配置环境变量
cp env.example .env
# 编辑 .env 文件，填入通义千问 API Key 等必要配置

基本使用

启动成功后，默认访问地址如下：

前端界面: http://localhost:3000
API 文档: http://localhost:8000/docs

第一步：新建项目

打开浏览器访问 http://localhost:3000。
点击首页的 "新建项目" 按钮。

第二步：导入视频

根据来源选择对应方式：

YouTube/B 站链接：粘贴视频 URL，B 站视频可选择已登录的账号。
本地文件：直接拖拽视频文件上传（支持可选的字幕文件）。
点击 "开始下载" 或 "开始处理"。

第三步：AI 智能处理

系统将自动执行以下流程（可在详情页实时查看进度）：

素材准备：下载视频与字幕。
内容分析：AI 提取大纲、识别话题时间点。
精彩评分：对片段进行打分并生成标题。
视频生成：自动切割视频并推荐合集。

第四步：管理与导出

查看结果：在项目详情页预览生成的切片。
编辑调整：修改片段标题、描述或手动调整合集顺序。
导出视频：下载单个精彩片段或完整合集到本地。

注意：首次使用前，请务必在 .env 文件中配置有效的 API_DASHSCOPE_API_KEY（通义千问），否则 AI 分析功能无法运行。

版本历史

v1.0.02025/09/15

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 153.6k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|3天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|3天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架