QualityScaler

3k 241 较难 1 次阅读昨天MIT开发框架图像视频

AI 解读由 AI 自动生成，仅供参考

QualityScaler 是一款专为 Windows 系统打造的 AI 图像与视频超分辨率工具，旨在通过人工智能技术将低清晰度的照片和视频提升至更高分辨率，同时有效去除噪点并增强细节。它解决了用户在处理老旧素材、低清截图或压缩视频时面临的画质模糊问题，让画面重现清晰锐利。

这款软件非常适合设计师、视频创作者以及希望提升本地媒体质量的普通用户使用。无需具备深厚的编程背景，用户即可通过其优雅直观的图形界面轻松操作。QualityScaler 的独特亮点在于其出色的隐私保护机制，所有处理过程均在本地完成，无需联网上传数据；同时，它支持多显卡协同工作，并能自动分割大尺寸图像以突破显存限制，确保在配置有限的设备上也能流畅运行。此外，它还支持断点续传功能，避免长视频处理过程中因意外中断而前功尽弃。基于 PyTorch 和 ONNX 等技术构建，QualityScaler 兼容多种主流图片与视频格式，是本地化高清修复的理想选择。

使用场景

一位独立纪录片导演需要修复一批拍摄于十年前的低分辨率采访素材，以便在 4K 流媒体平台上重新发布。

没有 QualityScaler 时

画质模糊无法达标：原始视频仅为 480p，直接拉伸至 4K 后画面充满马赛克和锯齿，完全无法满足高清播放标准。
硬件门槛过高：传统专业超分软件往往强制要求高端 NVIDIA 显卡，导致导演使用的 AMD 或 Intel 集成显卡电脑无法运行。
处理流程脆弱：长视频渲染过程中一旦断电或软件崩溃，进度全部丢失，必须从头开始，极大浪费时间和算力。
隐私与网络顾虑：在线修复服务需上传敏感采访原片，存在数据泄露风险，且受限于网速，大文件传输极其缓慢。

使用 QualityScaler 后

AI 智能重塑细节：利用内置的 BSRGAN 等模型，将低清画面智能放大并去噪，在 4K 分辨率下依然保持人物皮肤纹理清晰自然。
广泛兼容本地显卡：基于 DirectML 技术，直接调用导演现有电脑上的任意 DirectX 12 显卡（包括 AMD/Intel），无需额外购置硬件。
断点续传保进度：支持视频处理的“停止与恢复”功能，即使意外中断也能从断点处继续，确保数小时的渲染工作不白费。
纯离线保护隐私：所有计算均在本地完成，无需联网即可运行，彻底杜绝了珍贵素材外泄的风险，同时避免了上传等待时间。

QualityScaler 让普通创作者能在本地安全、高效地将老旧影像资产焕发新生，大幅降低了高清修复的技术与资金门槛。

运行环境要求

操作系统

Windows

GPU

必需，任何兼容 DirectX 12 的 GPU (支持 AMD, Intel, Nvidia)，显存 >= 4GB

内存

>= 8GB

依赖

notes该工具专为 Windows 设计，使用 DirectML 后端以支持各类 DirectX 12 显卡。自行编译运行需手动下载 AI 模型文件并放入指定文件夹，同时需要下载 ffmpeg.exe 放置在 Assets 目录中。支持多 GPU 协同工作（如集成显卡 + 独立显卡）。

python3.10 - 3.12

pytorch

onnx

onnxconverter-common

onnxruntime-directml

customtkinter

openCV

pyInstaller

快速开始

QualityScaler - 图像/视频AI超分辨率应用

什么是QualityScaler？

QualityScaler是一款基于AI的Windows应用程序，用于增强、提升分辨率和降噪照片与视频。

如何使用QualityScaler？

movie_max_vp9.webm

其他AI项目。🤓

https://github.com/Djdefrag/RealScaler / RealScaler - 图像/视频AI超分辨率（Real-ESRGAN）
https://github.com/Djdefrag/FluidFrames.RIFE / FluidFrames.RIFE - 视频AI帧生成

致谢。

BSRGAN - https://github.com/cszn/BSRGAN
Real-ESRGAN - https://github.com/xinntao/Real-ESRGAN
IRCNN - https://github.com/lipengFu/IRCNN

引用文献。❤

技术实现。🛠

QualityScaler完全由Python编写，从前端到后端。

pytorch (https://github.com/pytorch/pytorch)
onnx (https://github.com/onnx/onnx)
onnxconverter-common (https://github.com/microsoft/onnxconverter-common)
onnxruntime-directml (https://github.com/microsoft/onnxruntime)
customtkinter (https://github.com/TomSchimansky/CustomTkinter)
openCV (https://github.com/opencv/opencv)
pyInstaller (https://github.com/pyinstaller/pyinstaller)

自己动手运行。 👨‍💻

先决条件。

您的电脑上已安装Python (https://www.python.org/downloads/)
您的电脑上已安装VSCode (https://code.visualstudio.com/)
已下载AI模型 (https://gofile.io/d/b4Ds9u)
已下载ffmpeg.exe文件 (https://www.gyan.dev/ffmpeg/builds/) RELEASE BUILD > ffmpeg-release-essentials.7z

开始使用。

将项目下载到您的电脑上（绿色按钮“代码”>“下载ZIP”）
解压.zip文件
将AI模型文件解压到/AI-onnx文件夹中
将FFMPEG.exe解压到/Assets文件夹中
使用VSCode打开项目（将项目目录拖放到VSCode中）
在左侧栏中点击QualityScaler.py（VSCode会提示您安装Python插件）
安装依赖项。在VSCode中有一个“终端”面板，点击该面板并执行命令“pip install -r requirements.txt”
关闭VSCode并重新打开（这将刷新所有已安装的依赖项）
点击VSCode右上角的“播放按钮”

系统要求。 🤓

Windows 11 / Windows 10
内存 >= 8Gb
任何兼容Directx12且显存 >= 4GB的GPU

功能。

优雅且易于使用的图形界面
图像和视频超分辨率
多GPU支持
兼容图像格式 - jpg, png, tif, bmp, webp, heic
兼容视频格式 - mp4, wemb, mkv, flv, gif, avi, mov, mpg, qt, 3gp
自动图像分块以避免GPU显存限制
超分辨率前可调整图像/视频尺寸
原始文件与超分辨率文件之间的插值
视频超分辨率暂停与继续
注重隐私 - 无需互联网连接，所有操作均在您的电脑上完成

下一步计划。 🤫

1.X版本
- 切换到Pytorch-directml以支持所有兼容Directx12的GPU（AMD、Intel、Nvidia）
- 采用Windows 11风格的新GUI
- 为超分辨率视频添加音频
- 优化视频帧的缩放和提取速度
- 支持多GPU（适用于配备集成显卡和独立显卡的电脑）
- 使用Python 3.10（预计性能提升约10%）
2.X版本
- 基于@customtkinter全新设计的图形界面
- 同时对图像和视频进行超分辨率处理（目前只能单独处理图像或视频）
- 同时对多个视频进行超分辨率处理
- 可选择超分辨率后的视频格式
- 原始文件与超分辨率文件之间的插值
- 更多插值级别（低、中、高）
- 显示视频超分辨率完成所需的剩余时间
- 支持SRVGGNetCompact AI架构
- 从原始文件向超分辨率文件提取并应用元数据（通过exiftool）
3.X版本
- 由onnxruntime-directml驱动的新AI引擎（https://github.com/microsoft/onnxruntime）
- 使用Python 3.11（性能进一步提升）
- 使用Python 3.12（性能进一步提升）
- 在GUI中显示超分辨率后的图像/视频分辨率
- 更新FFMPEG至7.x版本（最新发布）
- 保存用户设置（AI模型、GPU、CPU等）
- 视频AI多线程超分辨率
- 视频超分辨率暂停与继续
4.X版本
- 硬件加速视频编码（nvenc / amf / qsv）
- 支持更多视频格式（.mp4 / .mkv / .avi / .mov）
- 可选择输出分辨率缩放比例
- 视频AI多线程技术进一步改进
- 更新AI引擎（onnxruntime-directml）
- 通过FFMPEG提取视频帧（速度提升10倍）
2026.X版本
- 引入新的AI模型
- 应用界面按百分比缩放
- TTA超分辨率模式

示例。

视频

https://user-images.githubusercontent.com/32263112/209139639-2b123b83-ac6e-4681-b94a-954ed0aea78c.mp4

图片

测试图

Bsrgan x4

Bsrgan x4 (2)

Bsrgan x4 (3)

Bsrgan x4

QualityScaler 快速上手指南

QualityScaler 是一款基于 AI 的 Windows 应用程序，专为照片和视频的增强、超分辨率（放大）及去噪而设计。它完全在本地运行，无需联网，注重隐私。

环境准备

系统要求

操作系统: Windows 10 或 Windows 11
内存 (RAM): ≥ 8GB
显卡 (GPU): 任意支持 DirectX 12 的显卡（AMD / Intel / Nvidia），显存 (VRAM) ≥ 4GB
软件依赖:
- Python (建议版本 3.10+)
- Visual Studio Code (VSCode)

前置文件下载

在开始之前，请手动下载以下必要文件：

AI 模型文件: 点击下载
FFmpeg: 下载 ffmpeg-release-essentials.7z (来自 gyan.dev)

安装步骤

获取项目代码 在 GitHub 页面点击绿色按钮 Code > Download ZIP，下载后将压缩包解压到本地目录。
部署资源文件
- 将下载的 AI 模型文件 解压并放入项目目录下的 /AI-onnx 文件夹中。
- 将下载的 FFmpeg 压缩包解压，把其中的 ffmpeg.exe 文件放入项目目录下的 /Assets 文件夹中。
配置开发环境
- 使用 VSCode 打开整个项目文件夹。
- 如果 VSCode 提示安装 Python 插件，请按指引安装。
- 打开 VSCode 底部的 终端 (Terminal) 面板。
安装依赖库 在终端中执行以下命令安装所需依赖（国内用户如遇网络问题，可添加 -i https://pypi.tuna.tsinghua.edu.cn/simple 参数加速）：
```
pip install -r requirements.txt
```
刷新环境 依赖安装完成后，关闭并重新打开 VSCode，以确保所有新安装的库被正确识别。

基本使用

启动应用 在 VSCode 左侧文件栏中找到并点击 QualityScaler.py，然后点击右上角的 运行按钮 (Play Button) 启动程序。
操作界面
- 程序启动后将显示现代化的 GUI 界面。
- 图片处理: 选择兼容格式（jpg, png, webp, heic 等），选择 AI 模型和放大倍数，点击开始即可。
- 视频处理: 选择兼容格式（mp4, mkv, avi 等），程序支持断点续传（STOP&RESUME）。
- 高级选项: 支持多 GPU 协作、自动分块处理（避免显存溢出）、原始与放大效果插值混合等。
输出结果 处理完成后，放大后的图片或视频将保存在指定输出目录，整个过程无需联网，数据完全保留在本地。

版本历史

2026.22026/03/28

2026.12026/01/26

4.92025/12/14

4.82025/11/08

4.72025/10/13

4.52025/08/02

4.42025/07/26

4.22025/05/12

3.62024/06/05

3.52024/05/19

3.42024/04/16

3.22024/03/23

3.12024/03/07

4.0.02025/02/07

3.122024/11/22

3.112024/11/07

3.102024/09/25

3.92024/08/15

3.82024/07/22

3.72024/06/29

常见问题

升级时出现"error while upscaling"错误，但生成了部分图片后失败，如何解决？

软件运行时 CPU 占用 100% 但 GPU 占用为 0%，没有使用显卡加速怎么办？

遇到"AssertionError: Torch not compiled with CUDA enabled"错误该如何解决？

在旧电脑或低配置电脑上运行 CPU 模式时没有任何反应或速度极慢，是配置问题吗？

QualityScaler 支持 Linux 或 macOS 系统吗？

程序启动后没有任何反应，不处理图像也不占用 GPU，如何排查？

半精度（Half Precision）和全精度（Full Precision）该怎么选择？插值（Interpolation）设置有何建议？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|2周前

Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码（fair-code）工作流自动化平台，旨在让用户在享受低代码快速构建便利的同时，保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点，帮助用户轻松连接 400 多种应用与服务，实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”：既可以通过直观的可视化界面拖拽节点搭建流程，也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外，n8n 原生集成了基于 LangChain 的 AI 能力，支持用户利用自有数据和模型构建智能体工作流。在部署方面，n8n 提供极高的自由度，支持完全自托管以保障数据隐私和控制权，也提供云端服务选项。凭借活跃的社区生态和数百个现成模板，n8n 让构建强大且可控的自动化系统变得简单高效。

★ 184.7k|★★☆☆☆|今天

数据工具开发框架Agent

AutoGPT

AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台，核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点，让用户只需设定目标，AI 即可自主规划步骤、调用工具并持续运行直至完成任务。无论是开发者、研究人员，还是希望提升工作效率的普通用户，都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体；研究人员能基于开源架构探索多智能体协作机制；而非技术背景用户也可直接选用预置的智能体模板，立即投入实际工作场景。 AutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑，每个块负责单一动作，灵活且易于调试。同时，平台支持本地自托管与云端部署两种模式，兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本，即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛，让人人都能成为 AI 的创造者与受益者。

★ 183.6k|★★★☆☆|今天

Agent语言模型插件

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 161.1k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|2天前

开发框架图像Agent