APT

773 85 简单 1 次阅读昨天MIT视频音频图像开发框架语言模型Agent

AI 解读由 AI 自动生成，仅供参考

APT 是一款免费开源的 AI 生产力工具，旨在通过本地化部署提升用户效率，同时严格保障隐私与数据安全。它解决了传统云端 AI 服务存在的数据泄露风险、网络依赖及高昂使用成本等痛点，让用户无需联网即可享受智能服务。

无论是需要处理多媒体素材的设计师、关注数据合规的企业用户，还是希望轻松体验前沿技术的普通大众，APT 都能提供便捷支持。其最大亮点在于“开箱即用”：无需复杂安装配置，解压即可运行，并内置了 ChatGPT、DeepSeek、Qwen 等多种主流大模型，支持离线智能对话。

在功能方面，APT 提供了强大的一键批量处理能力。针对图片，可实现超分辨率增强、自动去水印、老照片修复及转 3D 效果；视频处理涵盖画质提升、帧率插值、背景移除及风格化转换；音频方面则支持人声伴奏分离、智能降噪及语音转文字。目前 APT 已发布 Windows 版本，未来将拓展至更多平台，致力于成为每个人身边安全、高效且免费的本地 AI 助手。

使用场景

一位独立纪录片创作者正在整理一批从老旧磁带数字化而来的珍贵历史影像素材，急需修复画质并去除干扰元素以用于最终成片。

没有 APT 时

隐私与成本焦虑：担心将未公开的原始素材上传至云端 AI 服务会导致数据泄露，且商用在线工具的高昂订阅费超出了个人预算。
操作繁琐低效：需要分别下载视频超分、去水印、补帧等不同软件，逐一处理每个文件，耗时数天且容易出错。
网络环境受限：在处理大体积视频文件时，受限于不稳定的网络连接，上传和下载过程频繁中断，严重影响工作流。
配置门槛过高：尝试部署开源模型时，面对复杂的 Python 环境依赖和显卡配置要求，耗费大量时间仍无法成功运行。

使用 APT 后

本地安全零成本：APT 完全在本地离线运行，所有敏感影像数据不出电脑，既确保了素材绝对安全，又免除了任何软件费用。
一键批量智能处理：利用 APT 的“视频超分”、“自动擦除”和“帧插值”功能，一次性批量导入所有素材，几分钟内即可完成画质增强与杂质清理。
离线流畅作业：无需连接互联网即可调用内置的本地模型进行高强度计算，彻底摆脱网络波动对渲染进度的干扰。
开箱即用免配置：下载解压后即可直接启动，无需安装任何环境或调整复杂参数，让创作者能立即专注于内容本身。

APT 通过本地化、一站式的一键处理能力，让个人创作者也能在保障数据安全的前提下，高效获得电影级的影像修复效果。

运行环境要求

操作系统

Windows

GPU

未说明

内存

未说明

依赖

notes目前仅正式发布 Windows 10 x64 (版本 1803+) 版本；Android 和 iOS 正在开发中，Mac 和 Linux 处于规划阶段。该工具主打免安装配置，解压即可一键运行，支持离线本地部署以保护隐私。

python未说明

快速开始

| 中文 | English |

AI 生产力工具

免费且开源，提升用户生产力，保护隐私与数据安全。提供高效便捷的AI解决方案，包括但不限于：内置本地专属的ChatGPT、DeepSeek、Phi、通义千问等模型，一键批量智能处理图片、视频、音频等。

主要特性

免费开源：免费使用，源代码开放，用户可自行查看和修改。
隐私保护：本地部署，所有数据均在本地处理，确保用户隐私与数据安全。
离线使用：无需连接互联网，可离线运行，避免网络限制的影响。
免安装配置：无需安装和配置，解压后即可一键启动，方便快捷。
多语言支持：支持多语言国际化，满足全球用户需求。

生成对话

生成对话：提供ChatGPT、DeepSeek、Phi、通义千问等本地离线模型，让您随时随地享受智能AI对话体验。

图片处理

图片超分辨率：提升图片分辨率，确保无损画质。
图片自动擦除：去除图片中的水印、字幕和Logo，还原原始画面。
图片卡通漫画：将图片转换为生动的卡通或漫画风格。
图片转3D：将图片转换为逼真的3D场景。
图片色彩修复：为老照片重新上色，赋予其新的生命力。
图片插帧：自动生成图片之间的插值图像。
图片背景抠图：轻松去除图片背景，导出透明背景图片。
图片人脸修复：修复模糊或受损的人脸图像，增强细节。

视频处理

视频超分辨率：提升视频分辨率，保持清晰画质。
视频自动擦除：去除视频中的水印、字幕和Logo，还原原始画面。
视频卡通漫画：将视频转换为有趣的卡通或漫画风格。
视频转3D：将视频转换为沉浸式的3D效果。
视频色彩修复：为老视频重新上色，体验全新的视觉效果。
视频插帧：提高视频帧率，使播放更加流畅。
视频背景抠图：轻松去除视频背景，并方便地更换背景。
视频整理：解密、合成并整理下载的缓存视频文件。

音频处理

音频人声分离：准确分离音频中的人声与伴奏，还原原始伴奏、人声等。
音频降噪：智能识别并去除音频中的干扰噪声，恢复清晰原声。
音频文本转语音（测试中）：根据文本内容生成克隆声音，精准还原音色、情感和语速。
音频语音转文本（测试中）：智能实时分析语音，自动生成文本内容。

支持平台

操作系统	状态	备注
Windows	已发布	Windows 10 x64 1803+
Android	开发中
iOS	开发中
Mac	计划中
Linux	计划中

未来计划

我们将继续集成和优化更多AI模型，以满足用户的多样化需求。

开源及下载地址

| Github | Gitee | Google Drive | 百度网盘 | 腾讯微云 |

使用说明和技术支持

邮箱：Rnchg@Hotmail.com
Github：github.com/rnchg/APT
Gitee：gitee.com/rnchg/APT
Youtube：Light Cloud Wind
Bilibili：风轻云也净
QQ：6085398

运行界面

首页生成对话图片处理视频处理视频处理设置

捐赠支持

如果您觉得这个项目有用，可以请作者喝杯咖啡。捐赠支持

APT 快速上手指南

APT 是一款免费开源的本地 AI 生产力工具，主打隐私保护与离线运行。它内置了 ChatGPT、DeepSeek、Qwen 等本地模型，并提供图片、视频、音频的一键批量智能处理功能（如超分、去水印、转卡通、老片修复等）。

环境准备

系统要求

操作系统：Windows 10 x64 (版本 1803 及以上)
硬件建议：建议配备独立显卡（NVIDIA GPU）以获得更佳的处理速度，但 CPU 亦可运行部分轻量任务。
其他平台：Android、iOS、Mac 及 Linux 版本目前处于开发或规划阶段，暂不可用。

前置依赖

无需安装配置：本工具采用绿色免安装设计，无需配置 Python 环境、CUDA 或其他复杂依赖库。
解压工具：系统需自带或安装支持 .zip 格式的解压软件（如 WinRAR, 7-Zip 或系统自带解压功能）。

安装步骤

本项目提供国内镜像源下载，推荐优先使用百度网盘或腾讯微云获取安装包。

下载安装包 从以下任一地址下载最新版本的压缩包：
- 百度网盘 (提取码: 1234)
- 腾讯微云
- Gitee 发布页
- Github 发布页
解压文件 将下载的压缩包解压至任意非中文路径的文件夹中（例如：D:\Tools\APT）。
启动程序 进入解压后的文件夹，双击主程序文件（通常为 .exe 后缀）即可直接运行，无需额外命令。

基本使用

启动后您将看到可视化操作界面，以下是核心功能的最简使用流程：

1. 本地 AI 对话 (Generate Chat)

点击左侧菜单 "Generate Chat"。
在模型列表中选择内置模型（如 ChatGPT, DeepSeek, Qwen 等）。
直接在对话框输入问题，即可享受离线智能对话体验。

2. 图片智能处理

点击左侧菜单 "Image processing"。
选择具体功能模块（例如 "Image Auto Wipe" 去水印或 "Image Super Resolution" 超分）。
点击上传按钮选择单张或多张图片。
点击 "Start" 或 "Run" 按钮，处理完成后自动保存至输出目录。

3. 视频与音频处理

操作逻辑与图片处理一致。
视频示例：选择 "Video Cartoon Comics"，导入视频文件，一键转换为漫画风格。
音频示例：选择 "Audio Vocal Split"，导入音频文件，自动分离人声与伴奏。

4. 设置与多语言

点击 "Settings" 可切换界面语言（支持中文/英文等多国语言），或调整模型运行参数。

提示：所有数据处理均在本地完成，断网状态下亦可正常使用全部功能。

版本历史

2.9.16.02025/12/13

2.9.15.02025/08/25

2.9.14.02025/08/03

2.9.13.02025/07/19

2.9.12.02025/07/12

2.9.11.02025/07/06

2.9.10.02025/07/03

2.9.9.02025/06/29

2.9.8.02025/06/20

2.9.7.02025/06/19

2.9.6.02025/06/17

2.9.5.02025/06/09

2.9.3.02025/06/07

2.9.2.02025/03/02

2.9.1.02025/02/19

2.9.0.02025/02/17

2.8.2.02025/01/07

2.8.1.02025/01/06

2.8.0.02025/01/05

2.7.1.02024/12/01

常见问题

APT 项目是否还在维护？是否有替代方案？

软件提示“试用有效时间已过期”或授权码失效怎么办？

为什么在 Windows 7 或加载模型时出现报错（如 NativeMethods 异常）？

内置模型对话效果不佳或反应迟钝，如何提升体验？

精简版中找不到 ChatGPT 菜单或无法使用相关功能？

ChatGPT 模块输入长文本时发送按钮消失或无法滚动到最后一行？

内置 GPT 输入框无法粘贴多行文本，只能粘贴第一行？

如何验证从网盘下载的文件是否完整或未损坏？

源码中缺少 General.Apt.Service 包，如何获取？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|4天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|5天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 148.6k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|2天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|今天

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|3天前

插件开发框架