Rosetta

552 107 较难 1 次阅读 2天前LGPL-3.0开发框架

AI 解读由 AI 自动生成，仅供参考

Rosetta 是一个基于 TensorFlow 构建的隐私保护框架，旨在让人工智能模型在训练和推理过程中无需暴露原始数据。它巧妙融合了安全多方计算、联邦学习以及可信执行环境等主流隐私技术，让开发者无需具备深厚的密码学背景，也能轻松实现数据隐私保护。

Rosetta 主要解决了数据孤岛与隐私合规之间的矛盾。在传统模式下，多方协作建模往往面临数据无法共享的难题，而 Rosetta 允许各方在不泄露本地私有数据的前提下完成联合计算。其最大的亮点在于极高的易用性：用户只需在现有的 TensorFlow 代码中引入 import latticex.rosetta，即可将传统机器学习任务无缝转换为隐私保护模式，几乎无需修改原有逻辑。

技术上，Rosetta 集成了 SecureNN 和 Helix 等安全协议，支持三方半诚实模型下的安全计算，并引入了高效的 Mystique 零知识证明协议，能够胜任如 ResNet 等复杂模型的隐私推理任务。

这款工具非常适合人工智能开发者、数据科学家以及隐私计算研究人员使用。如果你希望在 Ubuntu 环境下，利用现有的 TensorFlow 技能快速搭建安全的分布式机器学习系统，Rosetta 将是一个高效且专业的选择。

使用场景

三家竞争医院的科研团队希望联合训练一个癌症预测模型，但受限于患者隐私法规，无法直接共享原始病历数据。

没有 Rosetta 时

开发门槛极高：团队必须聘请密码学专家手动实现安全多方计算（MPC）协议，将普通的 TensorFlow 代码重写为复杂的加密逻辑。
协作成本巨大：各方需花费数周时间协商数据接口与通信协议，任何一方的代码变动都可能导致整个联合训练流程崩溃。
合规风险难控：在尝试联邦学习或可信执行环境时，难以确保中间梯度或参数不泄露敏感信息，面临巨大的法律合规隐患。
模型迭代缓慢：由于底层加密运算效率低下且调试困难，原本几天能完成的模型验证周期被拉长至数月。

使用 Rosetta 后

零代码侵入迁移：开发人员只需在现有 TensorFlow 脚本中加入 import latticex.rosetta，即可自动将普通矩阵运算转换为安全的三方密态计算。
屏蔽底层复杂性：Rosetta 内置了 SecureNN 等成熟协议，自动处理节点间的通信拓扑与密钥管理，让算法工程师专注于模型结构而非密码学细节。
数据可用不可见：基于半诚实模型下的安全保证，三家医院的数据全程保持加密状态，仅输出最终训练结果，完美满足隐私合规要求。
高效复用生态：直接兼容 TensorFlow 1.14 API 及现有的 ResNet 等复杂模型架构，利用 Mystique 零知识证明技术加速推理，大幅缩短研发周期。

Rosetta 通过“一行代码”的极简改造，让非密码学背景的开发者也能轻松构建高安全、低成本的隐私保护 AI 系统。

运行环境要求

操作系统

Linux (Ubuntu 18.04)

GPU

未说明 (基于 CPU)

内存

未说明

依赖

notes目前不支持 Windows 和 macOS。默认基于 CPU 运行。支持通过设置环境变量 'export ROSETTA_MPC_128=ON' 并在编译时添加 '--enable-128bit' 选项来启用 128 位整数数据类型。运行前需配置网络拓扑以建立多方通信。

python未说明 (需兼容 TensorFlow 1.14)

tensorflow==1.14.0

快速开始

LOGO

中文版

概述

Rosetta 是一个基于 TensorFlow 的隐私保护框架。它集成了主流的隐私保护计算技术，包括密码学、联邦学习和可信执行环境。Rosetta 的目标是在无需密码学、联邦学习和可信执行环境专业知识的情况下，为人工智能提供隐私保护解决方案。Rosetta 复用了 TensorFlow 的 API，并允许以最小的改动将传统的 TensorFlow 代码转换为隐私保护模式。例如，只需添加以下一行代码：

import latticex.rosetta

当前版本集成了针对三方的安全多方计算协议。底层协议是 SecureNN 和 Helix，它们在诚实多数的半诚实模型下是安全的。

Rosetta 还集成了高效的零知识证明协议 Mystique，用于复杂 AI 模型（如 ResNet）的安全推理任务。请参阅示例了解其使用方法。

安装

目前，Rosetta 运行在 Ubuntu 18.04 上，并基于 TensorFlow 1.14 和 CPU 架构（暂不支持 Windows 操作系统）。您可以按照以下步骤安装 Rosetta。

首先，请确保您的本地系统满足我们的基础环境要求。

然后，使用以下命令安装原生 TensorFlow。请注意，您也可以从源代码安装，详细信息请参阅此处。

# 安装 tensorflow
pip3 install tensorflow==1.14.0

接下来，使用我们的一体化脚本构建并安装 Rosetta，具体步骤如下：

# 克隆 rosetta git 仓库
git clone --recurse https://github.com/LatticeX-Foundation/Rosetta.git

或（注：由于近期 GitHub 对个人令牌的更改，SSH 方式仍然有效，请参考 GitHub 获取最新更新）
git clone git@github.com:LatticeX-Foundation/Rosetta.git
git submodule update --init --recursive
cd Rosetta
# 编译、安装。您可以通过运行 `rosetta.sh --help` 查看更多编译选项。
./rosetta.sh compile --enable-protocol-mpc-securenn; ./rosetta.sh install

在运行您的程序之前，您需要根据网络拓扑进行配置，以便建立分布式网络，使各方能够相互通信。

您可以使用一个示例来检查一切是否正常运行。有关 Rosetta 的安装、配置和部署的详细步骤，请参阅部署指南。

使用

以下是使用 Rosetta 进行矩阵乘法的一个简单示例。

在这个示例中，我们假设三个人希望计算各自私有矩阵的乘积，但又不希望其他人知道他们持有的内容。为了简洁起见，我们将这三人分别称为 P0、P1 和 P2。

借助 Rosetta，每个人都可以运行以下脚本，从中可以看出，除了原生 TensorFlow 的代码外，只需要少量额外的代码即可实现。

#!/usr/bin/env python3

# 导入 rosetta 包
import latticex.rosetta as rtt
import tensorflow as tf

# 激活后端协议，这里我们使用 SecureNN
rtt.activate("SecureNN")

# 从各方获取私有数据
matrix_a = tf.Variable(rtt.private_console_input(0, shape=(3, 2)))
matrix_b = tf.Variable(rtt.private_console_input(1, shape=(2, 1)))
matrix_c = tf.Variable(rtt.private_console_input(2, shape=(1, 4)))

# 直接使用原生的 tf.matmul 操作。
cipher_result = tf.matmul(tf.matmul(matrix_a, matrix_b), matrix_c)

# 开始执行
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    # 查看密文结果
    cipher_result = sess.run(cipher_result)
    print('本地密文结果:', cipher_result)
    # 设置只有 P0 和 P2 可以获得明文结果
    a_and_c_can_get_plain = 0b101 
    # 获取 Rosetta matmul 的结果
    print('明文矩阵乘法结果:', sess.run(rtt.SecureReveal(cipher_result, a_and_c_can_get_plain)))

要联合运行此程序，在完成网络配置后，三个人可以分别运行以下命令行：

python rosetta_demo.py --party_id=0

、

python rosetta_demo.py --party_id=1

以及

python rosetta_demo.py --party_id=2

随后，每个参与者会被提示输入自己的私有矩阵。例如，P0 可能会收到：

2021-10-22 09:46:08.571|info|Rosetta: 协议 [SecureNN] 后端初始化成功！任务：，节点 ID：P0

请输出私有数据（浮点数或整数，共 6 个，用空格分隔）：2 3 1 7 6 2

而 P1 则会收到：

2021-10-22 09:46:08.571|info|Rosetta: 协议 [SecureNN] 后端初始化成功！任务：，节点 ID：P1

请输出私有数据（浮点数或整数，共 2 个，用空格分隔）：1 2

P2 则会收到：

2021-10-22 09:46:08.571|info|Rosetta: 协议 [SecureNN] 后端初始化成功！任务：，节点 ID：P2

请输出私有数据（浮点数或整数，共 4 个，用空格分隔）：2 1 4 3

需要注意的是，这种通过控制台输入的方式仅用于本示例的教学目的。有关生产级的数据 API，请参阅我们的文档。

最终，P0 和 P2 将获得明文输出，而 P1 则不会，正如预期的那样。具体来说，P0 和 P2 可能会看到：

明文矩阵乘法结果：[[b'16.000000' b'8.000000' b'32.000000' b'24.000000']

[b'30.000000' b'15.000000' b'60.000000' b'45.000000']

[b'20.000000' b'10.000000' b'40.000000' b'30.000000']]

2021-10-22 09:49:58.888|info|Rosetta: 协议 [SecureNN] 后端已释放。

而 P1 则会看到：

明文矩阵乘法结果：[[b'0.000000' b'0.000000' b'0.000000' b'0.000000']

[b'0.000000' b'0.000000' b'0.000000' b'0.000000']

[b'0.000000' b'0.000000' b'0.000000' b'0.000000']]

2021-10-22 09:49:58.887|info|Rosetta: 协议 [SecureNN] 后端已释放。

这就是全部内容，您可以看到 Rosetta 非常易于使用。

那么，如何在 Rosetta 中快速使用 ZKP 呢？与上述 MPC 类似，这里有一个简单的示例。

#!/usr/bin/env python3

# 导入 Rosetta 包
import latticex.rosetta as rtt
import tensorflow as tf

# 您可以激活一个后端协议，这里我们使用 Mystique
rtt.activate("Mystique")

# P0 是证明者，提供所有见证数据（私密的），而
# P1 是验证者
matrix_a = tf.Variable(rtt.private_console_input(0, shape=(3, 2)))
matrix_b = tf.Variable(rtt.private_console_input(0, shape=(2, 3)))

# 直接使用原生的 tf.matmul 操作。
cipher_result = tf.matmul(matrix_a, matrix_b)

# 开始执行
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    # 查看密文结果
    cipher_result_v = sess.run(cipher_result)
    print('本地密文结果:', cipher_result_v)
    # 获取 Rosetta matmul 的结果
    print('明文结果:', sess.run(rtt.SecureReveal(cipher_result)))

rtt.deactivate()

此处 P0 是证明者，负责提供所有见证数据（私密的），输入如下：

2021-10-22 18:12:46.629|info|Rosetta: 协议 [Mystique] 后端初始化成功！任务：，节点 ID：P0

2021-10-22 18:12:46.629|info|创建并激活成功。任务：针对协议：Mystique

请录入私密数据（浮点数或整数，共6项，以空格分隔）：0 1 2 3 4 5

请录入私密数据（浮点数或整数，共6项，以空格分隔）：5 4 3 2 1 0

此处 P1 是验证者，在最后验证成功，并输出明文结果如下：

2021-10-22 18:13:12.860|info|zk 验证成功！！

明文结果：[[b'2.000000' b'1.000000' b'0.000000']

[b'16.000000' b'11.000000' b'6.000000']

[b'30.000000' b'21.000000' b'12.000000']]

2021-10-22 18:13:13.009|info|Rosetta: 协议 [Mystique] 后端已释放。

更多详情，请查看教程和示例。

注：目前 Rosetta 已支持 128 位整数数据类型，可通过设置环境变量 export ROSETTA_MPC_128=ON 并在编译时添加选项 --enable-128bit 来启用。

入门指南

为了帮助您轻松上手第一个可用的 Rosetta 程序，我们的教程将引领您进入这个精彩的世界。在这些详尽的教程中，我们将引导您学习 Rosetta 的基本概念，然后通过易于理解的示例向您展示如何使用我们提供的接口，最终帮助您在真实世界的数据集上构建一个可行的隐私保护机器学习模型。

希望本教程以及示例中的其他示例能够激发您进一步了解这一隐私保护框架的兴趣。

Rosetta 的工作原理

Rosetta 通过扩展和“黑客式”改造 TensorFlow 的 Python 前端和后端的操作内核来实现其功能。它将 TensorFlow 相关组件的开发与隐私技术分离，使人工智能和密码学领域的开发者都能专注于自己感兴趣的领域。

当运行您的 Rosetta 程序时，首先会转换原生的 TensorFlow 数据流图，在此过程中，图中的原生操作会被替换为 SecureOps。

随后，在第二阶段，会调用基于特定加密协议实现的操作后端内核，以执行底层的安全计算。

参与 Rosetta 的贡献

Rosetta 是一个在 LPGLv3 许可证下开发的开源项目，由 LatticeX 基金会维护。我们欢迎个人和组织的贡献。在开始之前，请先阅读我们的贡献指南。我们的项目遵守行为准则，参与社区的成员应遵守该准则。您也可以点击这里提交问题。

文档列表

引用

您可以按以下方式引用我们的工作：

    @misc{Rosetta,
      author = {Yuanfeng Chen 和 Gaofeng Huang 和 Junjie Shi 和 Xiang Xie 和 Yilin Yan},
      title = {{Rosetta：基于 TensorFlow 的隐私保护框架}},
      howpublished = {\url{https://github.com/LatticeX-Foundation/Rosetta}},
      year={2020}
    }

参考资料

请参阅此维基页面获取参考资料。

联系方式

您可以通过电子邮件与我们联系。欢迎您加入 Rosetta 社区的 Slack ，在这里您可以提出任何问题，并与其他开发者讨论感兴趣的话题。

许可证

Rosetta 库根据 GNU 宽通用公共许可证 v3.0 授权。

Rosetta 快速上手指南

Rosetta 是一个基于 TensorFlow 的隐私保护框架，集成了安全多方计算（MPC）、联邦学习和可信执行环境等技术。它允许开发者通过极少的代码改动（仅需导入一个包），将传统的 TensorFlow 代码转换为隐私保护模式，无需深厚的密码学背景。

1. 环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Ubuntu 18.04（目前不支持 Windows）。
硬件架构：CPU（支持 x86_64）。
Python 版本：需兼容 TensorFlow 1.14 的 Python 环境（通常推荐 Python 3.6 或 3.7）。
前置依赖：
- Git
- pip3
- 基础编译工具链 (gcc, g++, make 等)

注意：Rosetta 当前基于 TensorFlow 1.14.0 构建。

2. 安装步骤

第一步：安装原生 TensorFlow

首先安装指定版本的 TensorFlow：

pip3 install tensorflow==1.14.0

第二步：克隆代码库

使用 Git 克隆 Rosetta 仓库及其子模块：

# 方式一：使用 HTTPS
git clone --recurse https://github.com/LatticeX-Foundation/Rosetta.git

# 方式二：使用 SSH (如果配置了 GitHub SSH Key)
# git clone git@github.com:LatticeX-Foundation/Rosetta.git
# cd Rosetta
# git submodule update --init --recursive

第三步：编译与安装

进入目录并使用官方提供的一键脚本进行编译和安装。默认启用 SecureNN 协议：

cd Rosetta

# 编译并安装
./rosetta.sh compile --enable-protocol-mpc-securenn
./rosetta.sh install

提示：如需支持 128 位整数数据类型，请在编译时添加 --enable-128bit 选项，并设置环境变量 export ROSETTA_MPC_128=ON。

第四步：网络配置

Rosetta 需要多方参与通信。在运行程序前，需根据部署拓扑配置网络文件（如 party.conf），确保各参与方（Party）之间可以互相通信。详细配置请参考项目内的 doc/DEPLOYMENT.md。

3. 基本使用

Rosetta 的使用非常简便，只需导入 latticex.rosetta 并激活相应协议，即可复用 TensorFlow API 进行隐私计算。

以下是一个最简单的三方矩阵乘法示例：假设 P0、P1、P2 三方各自持有私有矩阵，希望计算乘积但不泄露原始数据。

代码示例 (`rosetta_demo.py`)

#!/usr/bin/env python3

# 导入 rosetta 包
import latticex.rosetta as rtt
import tensorflow as tf

# 激活后端协议，此处使用 SecureNN
rtt.activate("SecureNN")

# 获取各方的私有数据 (模拟从控制台输入)
# shape 分别对应 (3, 2), (2, 1), (1, 4)
matrix_a = tf.Variable(rtt.private_console_input(0, shape=(3, 2)))
matrix_b = tf.Variable(rtt.private_console_input(1, shape=(2, 1)))
matrix_c = tf.Variable(rtt.private_console_input(2, shape=(1, 4)))

# 直接使用原生的 tf.matmul 操作
cipher_result = tf.matmul(tf.matmul(matrix_a, matrix_b), matrix_c)

# 启动会话执行
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    # 查看密态结果 (可选)
    cipher_result_val = sess.run(cipher_result)
    print('local ciphertext result:', cipher_result_val)
    
    # 设定只有 P0 (bit 0) 和 P2 (bit 2) 可以获取明文结果 (二进制 101 = 5)
    a_and_c_can_get_plain = 0b101 
    
    # 解密并输出结果
    print('plaintext matmul result:', sess.run(rtt.SecureReveal(cipher_result, a_and_c_can_get_plain)))

运行方法

配置好网络后，三个参与方需在各自的终端分别运行以下命令（指定不同的 party_id）：

参与方 0 (P0):

python rosetta_demo.py --party_id=0

参与方 1 (P1):

python rosetta_demo.py --party_id=1

参与方 2 (P2):

python rosetta_demo.py --party_id=2

运行效果

每个进程启动后，会提示输入私有数据（浮点数或整数，空格分隔）。
计算完成后，根据权限设置：
- P0 和 P2 将看到正确的矩阵乘法明文结果。
- P1 将看到全零结果（因为未被授权获取明文）。

更多高级用法（如零知识证明 Mystique 协议）及详细教程，请参阅项目文档 doc/TUTORIALS.md 和 example 目录。

版本历史

v1.0.02021/07/30

v0.3.02020/12/01

v0.2.02020/07/10

v0.1.12020/04/27

v0.1.02020/04/27

常见问题

运行多进程任务时出现连接错误或端口冲突怎么办？

Rosetta 目前支持几方的安全计算协议？支持两方或多于三方吗？

运行百万富翁问题示例时程序卡住或报错如何解决？

Rosetta 处理后的 Tensor 维度未知（unknown shape）导致后续层报错怎么办？

为什么三维 Tensor 相乘会报 "Shape must be rank 2 but is rank 3" 错误？

在联合预测场景中，如何正确加载模型和处理私有数据输入？

是否需要手动编写反向传播图或使用 SGD 优化器？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 157.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|6天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|6天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架

使用场景

没有 Rosetta 时

使用 Rosetta 后

运行环境要求

快速开始

概述

安装

使用

入门指南

Rosetta 的工作原理

参与 Rosetta 的贡献

文档列表

引用

参考资料

联系方式

许可证

Rosetta 快速上手指南

1. 环境准备

2. 安装步骤

第一步：安装原生 TensorFlow

第二步：克隆代码库

第三步：编译与安装

第四步：网络配置

3. 基本使用

代码示例 (rosetta_demo.py)

运行方法

运行效果

版本历史

常见问题

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

gemini-cli

markitdown

代码示例 (`rosetta_demo.py`)