flyte

GitHub
6.9k 800 较难 1 次阅读 今天Apache-2.0其他数据工具图像开发框架语言模型Agent
AI 解读 由 AI 自动生成,仅供参考

Flyte 是一款专为构建生产级数据与机器学习流水线而设计的开源编排平台。它旨在解决 AI 工作流在规模化扩展、版本复现及跨环境部署时面临的复杂难题,让团队能够轻松协调数据、模型与计算资源。

无论是机器学习工程师、数据科学家还是后端开发者,都可以利用 Flyte 强大的 Python SDK,用熟悉的语言编写代码并定义清晰的工作流。其核心亮点在于基于 Kubernetes 构建,天然具备弹性伸缩能力,支持将任务无缝部署从本地开发环境到云端或私有集群,实现高效的分布式处理。Flyte 独特的类型引擎确保了数据流转的严谨性,而内置的版本控制机制则保证了实验结果的可复现性,极大降低了运维门槛。

随着 Flyte 2 的推出,用户现在可以通过全新的 flyte-sdk 更便捷地在本地启动和测试流程。如果你正在寻找一个既能满足简单脚本运行,又能支撑大规模复杂 AI 任务的可靠基础设施,Flyte 将是一个成熟且友好的选择,帮助你将算法模型稳定地转化为实际生产力。

使用场景

某电商公司的数据科学团队正在构建一个每日更新的“用户流失预测”系统,该流程涉及从数据仓库提取海量日志、清洗特征、训练深度学习模型并最终部署推理服务。

没有 flyte 时

  • 流程脆弱难维护:依赖简单的 Cron 脚本串联任务,一旦中间某个数据清洗步骤失败,整个链路中断且难以自动重试,人工排查耗时耗力。
  • 环境不一致导致复现困难:开发人员在本地笔记本上调试通过的代码,因依赖库版本差异,在生产集群运行时频繁报错,模型结果无法复现。
  • 资源调度低效:大规模数据处理与模型训练任务争抢固定服务器资源,缺乏弹性伸缩能力,导致夜间批处理经常超时,影响次日报表生成。
  • 协作黑盒化:新成员难以理解复杂的脚本依赖关系,修改逻辑时容易误触其他环节,缺乏可视化的版本管理和血缘追踪。

使用 flyte 后

  • 构建高韧性工作流:利用 Flyte 的原生重试机制和容错设计,单个任务失败可自动恢复,确保每日流水线稳定运行,无需人工值守。
  • 确保端到端可复现性:通过强类型引擎和容器化封装,锁定每一步的代码、数据与依赖环境,保证本地开发与云端生产的结果完全一致。
  • 弹性利用计算资源:基于 Kubernetes 动态调度,数据预处理和训练任务按需自动扩缩容,大幅缩短作业运行时间并降低闲置成本。
  • 透明化协作与治理:提供可视化的执行图谱和版本控制,团队成员可清晰追溯数据血缘,安全地并行迭代模型策略。

Flyte 将原本支离破碎的脚本作业转化为标准化、可观测且弹性伸缩的生产级 AI 流水线,显著提升了研发效率与系统稳定性。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU
  • 非必需
  • 支持通过任务装饰器请求 GPU 资源以加速任务,具体型号和显存取决于用户配置
内存

未说明(取决于工作负载;运行本地 Sandbox 集群需足够内存以承载 Docker 容器)

依赖
notesFlyte 是一个基于 Kubernetes 的编排平台。本地开发仅需安装 Python SDK (flytekit);若要运行完整集群,需安装 flytectl 并通过 Docker 启动 Sandbox 环境。生产环境部署需要 Kubernetes 集群。支持多种语言(Python, Java, Scala, JS),但核心 SDK 为 Python。
python3.8+ (推断自 flytekit 常规要求,文中未明确指定具体版本号,但提到支持 Python SDK)
flytekit
flytectl
Docker
flyte hero image

快速开始

[!IMPORTANT]

正在寻找 Flyte 2 吗?

  • 想在本地使用 Flyte 吗? 请访问 flyte-sdk — Flyte 2 的全新 Python SDK。
  • 希望参与分布式后端的开发吗? 请查看本仓库的 v2 分支

以下 README 适用于 Flyte 1.x。


Flyte 和 LF AI & Data Logo

Flyte

:building_construction: :rocket: :chart_with_upwards_trend:

当前版本标签 Sandbox 状态标签 测试状态标签 许可证标签 OpenSSF 最佳实践标签 Flyte Helm Chart 标签 Flyte Slack 标签

Flyte 是一个开源的工作流编排系统,用于构建生产级别的数据和机器学习流水线。它专为可扩展性和可重复性而设计,并以 Kubernetes 作为其底层平台。借助 Flyte,用户团队可以使用 Python SDK 构建流水线,并将其无缝部署到云端和本地环境中,从而实现分布式处理和高效的资源利用。

构建

用 Python 或其他语言编写代码,并利用强大的类型引擎。

Flyte 入门

部署与扩展

无论是在本地还是远程集群上,都可以轻松执行您的模型。

Flyte 入门

开始使用 · 文档 · 资源

目录


快速入门

  1. 安装 Flyte 的 Python SDK
pip install flytekit
  1. 创建一个工作流(参见 示例
  2. 在本地运行:
pyflyte run hello_world.py hello_world_wf

准备好尝试 Flyte 集群了吗?

  1. 创建一个新的沙盒集群,以 Docker 容器的形式运行:
flytectl demo start
  1. 现在可以在集群上执行您的工作流:
pyflyte run --remote hello_world.py hello_world_wf
Flyte 入门,展示欢迎界面和 Flyte 控制台

想了解更多但又不想安装任何东西吗?

试试基于 Flyte 构建的 Union 平台signup.union.ai),即可免费获得 GPU、数据血缘追踪等功能!

准备投入生产了吗?

请参阅 部署指南,了解如何在不同环境上安装 Flyte。

教程

功能特性

🚀 强类型接口:通过使用 Flyte 类型定义数据护栏,在工作流的每一步验证数据。
🌐 任意语言:使用原生容器编写任何语言的代码,或选择 PythonJavaScalaJavaScript SDK 来开发你的 Flyte 工作流。
🔒 不可变性:不可变的执行有助于确保可重复性,因为它可以防止对执行状态的任何更改。
🧬 数据血缘:跟踪数据和机器学习工作流生命周期中数据的流动与转换。
📊 映射任务:使用 映射任务 以最少的配置实现并行代码执行。
🌎 多租户支持:多个用户可以在共享同一平台的同时,保持各自独立的数据和配置。
🌟 动态工作流构建灵活且可适应的工作流,可以根据需要进行更改和演进,从而更轻松地应对不断变化的需求。
⏯️ 在继续执行之前,等待 外部输入
🌳 分支逻辑:根据其他任务生成的静态或动态数据,或者输入数据,有选择地执行工作流分支
📈 数据可视化:通过图表可视化数据、监控模型并查看训练历史。
📂 FlyteFile 和 FlyteDirectory:在本地存储和云存储之间传输 文件目录
🗃️ 结构化数据集:使用 结构化数据集 提供的抽象二维表示,在不同类型之间转换数据框,并强制执行列级类型检查。
🛡️ 故障恢复:仅恢复失败的任务。
🔁 重跑单个任务:在不修改数据/机器学习工作流先前状态的情况下,以最细粒度级别重新运行工作流。
🔍 缓存输出:通过将 cache=True 传递给任务装饰器来缓存任务输出。
🚩 任务内检查点:在任务执行过程中 记录进度
超时设置:定义一个超时时间,超过该时间后任务将被标记为失败。
🏭 从开发到生产:只需将你的 从开发或预发布环境切换到生产环境即可。
💸 竞价实例或抢占式实例:通过在任务装饰器中将 interruptible 设置为 True,将你的工作流调度到竞价实例上运行。
☁️ 云原生部署:可在 AWS、GCP、Azure 等云服务上部署 Flyte。
📅 调度功能调度 数据和机器学习工作流在特定时间运行。
📢 通知机制:通过 Slack、PagerDuty 或电子邮件配置 通知,及时了解工作流状态的变化。
⌛️ 时间线视图:评估每个 Flyte 任务的执行时长,识别潜在的瓶颈。
💨 GPU 加速:通过在任务装饰器中请求资源,启用并控制任务的 GPU 需求。
🐳 容器化依赖隔离:为每个任务维护独立的依赖项集合,避免依赖冲突。
🔀 并行性:Flyte 任务天生具有并行性,以优化资源消耗并提升性能。
💾 在任务级别动态分配资源

谁在使用 Flyte

加入 LinkedIn、Spotify、Freenome、Pachama、华纳兄弟等众多企业,共同采用 Flyte 应用于关键业务场景。有关完整采用者名单及如何添加贵组织或项目的信息,请访问我们的 ADOPTERS 页面。

如何参与社区

👥 每月社区同步会议:每月第一个周二举行,Flyte 团队在此分享项目最新进展,社区成员也可交流工作成果并提问。
💬 Slack:加入 Flyte 社区的 Slack 群组,与其他用户交流、提问并获得帮助。
⚠️ 邮件通讯:订阅此群组以接收 Flyte 每月通讯。
📹 YouTube:观看专题讨论、客户成功案例、社区更新以及功能深度解析视频。
📄 博客:在这里你可以找到教程和功能深度解析文章,帮助你更好地了解 Flyte。
💡 RFCs: RFC 是用于提出改进 Flyte 的新想法和功能的文档。你可以参考它们来了解最新进展,并为平台的发展贡献力量。

如何贡献

参与 Flyte 的方式有很多,包括:

我们 :heart: 我们的贡献者

953358370901257597118271592984394388881151083056278108056158892184082372896568379360156533941518524277247631688870927777173230626037779831250323568805803623945045216615335863656289847489857646126257257078122852108698153880645393621326174213126913098469892991815175375584975487021914271628166891937524124364830533133944361047110526540160909769434909370988606505138207208951108201179967134587798502655414728263125543413302332486884679273651103549674588200209435878191638995424817025387601042579291716813605291777447131688122784654540263349699333727524781147085461973368336886416600697446214344335886692406989882626825347914085913193589976021155087543408161480048531577879139945512047003511534815850499746030368211097441810591518140633515178944062685204637780421934393965913977119913825688514002198716277709609986167090184172091274471106939297484070473808541340938441697464111154219021276867183378074598193226246625975926092524122194053171991106936600983496431650949098242479100569684303753899207295668840528975434806901302711670020615211264224864025771953385420942116869217394267333652917450171309138541130621230543342654873665615083616362383910614761261410143085333347482710201242112692566122863313070236881763917309187268346582640499389554578123362997332401147648834371700634388657833688385125105375472644938564310376195441710573247359129137041193451861333172481161436246112796333870402301512450632193490421358022283741621437261981311462982905305152355146409019506716684315071835339155057967031509259948142234188101329140071502380665826048411629710451973647600136022692089327000005628830217903573643962287422223234145313810384925072358334441230138257716778248966647473915567005765543338601108861842236795198533735590007834498039341704703036187201737394410453113847439131469540170696024885946984748283518967358951121866694153004911153972823107192659695710300986867747585086045365068106610300557181436597780084735036857538281058769621015793222695370925038146886843728129392994419585902254272861891190262369530759891164206683495877000121042008113880711836330125695302639942817351764319823957515359754882350679871253644903451399667679926220965018921753214596423306510522997153571625111665161103072153596231091927689726061421149464787204420040113770222117322020247399496486490810430635319111751041527932781860922797900648658440548054046807100478916594151031759107633597380927544400255098360113672452724486999691617227907251316521443811224333676736594527869111422539117348062113358811005979981531334945403470148307006958772580328262653923327258771447721490674810438373618640601027207781157671652662769703322721373988912821510141313113652844957696810095462487792311442558512118037173446846119081931339361199128924683560847355538141538510245434011360427891568889166403105146824791684118999379677398367717079798011423240417142018311962777137779852149968681309027793438190178077527458886884413460717134706643691987169327182534676414319018522917741169245559401430262088186077197126300315122044410681536648933130478616006015635627323730526108403536244025051025587551467355852013547816270211145677369874281596283646765941323376751282233646638819213237080149921891175392261723554805631674759461174730930937758203311179698674901999060786303359213591898277733192290491237877123432938768067397786361548410023698911226001523431211875586910345184910544572953263822633385151841963647466337581400897892723761633460443689971043051219534421646184729942128455404056828138898150935185836804710215732047107115313670774438217712841908502178048512530327559366853113183450910789313242251300022244656467294714862028047035331821994291032633131308752109763936253185190374137721147841167397938336556266708948667547488631813081390277139198213513017138800017703926178510511193114821980916724173308724194191014504507229575678884147090147935364412421077809865193786149341113245101659473050833036160470810759239294814814785416837142807589100517263167638688761581175184469669285234268801011322857514642405410508216011335612233916421024762739078149680875248665052611549823250311894504138074341651338283207535655837499610582562559762775347530858035067549254867919957072302957100903841733751582966456388483282792388941221669819836490558799137794189828218567580320335411570555343555799376002516557902726715861062330152185555

许可证

Flyte 根据 Apache 许可证 2.0 版本提供。请合理使用。

版本历史

v2.0.112026/04/03
v2.0.102026/04/03
v1.16.52026/04/01
v2.0.92026/03/25
v2.0.82026/03/18
v2.0.72026/03/02
v2.0.62026/02/14
v1.16.42026/02/12
v2.0.52026/02/11
v2.0.42026/02/11
v2.0.32026/02/11
v2.0.22026/02/04
v2.0.12026/02/02
flytectl/v0.9.82026/01/26
flytectl/v0.9.72026/01/21
flytectl/v0.9.62026/01/20
v2.0.02025/12/22
v2.0.0-alpha162025/12/11
v1.16.32025/12/02
v2.0.0-alpha152025/12/02

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架