MLE-agent

GitHub
1.5k 105 简单 1 次阅读 昨天MIT语言模型图像Agent开发框架
AI 解读 由 AI 自动生成,仅供参考

MLE-Agent 是一款专为机器学习工程师和研究人员打造的智能编程助手,旨在让 AI 工程开发与科研工作变得更加流畅高效。它不仅仅是一个代码生成器,更是一位能独立完成任务的“结对编程”伙伴。

面对从零构建模型基线困难、复现前沿论文代码耗时以及调试过程繁琐等痛点,MLE-Agent 能够根据用户需求自动构建 ML/AI 基线方案,甚至能独立参与 Kaggle 竞赛并完成端到端任务。其独特之处在于深度集成了 Arxiv 和 Papers with Code 数据库,能主动检索最新论文与最佳实践来优化代码计划;同时具备智能调试能力,通过“调试器 - 编码器”的自动交互确保持续产出高质量代码。此外,它还支持代码检索增强生成(Code RAG),并能自动生成项目周报。

该工具特别适合希望提升研发效率的 AI 开发者、数据科学家及学术研究人员使用。无论是需要快速验证想法的工程师,还是追求复现 SOTA 方法的研究者,都能通过其友好的命令行界面,获得个性化的技术建议与全流程支持,从而将更多精力聚焦于核心创新而非重复性劳动。

使用场景

某算法工程师需要在三天内复现一篇最新的 Arxiv 论文并构建可运行的基线模型,以验证其在特定业务数据上的有效性。

没有 MLE-agent 时

  • 文献检索耗时:需手动在 Arxiv 和 Papers with Code 间反复切换,筛选代码仓库和最新 SOTA 方法,容易遗漏关键实现细节。
  • 环境配置繁琐:依赖库冲突频发,从零搭建符合论文要求的深度学习环境往往消耗半天以上时间。
  • 基线代码难产:阅读完论文后需手写大量样板代码,调试初期报错频繁,难以快速跑通第一个 Demo。
  • 进度追踪困难:缺乏自动化的实验记录机制,复现过程中的参数调整和错误修复全靠人工记忆或分散的笔记。

使用 MLE-agent 后

  • 智能方案规划:MLE-agent 直接集成 Arxiv 与 Papers with Code,自动分析论文并生成包含最佳实践的代码与研究计划。
  • 自动化基线构建:只需输入需求,MLE-agent 即可自主搭建项目结构、安装依赖并生成可运行的 ML 基线代码。
  • 智能调试闭环:遇到运行报错时,MLE-agent 内置的 Debugger-Coder 交互机制能自动定位问题并修复代码,确保持续集成。
  • 自动生成周报:MLE-agent 自动整理本周的实验记录、代码变更及研究成果,一键输出详细的工作总结报告。

MLE-agent 将原本需要数天的“检索 - 配置 - 编码 - 调试”链路压缩至小时级,让工程师能专注于核心算法创新而非工程琐事。

运行环境要求

操作系统
  • Linux
  • macOS
GPU

未说明 (支持本地运行及多种 LLM 后端,如 Ollama, OpenAI, Anthropic,具体取决于所选模型)

内存

未说明

依赖
notes1. 推荐使用 'uv' 工具进行虚拟环境管理和安装,也支持标准 'pip'。2. 该工具是一个 CLI 代理,本身不捆绑特定深度学习框架,而是作为编排层调用外部 LLM API (OpenAI, Claude, Mistral) 或本地服务 (Ollama)。3. 若选择本地运行开源模型 (如通过 Ollama),硬件需求将取决于所加载的具体模型大小。4. 部分功能 (如生成本地报告) 需要启动本地 Web 服务 (默认端口 3000)。5. 参与 Kaggle 竞赛或使用 Git 报告功能需预先配置相应的数据集、提交文件及 Git 邮箱。
python未说明 (需使用 uv 或 pip 创建虚拟环境)
mle-agent
uv
pip
MLE-agent hero image

快速开始

MLE-Agent:您无缝进行AI工程与研究的智能伙伴。

kaia-llama MLSysOps%2FMLE-agent | Trendshift

:love_letter: 父亲们对Kaia的爱 :love_letter:

PyPI - Version Downloads GitHub License 加入我们的Discord社区

📚 文档 | 🐞 报告问题 | 👋 欢迎在 Discord 加入我们

概述

MLE-Agent专为机器学习工程师和研究人员设计,是一款配对式LLM代理。其主要特点包括:

  • 🤖 自主基线:根据您的需求自动构建机器学习/人工智能基线和解决方案。
  • 🏅 端到端机器学习任务:参与Kaggle竞赛并独立完成任务。
  • 🔍 集成ArxivPapers with Code:访问最佳实践和最先进方法。
  • 🐛 智能调试:通过自动调试器与编码器交互确保高质量代码。
  • 📂 文件系统集成:高效组织您的项目结构。
  • 🧰 综合工具集成:包含AI/ML功能和MLOps工具,实现无缝工作流。
  • ☕ 交互式CLI聊天:通过易于使用的聊天界面增强您的项目。
  • 🧠 智能顾问:为您的机器学习/人工智能项目提供个性化建议和推荐。
  • 📊 每周报告:自动生成详细的每周工作总结。
流程 代理
Screenshot 2025-06-18 at 2 54 55 PM Screenshot 2025-06-18 at 2 55 04 PM

视频演示

https://github.com/user-attachments/assets/dac7be90-c662-4d0d-8d3a-2bc4df9cffb9

里程碑

  • :rocket: 2024年9月24日:发布0.4.2版本,增强Auto-Kaggle模式,以最少 effort 完成端到端竞赛。
  • :rocket: 2024年9月10日:发布0.4.0版本,新增CLI如MLE reportMLE kaggleMLE integration等,并支持多种新模型,例如Mistral
  • :rocket: 2024年7月25日:发布0.3.0版本,进行了大规模重构及多项集成。(v0.3.0)
  • :rocket: 2024年7月11日:发布0.2.0版本,支持多代理交互。(v0.2.0)
  • 👨‍🍼 2024年7月3日:Kaia诞生
  • :rocket: 2024年6月1日:发布MLE代理的第一个基于规则的版本。(v0.1.0)

开始使用

安装

从PyPI安装

# 使用pip:
pip install -U mle-agent

# 使用uv:
uv pip install -U mle-agent

从源码安装

  1. 克隆仓库
    git clone https://github.com/MLSysOps/MLE-agent.git
    cd MLE-agent
    
  2. 创建并激活虚拟环境
    uv venv .venv
    source .venv/bin/activate      # Linux/macOS
    
  3. 可编辑安装
    pip install -e .               # 或:pip install -e .
    

使用

mle new <项目名称>

当前路径下将创建一个项目目录,您需要在该项目目录中启动项目。

cd <项目名称>
mle start

您还可以在项目目录下的终端中启动交互式聊天:

mle chat

使用场景

🧪 构建机器学习基线原型

MLE代理可根据给定需求帮助您构建机器学习基线原型,并在本地机器上测试模型。需求可以比较模糊,例如“我想根据历史数据预测股价”。

cd <项目名称>
mle start

:bar_chart: 生成工作报告

MLE代理可以帮助您总结每周工作报告,包括开发进度、沟通记录、参考资料和待办事项清单。

模式1:基于GitHub的Web应用生成报告

cd <项目名称>
mle report

然后,您可以访问http://localhost:3000/来在本地生成报告。

模式2:基于本地Git仓库的CLI工具生成报告

cd <项目名称>
mle report-local --email=<git邮箱> --start-date=YYYY-MM-DD --end-date=YYYY-MM-DD <git仓库路径>
  • --start-date--end-date是可选参数。如果省略,命令将为默认的最近7天生成报告。
  • <git邮箱>替换为您的Git邮箱,<git仓库路径>替换为您本地Git仓库的路径。

:trophy: 参与Kaggle竞赛

MLE代理可以独立参与Kaggle竞赛,从数据准备到模型训练完成编码和调试。以下是开始Kaggle竞赛的基本命令:

cd <项目名称>
mle kaggle

或者,如果您已准备好数据集和提交文件,可以让代理在无人干预的情况下完成Kaggle任务:

cd <项目名称>
mle kaggle --auto \
--datasets "<数据集1路径>,<数据集2路径>,..." \
--description "<描述文件路径或文本>" \
--submission "<提交文件路径>" \
--sub_example "<示例提交文件路径>" \ 
--comp_id "<竞赛ID>"

请确保在运行命令前已加入该竞赛。更多详情,请参阅MLE-Agent教程

路线图

以下是我們計劃執行的任務清單,歡迎提出新的建議!

:hammer: 通用功能
  • 理解用戶需求,以創建端到端的人工智慧專案
  • 利用網路搜尋推薦當前最佳的資料科學解決方案
  • 在人機互動的情況下規劃機器學習工程任務
  • 在本地機器或雲端上執行代碼、調試並修復錯誤
  • 利用內建功能完成機器學習工程任務
  • 互動式聊天:一種人機協同模式,幫助改進現有的機器學習專案
  • Kaggle 模式:在無需人工干預的情況下完成 Kaggle 任務
  • 總結與反思整個機器學習/人工智慧流程
  • 雲端數據及測試調試平台的整合
  • 本地 RAG 支援,打造個人化的機器學習/人工智慧編程助手
  • 函數庫:生成 AI/ML 函數並保存以供未來使用
:star: 更多大語言模型與服務工具
  • Ollama LLama3
  • OpenAI GPTs
  • Anthropic Claude 3.5 Sonnet
:sparkling_heart: 更佳的使用者體驗
  • 命令列應用程式
  • 網頁介面
  • Discord
:jigsaw: 功能與整合
  • 本地檔案系統
  • 本地代碼執行器
  • Arxiv.org 搜尋
  • Papers with Code 搜尋
  • 一般關鍵字搜尋
  • Hugging Face
  • SkyPilot 雲端部署
  • Snowflake 數據
  • AWS S3 數據
  • Databricks 數據目錄
  • Wandb 實驗監控
  • MLflow 管理
  • DBT 數據轉換

參與貢獻

我們歡迎社群的參與與貢獻。我們正在尋求貢獻者協助我們完成以下任務:

  • 對代理進行基準測試與評估
  • 為代理新增更多功能
  • 改善文件說明
  • 寫測試用例

如果您有意貢獻,請查看 CONTRIBUTING.md 文件。

支援與社群

  • Discord 社群。如有任何問題,請在 Discord 社群中提問。

引用

@misc{zhang2024mleagent,
title = {MLE-Agent:您順暢進行人工智慧工程與研究的智能伴侶},
author = {Huaizheng Zhang*, Yizheng Huang*, Lei Zhang},
year = {2024},
note = {\url{https://github.com/MLSysOps/MLE-agent}},
}

授權條款

請參閱 MIT 授權條款 文件以獲取更多資訊。

版本历史

0.4.22024/10/12
0.4.02024/09/12
0.3.12024/08/12
0.3.02024/07/26
0.2.12024/07/11
0.1.42024/06/05
0.1.32024/06/04

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架