loki-mode

GitHub
827 169 简单 1 次阅读 今天NOASSERTIONAgent
AI 解读 由 AI 自动生成,仅供参考

Loki Mode 是一款强大的多智能体自主开发框架,旨在将产品需求文档(PRD)直接转化为生产级别的可运行代码。它解决了传统 AI 编程工具往往只能生成代码片段、缺乏完整工程化能力以及需要人工频繁干预的痛点,让用户只需描述需求,即可自动获得包含源代码、测试用例、配置文件及审计日志的完整 Git 仓库。

这款工具特别适合希望快速构建原型的全栈开发者、需要验证技术方案的初创团队,以及追求高效交付的内部研发部门。其核心亮点在于高度自治的协作机制:系统能根据任务复杂度,从 41 种专用智能体中动态组建团队,并通过“推理 - 行动 - 反思 - 验证”(RARV)循环自主执行开发任务。为确保代码质量,Loki Mode 内置了 9 道质量关卡和盲审机制,有效避免 AI 的盲目附和,确保输出经得起考验。此外,它支持包括 Claude、Gemini 在内的五大主流 AI 提供商并具备自动故障转移能力,同时完全支持本地私有化部署,保障数据安全不流出内网。无论是简单的落地页还是复杂的微服务架构,Loki Mode 都能作为高效的加速引擎,助力用户更快地构建未来。

使用场景

某初创团队的技术负责人需要在周末前快速验证一个带有用户认证和数据分析功能的 SaaS 仪表盘原型,以应对下周的投资人演示。

没有 loki-mode 时

  • 人力协调困难:需要临时召集前端、后端和测试人员加班,沟通需求文档(PRD)耗时耗力,难以在短期内凑齐人手。
  • 质量参差不齐:赶工代码往往缺乏单元测试和严格的代码审查,导致演示时频繁出现崩溃或数据展示错误。
  • 基础设施缺失:手动配置 Docker 容器、CI/CD 流水线和安全策略容易遗漏,部署过程繁琐且易出错。
  • 迭代周期漫长:从需求到可运行代码通常需要数天,无法实现“当天想法,当天验证”的快速闭环。

使用 loki-mode 后

  • 自主组建特工队:只需输入一份 PRD 文档,loki-mode 自动从 41 种专业代理中组建团队,无需人工协调即可并行开发。
  • 内建生产级质量:系统自动执行 9 道质量网关和盲审机制,生成的代码包含完整的单元测试,确保演示过程稳定可靠。
  • 全栈交付就绪:直接输出包含源码、测试用例、Docker 配置及审计日志的完整 Git 仓库,一键即可部署运行。
  • 极速 автоном构建:原本需要数天的工作压缩至 25 分钟左右,负责人离开片刻回来即可获得可工作的生产级代码。

loki-mode 将原本依赖多人协作数天的开发流程,转化为单人指令驱动的分钟级自主交付,真正实现了“描述即所得”的生产力飞跃。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

未说明

依赖
notes该工具主要通过 npm 全局安装,核心运行依赖于外部 AI 提供商的 CLI 工具(如 Claude Code, Codex, Gemini CLI 等)。支持 Docker 部署和 Homebrew 安装。无需本地 GPU 即可运行,因为计算任务由连接的 AI 提供商处理。企业级功能(如 TLS, SSO)需通过环境变量激活。
python未说明 (主要基于 Node.js/npm 环境)
Node.js/npm
@anthropic-ai/claude-code
@openai/codex
@google/gemini-cli
@anthropic-ai/cline
aider-chat
loki-mode hero image

快速开始

洛基模式

更快地构建未来。

描述你的需求,获取生产就绪的代码。

npm version npm downloads GitHub stars Docker Pulls License

官网 | 文档 | 安装 | 变更日志 | Purple Lab Web UI


工作原理: 你提供一份产品需求文档(PRD)。洛基模式会根据复杂度进行分类,从8个集群中的41种专业类型中组建一个代理团队,并运行具有9道质量关卡的自主RARV循环(推理 - 行动 - 反思 - 验证)。只有通过自动化验证后,代码才算“完成”。最终输出是一个包含源代码、测试、配置文件和审计日志的Git仓库。


为什么选择洛基模式?

  • 真正自主 -- 描述你的需求,然后离开,回来时就能看到带有测试的可运行代码
  • 内置生产级质量 -- 9道质量关卡、盲选三审代码评审、反溜须拍马检查
  • 自托管且私密 -- 你的密钥、你的基础设施,数据不会离开你的网络
  • 5家AI供应商 -- Claude、Codex、Gemini、Cline、Aider,支持自动故障转移
  • 全栈输出 -- 源代码、测试、Docker配置、CI/CD流水线、审计日志
  • 开源 -- 个人、内部及学术用途免费。无厂商锁定。

30秒快速上手

npm install -g loki-mode
loki doctor                        # 检查环境
loki init my-app --template simple-todo-app
cd my-app
loki start prd.md                  # 自主构建开始

或者跳过脚手架直接进行快速任务:

loki quick "构建一个带有注册表单的着陆页"
其他安装方式
方法 命令
Homebrew brew tap asklokesh/tap && brew install loki-mode
Docker docker pull asklokesh/loki-mode
在Claude Code中 claude --dangerously-skip-permissions 然后输入“Loki Mode”
Git克隆 git clone https://github.com/asklokesh/loki-mode.git

完整安装指南请参阅安装指南


你可以构建什么

项目 构建时间 复杂度
带有注册表单的着陆页 ~10分钟 简单
带JWT认证的REST API ~20分钟 简单
带动画效果的投资组合 ~15分钟 简单
带分析功能的SaaS仪表板 ~25分钟 标准
带Stripe支付的电商商店 ~45分钟 标准
带看板的任务管理器 ~25分钟 标准
带WebSocket的聊天应用 ~30分钟 标准
带MDX的博客平台 ~30分钟 标准
微服务架构 ~2小时 复杂
带监控的机器学习流水线 ~3小时 复杂

你会得到什么

简单 标准 复杂
示例 着陆页、待办事项应用、单个API CRUD + 认证、REST API + React 微服务、实时系统、机器学习流水线
时长 5-30分钟 30-90分钟 2小时以上
自主性 独立完成 复杂部分可能需要指导 可作为加速器使用,辅以人工审核

架构

洛基模式架构

RARV循环

每一轮迭代:推理(读取状态) - 行动(执行、提交) - 反思(更新上下文) - 验证(运行测试、检查规范)。失败会触发自我修正。

核心流程

41种代理类型

8个集群:工程、运维、业务、数据、产品、增长、评审、编排。根据PRD的复杂度自动组合。

代理类型

9道质量关卡

盲审、反溜须拍马、严重性阻断、模拟/突变检测。所有关卡通过后代码才会交付。

质量关卡

内存系统

三层架构:情景记忆(交互轨迹)、语义记忆(通用模式)、程序性记忆(习得技能)。可选向量搜索。

内存架构

控制台

实时监控、代理状态、任务队列、WebSocket流媒体。默认在localhost:57374启动。

控制台指南

企业级层

TLS、OIDC/SSO、RBAC、OTEL追踪、策略引擎、审计轨迹。通过环境变量激活。

企业级指南


Purple Lab

托管开发平台。类似Replit的Web界面,用于可视化PRD到代码的工作流,并配备AI聊天功能,支持迭代式开发。

loki web                           # 在http://localhost:57375启动

平台页面

  • 首页 -- 一行提示,立即开始构建
  • 项目 -- 浏览、搜索、筛选过往构建
  • 模板 -- 20多种按类别划分的入门PRD
  • 展示 -- 示例项目的画廊,可供参考构建
  • 对比 -- 功能对比竞争对手

IDE工作区

  • Monaco编辑器,支持标签页和Cmd+P快速打开
  • AI聊天面板,用于迭代开发
  • 活动面板:构建日志、代理、质量关卡
  • 实时预览,带URL栏导航
  • 右键上下文菜单:评审、测试、解释

洛基模式与替代方案对比

特性 洛基模式 bolt.new Replit Lovable
自托管 / 你的密钥
5家AI供应商故障转移
9道质量关卡
盲审代码
企业级认证(SSO/RBAC)
空气隔离部署
Docker + CI/CD生成
开源
免费层级 开源

洛基模式是唯一一个完全自托管、开源,并包含自动化质量验证的平台。你的代码、你的密钥、你的基础设施。


多提供商支持

提供商 自主标志 并行代理 安装
Claude Code --dangerously-skip-permissions 是(10+) npm i -g @anthropic-ai/claude-code
Codex CLI --full-auto 顺序执行 npm i -g @openai/codex
Gemini CLI --approval-mode=yolo 顺序执行 npm i -g @google/gemini-cli
Cline CLI --auto-approve 顺序执行 npm i -g @anthropic-ai/cline
Aider --yes-always 顺序执行 pip install aider-chat

Claude 提供完整功能(子代理、并行化、MCP、任务工具)。其他提供商按顺序运行。自动故障转移会在被限流时切换提供商。请参阅提供商指南


CLI 参考

所有命令
命令 描述
loki start [PRD] 可选 PRD 文件启动
loki stop 停止执行
loki pause / resume 暂停/恢复当前会话后继续
loki status 显示当前状态
loki dashboard 打开网页仪表盘
loki web 启动 Purple Lab 网页界面
loki doctor 检查环境和依赖项
loki plan [PRD] 执行前分析:复杂性、成本、迭代次数
loki review [--staged|--diff] AI 驱动的代码审查,带严重性过滤
loki test [--file|--dir|--changed] AI 测试生成(8 种语言,9 种框架)
loki onboard [path] 项目分析及 CLAUDE.md 生成
loki import 导入 GitHub 问题为任务
loki ci CI/CD 质量门集成
loki failover 跨提供商自动故障转移管理
loki memory <cmd> 内存系统:索引、时间线、搜索、整合
loki enterprise 企业级功能管理
loki version 显示版本号

运行 loki --help 查看所有选项。完整参考:CLI 参考 | 配置:config.example.yaml


BMAD 方法集成

Loki Mode 与 BMAD 方法 集成,这是一种结构化的 AI 驱动敏捷方法论。如果您的项目使用 BMAD 进行需求获取,Loki Mode 可以直接消费这些工件:

loki start --bmad-project ./my-project

适配器会处理 BMAD 的 frontmatter 规范、FR 格式的功能需求、Given/When/Then 接受标准以及工件链验证。非 BMAD 项目不受影响——该集成通过 --bmad-project 选项选择性启用。

请参阅 BMAD 集成验证

企业级功能

企业级功能已包含,但需要通过环境变量激活。自我审计:45 项能力中有 35 项正常工作,无损坏,1,314 个测试通过。

export LOKI_TLS_ENABLED=true
export LOKI_OIDC_PROVIDER=google
export LOKI_AUDIT_ENABLED=true
loki enterprise status

企业架构 | 安全 | 身份验证 | 授权 | 指标 | 审计日志

基准测试

来自内置测试套件的自报结果。附有可重复验证的脚本。

基准 结果 备注
HumanEval 162/164 (98.78%) 最多重试 3 次,RARV 自我验证
SWE-bench 299/300 补丁 补丁生成——尚未运行评估程序

有关方法论,请参阅 benchmarks/

演示文稿

Loki Mode 演示文稿

9 张幻灯片:问题、解决方案、41 个代理、RARV 循环、基准测试、多提供商、全生命周期

下载 PPTX


局限性

领域 已实现的功能 尚未实现的功能
代码生成 从 PRD 生成全栈应用 复杂的领域逻辑可能仍需人工审核
部署 生成配置文件、Dockerfile 和 CI/CD 流程 不负责实际部署——需人工执行部署命令
测试 9 个自动化质量门 测试质量取决于 AI 的断言
提供商 支持 5 家提供商及自动故障转移 非 Claude 提供商缺乏并行代理
仪表盘 实时单机监控 尚不支持多节点集群

“自主”的含义: 系统无需提示即可运行 RARV 循环。它不会访问您的云账户、支付系统或外部服务,除非您提供凭据。部署、API 密钥和关键决策仍需人工监督。


研究基础

论文和资料来源
来源 我们使用的内容
Anthropic: 构建高效智能体 评估者-优化器、并行化
Anthropic: 宪法式 AI 基于质量原则的自我批判
DeepMind: 基于辩论的可扩展监督 议会评审中的辩论式验证
DeepMind: SIMA 2 自我改进循环设计
OpenAI: Agents SDK 安全护栏、触发机制、追踪
NVIDIA ToolOrchestra 效率指标、奖励信号
CONSENSAGENT (ACL 2025) 盲审中的反溜须拍马
GoalAct 复杂 PRD 的层次规划

从业者见解: Boris Cherny、Simon Willison、HN 社区

完整致谢——50 多篇论文和资源


贡献

git clone https://github.com/asklokesh/loki-mode.git && cd loki-mode
npm install && npm test              # 683 个测试
python3 -m pytest                    # 631 个测试

请参阅 CONTRIBUTING.md 获取贡献指南。

许可证

商业源码许可证 1.1——个人、内部、学术及非商业用途免费。2030 年 3 月 19 日将转换为 Apache 2.0。商业许可请联系 founder@autonomi.dev


版本历史

v6.75.32026/04/06
v6.75.22026/04/06
v6.75.12026/04/06
v6.75.02026/04/06
v6.74.62026/03/25
v6.74.52026/03/25
v6.74.42026/03/25
v6.74.32026/03/24
v6.74.22026/03/24
v6.74.12026/03/24
v6.74.02026/03/24
v6.73.12026/03/24
v6.73.02026/03/24
v6.72.02026/03/24
v6.71.12026/03/24
v6.71.02026/03/24
v6.70.02026/03/24
v6.69.22026/03/24
v6.69.12026/03/24
v6.69.02026/03/24

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|4天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|5天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

149.5k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|今天
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|昨天
插件Agent图像

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|4天前
语言模型图像Agent