Memori

13.3k 1.7k 简单 1 次阅读今天NOASSERTION开发框架Agent图像语言模型

AI 解读由 AI 自动生成，仅供参考

Memori 是一款专为 AI 智能体（Agent）打造的记忆基础设施，旨在让智能体不仅“记得”对话内容，更能从实际执行动作中汲取经验。它解决了当前大模型应用普遍存在的“健忘”痛点：在传统的无状态交互中，智能体难以跨会话保留用户偏好或任务进度，导致每次交流都需重新建立上下文。

通过引入原生于智能体的记忆层，Memori 能将分散的对话和执行过程转化为结构化、可持久化的状态数据。其核心技术亮点在于高度的兼容性与灵活性：采用 SQL 原生架构以确保数据查询的高效与规范，同时保持对大模型（LLM）、数据存储方案及开发框架的完全无关性（Agnostic）。这意味着开发者无需重构现有系统架构，即可通过简单的 SDK 集成（支持 Python 和 TypeScript），让智能体自动在后台完成记忆的存储与召回。例如，当用户告知偏好后，智能体能在后续互动中自然调用该信息，无需重复询问。

这款工具主要面向正在构建生产级 AI 应用的软件开发者和工程团队。对于那些希望提升智能体长期交互能力、实现个性化服务，且不愿被特定模型厂商锁定的技术人士来说，Memori 提供了一个零配置、高性能的解决方案，帮助轻松打造具备持续学习能力的智能系统。

使用场景

某电商团队正在开发一款基于 LLM 的个性化购物助手，需要让 AI 记住用户的历史偏好、浏览记录和过往对话，以提供连贯的推荐服务。

没有 Memori 时

记忆碎片化：开发者需手动编写代码将聊天记录存入数据库，并在每次请求时重新组装上下文，逻辑复杂且容易出错。
状态丢失严重：一旦会话中断或跨越多个请求周期，AI 便“失忆”，无法识别用户之前提到的喜好（如“只买蓝色商品”），导致推荐不精准。
架构耦合度高：记忆逻辑硬编码在业务代码中，更换大模型或调整存储方案时需重构大量代码，维护成本极高。
开发效率低下：团队花费大量时间构建和维护记忆基础设施，而非优化核心的购物推荐算法。

使用 Memori 后

自动持久化状态：Memori 自动拦截 AI 交互，将用户的偏好和行为转化为结构化数据存入底层存储，无需手动管理数据库写入。
无缝上下文召回：当用户再次询问“有什么推荐的？”时，Memori 自动在后台注入“喜欢蓝色”等历史状态，AI 能立即给出精准回答。
架构解耦灵活：作为独立的基础设施层，Memori 与具体的大模型和数据库无关，团队可自由切换技术栈而无需修改业务逻辑。
聚焦核心业务：开发者仅需几行代码集成 SDK，即可拥有生产级的记忆能力，将精力集中在提升购物体验上。

Memori 将原本繁琐的记忆工程转化为透明的基础设施，让 AI 代理真正具备从“行为”中学习并长期记忆的能力。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该工具主要作为客户端 SDK 或插件运行，依赖云端服务（Memori Cloud）或用户自有的数据库（BYODB），而非本地部署重型模型。因此 README 中未提及具体的操作系统、GPU、内存或 Python 版本限制。使用时需配置 MEMORI_API_KEY 环境变量，并支持 OpenAI、Anthropic、Bedrock 等多种 LLM 提供商。可通过 CLI (python -m memori) 进行管理，建议参考官方文档获取特定集成环境（如 OpenClaw, MCP）的详细要求。

python未说明

@memorilabs/memori (TypeScript SDK)

memori (Python SDK)

openai

快速开始

记忆来自代理的行为，而不仅仅是他们的言语。

Memori 可以无缝接入您现有的软件和基础设施。它与大语言模型、数据存储和框架无关，能够平滑地融入您已有的架构设计中。

→ Memori Cloud — 无需配置。获取一个 API 密钥，几分钟内即可开始构建。

选择高效的记忆系统

开始使用

安装

TypeScript SDK

npm install @memorilabs/memori

Python SDK

pip install memori

快速入门

在 app.memorilabs.ai 注册，获取 Memori API 密钥，然后开始构建。完整文档：memorilabs.ai/docs/memori-cloud/。

设置 MEMORI_API_KEY 和您的 LLM API 密钥（例如 OPENAI_API_KEY），然后：

TypeScript SDK

import { OpenAI } from 'openai';
import { Memori } from '@memorilabs/memori';

// 需要环境变量中设置 MEMORI_API_KEY 和 OPENAI_API_KEY
const client = new OpenAI();
const mem = new Memori().llm
  .register(client)
  .attribution('user_123', 'support_agent');

async function main() {
  await client.chat.completions.create({
    model: 'gpt-4o-mini',
    messages: [{ role: 'user', content: '我的最喜欢的颜色是蓝色。' }],
  });
  // 对话会自动在后台持久化并被召回。

  const response = await client.chat.completions.create({
    model: 'gpt-4o-mini',
    messages: [{ role: 'user', content: "我最喜欢的颜色是什么？" }],
  });
  // Memori 会回忆起您最喜欢的颜色是蓝色。
}

Python SDK

from memori import Memori
from openai import OpenAI

# 需要环境变量中设置 MEMORI_API_KEY 和 OPENAI_API_KEY
client = OpenAI()
mem = Memori().llm.register(client)

mem.attribution(entity_id="user_123", process_id="support_agent")

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "我的最喜欢的颜色是蓝色。"}]
)
# 对话会自动持久化并被召回。

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "我最喜欢的颜色是什么？"}]
)
# Memori 会回忆起您最喜欢的颜色是蓝色。

探索记忆

使用仪表板 — 记忆、分析、游乐场和 API 密钥。

[!TIP] 想使用您自己的数据库吗？请查看 Memori BYODB 的文档： https://memorilabs.ai/docs/memori-byodb/。

LoCoMo 基准测试

Memori 在 LoCoMo 长对话记忆基准测试中表现出色，整体准确率达到 81.95%，同时每次查询平均仅使用 1,294 个 token。这仅占完整上下文的 4.97%，表明结构化记忆可以在不将大量提示注入每个请求的情况下，保持推理质量。

与其他基于检索的记忆系统相比，Memori 的表现优于 Zep、LangMem 和 Mem0，同时将提示大小减少了约 67% 相对于 Zep，并将上下文成本降低了超过 20 倍相对于全上下文提示。

阅读基准测试概述，查看测试结果，或下载论文。

OpenClaw（为您的网关提供持久化记忆）

默认情况下，OpenClaw 代理会在会话之间忘记所有内容。Memori 插件可以解决这一问题。它会在每次对话结束后捕获持久的事实和偏好，并自动将最相关的上下文注入到未来的提示中。

无需更改您的代理代码或提示。该插件会挂钩到 OpenClaw 的生命周期，因此您只需通过一个即插即用的插件，就能获得结构化记忆、智能召回和高级增强功能。

openclaw plugins install @memorilabs/openclaw-memori
openclaw plugins enable openclaw-memori

openclaw config set plugins.entries.openclaw-memori.config.apiKey "YOUR_MEMORI_API_KEY"
openclaw config set plugins.entries.openclaw-memori.config.entityId "your-app-user-id"

openclaw gateway restart

有关设置和配置，请参阅 OpenClaw 快速入门。有关架构和生命周期的详细信息，请参阅 OpenClaw 概述。

MCP（一条命令连接你的代理）

你的代理在会话之间会忘记所有内容。Memori 解决了这个问题。它会记住你的代码栈、编码规范以及你喜欢的工作方式，这样你就不再需要重复同样的操作。

适用于个人开发者和团队。随着时间的推移，你的代理会学习编码模式、代码审查者的偏好以及项目规范。对于团队而言，这意味着新入职的工程师可以在第一天就快速掌握共享上下文，而无需花费数月时间去吸收那些“部落知识”。

如果你使用 Claude Code、Cursor、Codex、Warp 或 Antigravity，无需任何 SDK 集成即可连接 Memori：

claude mcp add --transport http memori https://api.memorilabs.ai/mcp/ \
  --header "X-Memori-API-Key: ${MEMORI_API_KEY}" \
  --header "X-Memori-Entity-Id: your_username" \
  --header "X-Memori-Process-Id: claude-code"

对于 Cursor、Codex、Warp 等客户端，请参阅 MCP 客户端设置指南。

归因

为了充分发挥 Memori 的作用，你需要为你的 LLM 交互指定一个实体（例如用户）和一个流程（例如你的代理、LLM 交互或程序）。

如果不提供任何归因信息，Memori 就无法为你创建记忆。

TypeScript SDK

mem.attribution("12345", "my-ai-bot");

Python SDK

mem.attribution(entity_id="12345", process_id="my-ai-bot")

会话管理

Memori 使用会话来将你的 LLM 交互分组在一起。例如，如果你有一个执行多个步骤的代理，你希望这些步骤被记录在一个会话中。

默认情况下，Memori 会自动为你设置会话，但你也可以通过以下命令开始一个新的会话或覆盖当前会话：

TypeScript SDK

mem.resetSession();
// 或
mem.setSession(sessionId);

Python SDK

mem.new_session()
# 或
mem.set_session(session_id)

支持的 LLM

Anthropic
Bedrock
DeepSeek
Gemini
Grok (xAI)
OpenAI（Chat Completions & Responses API）

（非流式、流式、同步和异步）

支持的框架

Agno
LangChain
Pydantic AI

支持的平台

DeepSeek
Nebius AI Studio

示例

更多示例和演示，请查看 Memori Cookbook。

Memori 高级增强

记忆会在多个不同层次上被跟踪：

实体：例如用户、地点或事物。
流程：例如你的代理、LLM 交互或程序。
会话：实体、流程与 LLM 之间的当前交互。

Memori 的高级增强功能会在每个层次上通过以下内容增强记忆：

属性
事件
事实
人物
偏好
关系
规则
技能

Memori 能够识别你的用户是谁、你的代理负责哪些任务，并在这两者之间建立无与伦比的上下文。增强过程在后台进行，不会引入任何延迟。

默认情况下，Memori 高级增强功能无需账户即可使用，但存在速率限制。当你需要更高的限制时，可以注册 Memori 高级增强功能或使用 Memori CLI：

# 通过 pip 安装 CLI 来管理你的账户
python -m memori sign-up <email_address>

Memori 高级增强功能对开发者始终免费！

获取 API 密钥后，设置以下环境变量（Python 和 TypeScript SDK 均可使用）：

export MEMORI_API_KEY=[api_key]

管理你的配额

你可以随时使用 Memori CLI 检查你的配额（适用于所有 SDK）：

python -m memori quota

或者登录 https://app.memorilabs.ai/ 查看你的账户。如果你已达到 IP 地址配额上限，请注册并获取 API 密钥以提高限制。

如果你的 API 密钥超过其配额限制，我们会通过电子邮件通知你。

命令行界面（CLI）

Memori CLI 是用于跨所有 SDK 管理账户、密钥和配额的统一工具。要使用它，请在命令行中执行以下命令：

# 需要安装 Python
python -m memori

这将显示可用选项菜单。有关 Memori CLI 的更多信息，请参阅命令行界面。

贡献

我们欢迎社区的贡献！请参阅我们的贡献指南，了解以下内容：

设置开发环境
代码风格和标准
提交拉取请求
报告问题

支持

许可证

Apache 2.0 - 详见 LICENSE

Memori 快速上手指南

Memori 是一个专为 AI Agent 设计的记忆层工具。它能从 Agent 的实际行为中提取记忆，而不仅仅是记录对话内容。Memori 与现有的 LLM、数据存储和框架无关，可无缝集成到你已有的架构中，实现上下文的自动持久化与智能召回。

环境准备

在开始之前，请确保满足以下条件：

运行环境：支持 Node.js (TypeScript) 或 Python 3.8+ 环境。
API 密钥：
1. 访问 Memori Cloud 注册账号。
2. 获取 MEMORI_API_KEY。
3. 准备好你的 LLM 提供商 API Key（例如 OPENAI_API_KEY）。

环境变量：建议在终端或 .env 文件中配置以下变量：

export MEMORI_API_KEY="your_memori_api_key"
export OPENAI_API_KEY="your_openai_api_key"

安装步骤

根据你的开发语言选择对应的 SDK 进行安装。

TypeScript / Node.js

npm install @memorilabs/memori

Python

pip install memori

提示：国内开发者若下载缓慢，可使用清华源或阿里源加速： pip install -i https://pypi.tuna.tsinghua.edu.cn/simple memori

基本使用

Memori 的核心逻辑是：注册 LLM 客户端 -> 设定归属（用户与进程） -> 正常调用 LLM。一旦配置完成，Memori 会在后台自动持久化对话并召回相关记忆，无需修改原有的 Prompt 结构。

TypeScript 示例

import { OpenAI } from 'openai';
import { Memori } from '@memorilabs/memori';

// 初始化 OpenAI 客户端
const client = new OpenAI();

// 注册 Memori 并设定归属：实体 ID (用户) 和 进程 ID (Agent 名称)
const mem = new Memori().llm
  .register(client)
  .attribution('user_123', 'support_agent');

async function main() {
  // 第一次对话：告诉 Agent 你的喜好
  await client.chat.completions.create({
    model: 'gpt-4o-mini',
    messages: [{ role: 'user', content: 'My favorite color is blue.' }],
  });
  // 此时记忆已自动保存

  // 第二次对话：询问之前的喜好
  const response = await client.chat.completions.create({
    model: 'gpt-4o-mini',
    messages: [{ role: 'user', content: "What's my favorite color?" }],
  });
  
  // Memori 会自动在后台注入上下文，Agent 将回答 "blue"
  console.log(response.choices[0].message.content);
}

main();

Python 示例

from memori import Memori
from openai import OpenAI

# 初始化 OpenAI 客户端
client = OpenAI()

# 注册 Memori 并设定归属
mem = Memori().llm.register(client)
mem.attribution(entity_id="user_123", process_id="support_agent")

# 第一次对话：告诉 Agent 你的喜好
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "My favorite color is blue."}]
)
# 此时记忆已自动保存

# 第二次对话：询问之前的喜好
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "What's my favorite color?"}]
)

# Memori 会自动在后台注入上下文，Agent 将回答 "blue"
print(response.choices[0].message.content)

关键概念说明

Attribution (归属)：必须指定 entity_id（如用户 ID）和 process_id（如 Agent 名称），否则 Memori 无法存储记忆。
Session (会话)：默认情况下 Memori 自动管理会话。如需手动控制（例如将多步操作合并为一个会话），可使用 mem.new_session() (Python) 或 mem.resetSession() (TS)。
无感集成：你不需要改变调用 LLM 的代码方式，记忆增强过程在后台异步完成，不会增加请求延迟。

更多高级功能（如自定义数据库 BYODB、OpenClaw 插件集成或 MCP 协议连接）请参考官方文档。

版本历史

v3.2.72026/04/06

v3.2.62026/04/06

v3.2.52026/04/06

v3.2.42026/03/25

v3.2.32026/03/10

v3.2.22026/03/10

v3.2.12026/02/25

v3.2.02026/02/23

v3.1.62026/01/28

v3.1.52026/01/21

v3.1.42026/01/21

v3.1.32026/01/05

v3.1.22025/12/17

v3.1.12025/12/12

v3.1.02025/12/09

v3.0.62025/12/04

v3.0.52025/12/03

v3.0.42025/12/03

v3.0.32025/12/03

v3.0.22025/12/02

常见问题

遇到 OpenAI 返回 'metadata' 类型错误（期望对象却收到数组）怎么办？

Memori 是否支持多用户隔离？为什么不同用户的数据会混在一起？

使用流式响应（stream=True）时，对话内容为什么没有自动保存到数据库？

如何让 Memori 连接本地的 OpenAI 兼容接口（如 llama.cpp, koboldcpp）？

重试装饰器（Retry Decorator）在所有尝试失败后没有抛出原始异常怎么办？

当前的 Issue 报告的是 v2 版本的 Bug，还需要修复吗？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 153.6k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|3天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|4天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架