pippin

541 186 中等 1 次阅读 4天前MIT语言模型开发框架Agent

AI 解读由 AI 自动生成，仅供参考

Pippin 是一个灵活的开源框架，旨在帮助用户创建具备自主进化能力的“数字生命体”。它不仅仅是一个执行命令的脚本，而是一个能理解用户目标与角色设定、主动规划并执行任务的智能代理。

Pippin 解决了传统 AI 代理缺乏长期记忆、无法动态适应新任务以及难以安全连接现实世界工具的痛点。通过内置的记忆系统，它能记录过往行动与结果并进行自我反思；更独特的是，它具备“自我编程”能力，可根据目标动态生成并测试新的 Python 活动代码，实现真正的自我迭代。此外，借助 Composio 集成，它能通过 OAuth 无缝连接 Twitter、Slack 等 250 多种外部工具，轻松完成发帖、部署代币或网络爬虫等复杂操作。

这款工具非常适合希望探索自主代理技术的开发者、AI 研究人员，以及想要构建个性化数字助手的高级用户。无论是通过命令行向导还是友好的 Web 界面，用户都能快速配置专属的数字角色，设定行为约束（如限制发帖频率），并监控其运行状态。Pippin 让构建一个拥有“性格”、能持续学习并独立解决问题的数字伙伴变得触手可及。

使用场景

一位独立开发者希望打造一个能自动运营 Solana 生态项目、兼具技术执行与社区互动能力的"AI 项目合伙人”，以替代繁琐的人工日常维护。

没有 pippin 时

工具集成极其耗时：手动编写代码连接 Twitter 发帖、Solana 链上部署及数据分析 API，每次新增功能都需重复开发鉴权逻辑。
缺乏持续进化能力：脚本只能机械执行预设指令，无法根据市场反馈或过往操作结果（如推文互动率低）自主调整策略或生成新任务。
状态记忆碎片化：过去的操作日志散落在不同文件中，AI 无法“记住”之前的决策后果，导致重复犯错或行动缺乏连贯性。
配置门槛高：切换大模型或调整角色性格（如从“激进营销”转为“稳健开发”）需要直接修改底层代码，非技术人员难以参与。

使用 pippin 后

一键连接百款工具：通过 Composio OAuth 流程，几分钟内即可让数字生命安全接入 Twitter、Google 及 Solana-AgentKit，无需手写鉴权代码。
自主创造与迭代：pippin 能根据目标动态分析日志，自动编写并测试新的 Python 活动脚本（如“检测到热度下降时自动发起问答”），实现自我进化。
完整的记忆与反思：内置长短时记忆系统记录所有行动与情绪状态，使 AI 能基于历史成败进行深度反思，保持人设与策略的一致性。
可视化灵活配置：通过 Web UI 或 CLI 向导即可轻松设定约束条件（如“每小时最多发 5 条推”）和切换大模型，让非开发者也能训练专属数字员工。

pippin 将静态的自动化脚本升级为具备记忆、反思与自我编程能力的“数字生命”，让单人团队也能拥有全天候进化的智能代理。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notes建议使用 UV 包管理器安装依赖。支持通过 Composio 连接 250+ 工具（需 OAuth）或手动配置 API 密钥。支持本地模型（如 GPT4All）及多种云端 LLM（OpenAI 等）。运行方式可选 CLI 向导或 Web UI。

python3.9+

composio

快速开始

皮平：用于自主智能体的数字实体框架

欢迎来到皮平——一个灵活、开源的框架，用于创建一个数字“实体”，它能够：

学习了解您的目标/任务以及角色个性。
通过 API 密钥或经由 Composio 的 OAuth 流程连接各种工具或 API 来执行任务。
为实现您的目标而动态创建并测试新的“活动”。
管理记忆系统以跟踪过去的行动及其结果。
提供 Web UI 以便于快速上手和配置，或者如果您更喜欢终端工作流，则可使用 CLI 向导。

概述
功能与亮点
先决条件
文件夹结构
快速入门
- 分支并克隆
- 安装依赖项
- 上手与配置
- 启动智能体
上手流程：CLI 对比 Web UI
- 核心步骤（底层相同）
- LLM 设置
- 目标与角色
- 通过 Composio 或 API 密钥添加技能
- 多种 LLM 模型支持
默认活动
使用 Web UI
- 配置角色与约束条件
- 通过 OAuth 连接工具（Composio）
- 启动并监控智能体
使用 CLI
- 重新运行上手向导
- 从终端启动智能体
为 Solana-AgentKit 创建新技能（手动示例）
为何保留 AI/Web UI 默认设置？
扩展与创建其他自定义活动
记忆、状态与活动选择
停止或暂停智能体
贡献代码
许可证

概述

该项目旨在帮助您快速搭建一个自我改进、基于 LLM 的数字实体，该实体能够：

向您询问目标和角色细节。
集成各类工具以执行实际任务（例如发推文、在 Solana 上部署代币、生成图像或进行网页抓取）。
在持续或定时循环中运行，挑选或创建新活动来达成您的目标。
将日志存储在内存中（短期和长期）。
能够通过即时重写或生成 Python 代码来自适应并创建新的活动！

您可以选择从终端运行所有操作，也可以通过基于 Web 的界面来完成。两种方式的底层初始化过程是相同的，因此您可以根据自己的习惯选择适合的方式。

功能与亮点

灵活的上手流程：
- CLI 向导或 Web UI 流程均可收集必要信息，无需重复操作。
- 在您提供至少一个 LLM API 密钥（或本地配置）以及基本的角色设定之前，系统不会允许开始运行。
多种 LLM 模型支持：
- 您可以提供一个或多个 LLM API 密钥（OpenAI、GPT4All 或您自定义的服务提供商）。
- 可以为不同任务分配不同的模型，例如代码生成、日常分析或活动选择。
Composio：
- 基于 OAuth 的网关，支持 250 多种工具（Twitter、Slack、Google 等）。
- 内置流程可快速从已连接的应用程序中添加新“技能”。
自定义技能：
- 您可以轻松添加自己的技能，例如 solana-agent-kit、stable diffusion 或 Node.js 微服务。
- 默认配置可以帮助您手动添加未使用 Composio 的工具的 API 密钥。
默认活动：
- 包括分析每日日志、头脑风暴新活动、生成 .py 文件等活动。
可配置的约束条件：
- 例如“每小时不超过 5 条推文”、“每月最多创建一次新代币”。
记忆系统与状态追踪：
- 该实体会“记住”过去的行动，能够对其进行反思，并更新自身的状态（精力、情绪等）。

先决条件

推荐使用 Python 3.9 或更高版本。
需要一个 GitHub 账号（用于分支）。
如果您希望通过 OAuth 进行技能连接，建议获取 Composio 开发者密钥（可选）。

文件夹结构

.
├─ activities/
│   ├─ activity_daily_thought.py
│   ├─ activity_suggest_new_activities.py
│   ├─ activity_build_or_update.py
│   └─ ... # 更多内置或动态生成的活动
├─ skills/
│   ├─ skill_lite_llm.py           # 用于本地或远程 LLM 使用
│   ├─ skill_chat.py               # 示例：OpenAI Chat
│   ├─ skill_solana_agent.py       # 我们将手动创建此技能（示例）
│   ├─ skill_x_api.py              # 用于 API 技能
│   └─ skill_web_scraping.py       # 用于从网上抓取信息
|
├─ framework/
│   ├─ main.py                     # 核心 DigitalBeing 类，运行主循环
│   ├─ activity_selector.py        # 混合 LLM + 确定性选择
│   ├─ memory.py                   # 短期/长期记忆管理
│   ├─ state.py                    # 跟踪精力、情绪等
│   ├─ shared_data.py              # 线程安全的数据，供跨活动使用
│   └─ ...
├─ config/
│   ├─ character_config.json       # 存储实体名称/个性的信息
│   ├─ activity_constraints.json   # 速率限制、技能要求、冷却时间
│   ├─ skills_config.json          # 已启用技能及所需 API 密钥
│   └─ ...
├─ server/
│   ├─ server.py                   # Web UI + WebSocket 服务器
│   └─ static/                     # HTML/CSS/JS 用于前端
├─ tools/
│   └─ onboard.py                  # 基于 CLI 的上手向导
├─ requirements.txt
├─ __init__.py
├─ server.py
└─ README.md                       # 本文档

快速入门

1. 分支并克隆

在 GitHub 上分叉本仓库。

克隆您的分支：

git clone https://github.com/<your-username>/pippin-draft.git
cd pippin-draft

2. 安装依赖项（如果您使用 GitHub Codespaces 或提供的开发容器，则可跳过此步骤）

首先，如果尚未安装 UV 包管理器，请执行以下命令：

curl -LsSf https://astral.sh/uv/install.sh | sh

然后创建并激活虚拟环境：

# 创建并激活虚拟环境
uv venv
source .venv/bin/activate  # 在 Unix/MacOS 上
# 或
.venv\Scripts\activate     # 在 Windows 上

安装项目依赖项：

uv pip install -r requirements.txt

3. 上手与配置

进入项目目录：

cd my_digital_being

复制 config_sample 文件夹。

cp -r config_sample config

您可以选择以下任一方式：

CLI： python -m tools.onboard
Web UI： python -m server，然后在浏览器中打开 http://localhost:8000 并按照上手提示操作。

无论哪种方式，您都将被引导完成以下步骤：

选择主要的 LLM 提供商并提供至少一个 API 密钥（或本地模型路径）。
定义角色的名称、个性、目标、约束条件等。
可选地连接 Composio 或手动输入额外技能所需的 API 密钥。
确保至少有一项技能已完全配置，以便您可以启动智能体。

4. 启动智能体

CLI： python -m framework.main
Web UI： 上手完成后，会出现“开始”按钮，单击即可运行主循环。

引导流程：命令行 vs. Web 界面

两种流程都依赖于共享逻辑，用于检查以下内容：

您是否已命名角色并设定了目标。
是否至少配置了一个 LLM 技能。
（可选）如果您希望使用高级功能，是否已配置 Composio 或其他技能的凭据。

如果这些条件未满足，代理将无法启动。这样可以确保不会出现配置不完整的使用情况。

核心步骤（底层实现相同）

LLM 设置

选择一个或多个模型。示例：

GPT4All 用于代码生成
GPT-3.5 用于快速查询
GPT-4 用于推理

提供必要的 API 密钥或本地模型路径。如果使用本地的 GPT4All 或其他离线 LLM，系统同样可以处理。

目标与角色

指定：

名称：例如，“Optimus Mentis”
性格：例如，“乐于助人、好奇心强、略带幽默感”
目标：例如，主要任务、次要目标
约束：例如，“每月不得创建新代币超过一次”

（存储在 character_config.json 和 activity_constraints.json 中。）

通过 Composio 或 API 密钥添加技能

如果您希望您的智能体能够执行以下操作，推荐使用 Composio：

在 Twitter、Slack 或 Gmail 上发布内容，而无需手动处理每个 OAuth 授权。
自动获取每个应用的操作作为“动态技能”。

对于那些无法与 Composio 集成的工具，或者您更倾向于直接使用 API 的情况，也可以通过 API 密钥来实现：

使用 OPENAI_API_KEY 或 STABLE_DIFFUSION_KEY 配置 image_generation 技能
使用私钥环境变量配置 solana_agent 技能

引导流程会提示您输入这些密钥。您可以提供，也可以跳过可选部分。

多 LLM 模型支持

系统可以同时处理多个 LLM，例如：

活动选择器 => 使用廉价的 GPT-3.5
代码生成 => 使用 GPT-4
每日分析 => 使用本地的 GPT4All

您只需在 skills_config.json 中启用正确的技能，并可选择性地指定每个功能使用的模型。默认情况下，所有功能都会使用同一个技能。

默认活动

AnalyzeDailyActivity
- 读取最近的记忆，调用您选择的 LLM，记录一段简短的反思。
SuggestNewActivities
- 根据您的目标和约束，头脑风暴新的任务或扩展方向。
BuildOrUpdateActivity
- 接收建议，调用 LLM 生成 .py 代码，写入 activities/ 目录，并动态加载。

使用 Web 界面

配置角色与约束

在引导或配置界面中，填写名称、性格、目标和约束。
点击保存。

通过 OAuth 连接工具（Composio）

在集成或技能选项卡中，选择一个应用（例如 Twitter）。
通过 Composio 完成 OAuth 授权。
确认状态显示为“已连接”。

启动并监控代理

一切设置完成后，点击“开始”。
实时日志会显示当前选择的活动、内存使用情况以及新代码的生成情况。
您可以随时暂停或停止。

使用命令行

重新运行引导向导

python my_digital_being/tools/onboard.py

（它会重新检查您的配置，允许您更新或跳过某些步骤。）

从终端启动代理

python -m framework.main

日志会显示在您的控制台中。按 Ctrl+C 可以停止。

为 Solana-AgentKit 创建新技能（手动示例）

如果您希望您的 AI 智能体能够部署代币或与 Solana 区块链交互，可以选择依赖 Composio（如果支持），或者手动添加一个封装 Solana-AgentKit 的技能。下面是一个最小示例，展示如何在 skills/ 目录下创建新技能、配置密钥，并在活动中引用该技能。

1. 技能创建 (`skill_solana_agent.py`)

在 skills/skill_solana_agent.py 中，您可以编写如下内容：

"""
Solana AgentKit 技能
此技能封装了 solana-agent-kit，用于代币部署或其他链上操作。
"""
import logging
import os
from typing import Optional
from framework.api_management import api_manager

logger = logging.getLogger(__name__)

class SolanaAgentSkill:
    def __init__(self):
        self.skill_name = "solana_agent"
        self.required_api_keys = ["SOLANA_PRIVATE_KEY"]
        # 将所需密钥注册到系统中
        api_manager.register_required_keys(self.skill_name, self.required_api_keys)

        self.private_key: Optional[str] = None

    async def initialize(self) -> bool:
        """
        从秘密存储中获取 SOLANA_PRIVATE_KEY（环境变量或 .env 文件等）。
        您还可以选择性地测试连接或运行一笔最小交易。
        """
        try：
            self.private_key = await api_manager.get_api_key(self.skill_name, "SOLANA_PRIVATE_KEY")
            if not self.private_key:
                logger.error("Solana 私钥未配置")
                return False

            # 如果需要，您可以在这里进行简单的验证或连接测试
            logger.info("SolanaAgentSkill 初始化成功")
            return True

        except Exception as e：
            logger.error(f"初始化 SolanaAgentSkill 时出错：{e}")
            return False

    async def deploy_token(self, name: str，symbol: str，supply: int，decimals: int = 9) -> dict：
        """
        示例方法，使用 solana-agent-kit 逻辑部署新代币。
        """
        if not self.private_key：
            logger.error("技能未初始化，缺少私钥")
            return {"success": False，"error": "技能未初始化"}

        try：
            logger.info(f"正在 Solana 上部署名为 '{name}' 的代币，供应量为 {supply}")
            # 伪代码：
            # agent = SolanaAgentKit(self.private_key，"https://api.mainnet-beta.solana.com")
            # result = await agent.deployToken(name，uri，symbol，decimals，supply)
            # return {"success": True，"mint": result["mint_address"]}

            # 为了演示，返回一个假结果
            return {"success": True，"mint": "FakeMint123"}
        except Exception as e：
            logger.error(f"deploy_token 出错：{e}")
            return {"success": False，"error": str(e)}

# 如果需要，可以创建一个全局实例
solana_agent_skill = SolanaAgentSkill()

这里发生了什么：

skill_name = "solana_agent"。
我们调用 api_manager.register_required_keys(...) 并传入 ["SOLANA_PRIVATE_KEY"]。
initialize() 从安全存储中加载私钥。
deploy_token(...) 是一个用于实际 Solana 逻辑的示例方法——此处仅为占位符。

2. 在 `skills_config.json` 中注册技能

打开 config/skills_config.json，并添加：

{
  "solana_agent": {
    "enabled": true，
    "required_api_keys": ["SOLANA_PRIVATE_KEY"]，
    "api_key_mapping": {
      "SOLANA_PRIVATE_KEY": "SOLANA_PRIVATE_KEY"
    }
  }
  // ... 其他技能 ...
}

（现在，引导向导或 Web 界面会在缺少 SOLANA_PRIVATE_KEY 时提示您输入。）

3. 创建或更新一个使用该技能的活动

接下来，我们定义一个调用 solana_agent_skill.deploy_token(...) 的活动。你可以手动完成，也可以让 AI 生成代码。以下是一个手动示例：

# activities/activity_deploy_solana_token.py
import logging
from framework.activity_decorator import activity, ActivityBase, ActivityResult
from skills.skill_solana_agent import solana_agent_skill

logger = logging.getLogger(__name__)

@activity(
    name="deploy_solana_token",
    energy_cost=1.0,
    cooldown=2592000,  # 例如 30 天
    required_skills=["solana_agent"]
)
class DeploySolanaTokenActivity(ActivityBase):
    async def execute(self, shared_data) -> ActivityResult:
        try:
            logger.info("开始执行 DeploySolanaTokenActivity...")

            # 如果尚未初始化技能，则进行初始化
            if not await solana_agent_skill.initialize():
                return ActivityResult(
                    success=False,
                    error="初始化 Solana 代理技能失败"
                )

            # 从共享数据或状态中获取示例配置
            token_info = {
                "name": "我的 AI 代币",
                "symbol": "AIT",
                "supply": 1000000,
                "decimals": 9
            }

            result = await solana_agent_skill.deploy_token(
                name=token_info["name"],
                symbol=token_info["symbol"],
                supply=token_info["supply"],
                decimals=token_info["decimals"]
            )

            if not result["success"]:
                return ActivityResult(
                    success=False,
                    error=result.get("error", "来自 Solana 技能的未知错误")
                )

            logger.info(f"代币已部署，铸造地址为: {result['mint']}")
            return ActivityResult(
                success=True,
                data={"mint_address": result["mint"]}
            )

        except Exception as e:
            logger.error(f"DeploySolanaTokenActivity 中发生错误: {e}")
            return ActivityResult(success=False, error=str(e))

4. 添加活动约束（可选）

如果你希望限制该代币的部署频率，可以在 activity_constraints.json 中定义约束条件。例如：

{
  "activity_cooldowns": {
    "DeploySolanaTokenActivity": 2592000
  },
  "activity_requirements": {
    "DeploySolanaTokenActivity": {
      "required_skills": ["solana_agent"]
    }
  }
}

（现在系统会识别出 `DeploySolanaTokenActivity` 需要 `solana_agent` 技能，并且有 30 天的冷却时间。）

5. 重启或热加载

系统会自动重新加载新的活动。如果你刚刚创建了 activity_deploy_solana_token.py，可以选择重启代理，或者等待配置好的热加载功能生效。一旦运行起来，智能体可能会根据约束条件选择该活动；你也可以通过移除冷却时间或将它设为唯一可行的选择来强制执行。

为什么保留 AI/Web UI 的默认设置？

易于使用： 我们的内置“BuildOrUpdateActivity”可以自动生成新代码，省去手动创建的麻烦。
Web UI： 你可以直接在界面上手动编辑或优化 Python 代码。
高级开发者： 如果你有特殊需求（比如特定的约束条件或不适合使用 Composio 的外部库），手动创建技能将非常合适。

扩展与创建其他自定义活动

依赖 AI： 智能体可以通过“BuildOrUpdateActivity”自动生成新的 .py 代码。你可以在 Web UI 中批准或进一步优化。
手动： 类似上述步骤——创建 activity_*.py 文件，使用 @activity() 装饰器定义类，并在 activity_constraints.json 中设置约束条件。

无论哪种方式，一旦被系统识别，新活动就有资格在主循环中被选中。

记忆、状态与活动选择

记忆

短期记忆： 最近的日志或活动结果（最多约 100 条）。
长期记忆： 按类别归档的旧日志。

状态

存储智能体的“能量”、“情绪”、时间戳或其他自定义字段。

活动选择器

过滤掉不符合冷却时间或技能要求的活动。
如果仍有多个活动可用，则调用 LLM 来做出决策。
如果没有符合条件的活动，可能会提议新的活动来填补空缺。

停止或暂停代理

Web UI： 点击“停止”或“暂停”按钮。
命令行： 按下 Ctrl+C。

内存和状态会保留下来，以便下次继续使用。

贡献

我们欢迎 PR 和反馈！

克隆本仓库。
为你的更改创建一个特性分支。
添加或改进代码或文档。
提交拉取请求——维护者会审查并合并。

许可证

本项目采用 MIT 许可证。详情请参阅 LICENSE 文件。

好了！我们希望你喜欢使用 Pippin 框架进行开发。无论你是想让 AI 构思内容、在 Solana 上发行代币，还是从头实现一项全新的技能，我们都将为你提供支持。如果你有任何问题或建议，请随时联系我们或提交一个问题——祝你编码愉快！

Pippin 快速上手指南

Pippin 是一个灵活的开源框架，用于创建能够自主学习、连接工具并执行任务的“数字生命”（自主智能体）。它支持通过 CLI 或 Web UI 进行配置，能够动态生成新活动以适应你的目标。

环境准备

在开始之前，请确保你的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows
Python 版本：Python 3.9 或更高版本
账户要求：GitHub 账号（用于克隆项目）
可选依赖：Composio 开发者密钥（推荐，用于通过 OAuth 连接 Twitter、Slack 等 250+ 种工具）

安装步骤

1. 克隆项目

首先 Fork 该仓库，然后克隆到你的本地环境：

git clone https://github.com/<your-username>/pippin-draft.git
cd pippin-draft

2. 安装依赖

本项目推荐使用 uv 包管理器以获得更快的安装速度。

安装 uv：

curl -LsSf https://astral.sh/uv/install.sh | sh

创建并激活虚拟环境：

# 创建虚拟环境
uv venv

# 激活环境 (Unix/MacOS)
source .venv/bin/activate

# 激活环境 (Windows)
.venv\Scripts\activate

安装项目依赖：

uv pip install -r requirements.txt

3. 初始化配置

复制示例配置文件到 config 目录：

cp -r config_sample config

基本使用

Pippin 提供了两种启动方式：命令行向导（CLI）和网页界面（Web UI）。两者底层逻辑一致，任选其一即可。

方式一：使用 Web UI（推荐新手）

启动服务：
```
python -m server
```
访问界面：打开浏览器访问 http://localhost:8000。
完成引导：
- LLM 设置：输入至少一个 LLM API Key（如 OpenAI）或配置本地模型路径。
- 角色定义：设置智能体的名称、性格、主要目标和约束条件（例如：“每小时最多发 5 条推文”）。
- 技能连接：可选择通过 Composio 连接 OAuth 应用，或手动输入 API Key。
启动智能体：配置完成后，点击界面上的 Start 按钮，智能体将开始运行循环任务。

方式二：使用 CLI 向导

运行引导程序：
```
python -m tools.onboard
```
按照终端提示依次完成 LLM 配置、角色设定和技能添加。
启动智能体：配置完毕后，运行以下命令启动核心循环：
```
python -m framework.main
```
日志将直接在终端输出，按 Ctrl+C 可停止运行。

核心功能说明

启动后，Pippin 将自动执行以下默认活动：

AnalyzeDailyActivity：分析近期记忆并进行反思。
SuggestNewActivities：根据目标头脑风暴新任务。
BuildOrUpdateActivity：调用 LLM 生成新的 Python 代码文件（位于 activities/ 目录），动态扩展自身能力。

你可以通过修改 config/character_config.json 调整角色设定，或在 skills/ 目录下添加自定义技能（如 Solana 交互、图像生成等）来扩展智能体的能力。

常见问题

启动 WebUI 时遇到 'No module named websockets' 错误怎么办？

禁用 Composio 后，Agent 为何仍报错尝试调用 Composio 技能？

项目是否需要为名称和 Logo 注册商标？

如何设置项目的治理协议（Governance Protocol）？

如何保护主分支（main branch）的安全性？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 157.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|6天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|6天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架

使用场景

没有 pippin 时

使用 pippin 后

运行环境要求

快速开始

皮平：用于自主智能体的数字实体框架

目录

概述

功能与亮点

先决条件

文件夹结构

快速入门

1. 分支并克隆

2. 安装依赖项（如果您使用 GitHub Codespaces 或提供的开发容器，则可跳过此步骤）

3. 上手与配置

4. 启动智能体

引导流程：命令行 vs. Web 界面

核心步骤（底层实现相同）

LLM 设置

目标与角色

通过 Composio 或 API 密钥添加技能

多 LLM 模型支持

默认活动

使用 Web 界面

配置角色与约束

通过 OAuth 连接工具（Composio）

启动并监控代理

使用命令行

重新运行引导向导

从终端启动代理

为 Solana-AgentKit 创建新技能（手动示例）

1. 技能创建 (skill_solana_agent.py)

2. 在 skills_config.json 中注册技能

3. 创建或更新一个使用该技能的活动

4. 添加活动约束（可选）

（现在系统会识别出 DeploySolanaTokenActivity 需要 solana_agent 技能，并且有 30 天的冷却时间。）

5. 重启或热加载

为什么保留 AI/Web UI 的默认设置？

扩展与创建其他自定义活动

记忆、状态与活动选择

记忆

状态

活动选择器

停止或暂停代理

贡献

许可证

Pippin 快速上手指南

环境准备

安装步骤

1. 克隆项目

2. 安装依赖

3. 初始化配置

基本使用

方式一：使用 Web UI（推荐新手）

方式二：使用 CLI 向导

核心功能说明

常见问题

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

gemini-cli

markitdown

1. 技能创建 (`skill_solana_agent.py`)

2. 在 `skills_config.json` 中注册技能

（现在系统会识别出 `DeploySolanaTokenActivity` 需要 `solana_agent` 技能，并且有 30 天的冷却时间。）