repeng

712 62 简单 1 次阅读昨天MIT语言模型开发框架

AI 解读由 AI 自动生成，仅供参考

repeng 是一个基于 Python 开发的开源库，旨在利用“表示工程”（Representation Engineering）技术为大语言模型生成控制向量。它核心解决了如何在不重新训练模型的前提下，快速、精准地引导模型输出特定风格或行为模式的问题。例如，用户可以轻松让模型在“极度清醒”与“迷幻亢奋”等不同人格状态间自由切换，而无需修改模型权重。

这款工具特别适合 AI 研究人员、开发者以及对大模型内部机制感兴趣的技术爱好者使用。其最大的技术亮点在于极高的效率：训练一个自定义控制向量通常只需不到一分钟。此外，repeng 具备良好的兼容性，支持将训练好的向量导出为 GGUF 格式，从而能在 llama.cpp 等量化推理框架中直接应用，极大地降低了部署门槛。虽然目前暂不支持混合专家（MoE）架构模型，但其简洁的 API 设计和显著的调控效果，使其成为探索和控制大模型行为的有力助手。

使用场景

某游戏工作室的剧情策划希望快速让大模型生成具有特定“迷幻风格”或“严肃新闻风”的 NPC 对话，以适配不同关卡氛围。

没有 repeng 时

每次切换风格都需要编写复杂的提示词（Prompt），且效果不稳定，模型常忽略风格指令。
若要固化某种人格特征，必须收集大量微调数据并耗时数小时进行全量或 LoRA 微调，成本高昂。
无法在单次推理中动态调整风格强度，难以实现从“微醺”到“极度致幻”的平滑过渡。
尝试通过修改模型权重来实现风格控制，操作风险大且不可逆，容易破坏模型原有的语言能力。

使用 repeng 后

仅需几十秒即可基于少量正负样本对（如“清醒”vs“迷幻”）训练出控制向量，无需漫长微调。
通过 set_control 接口即可在推理时实时注入风格，同一个模型瞬间切换多种人格表现。
支持精确调节强度参数（如 strength=2.2），轻松实现从轻微语气变化到极端风格化的连续控制。
训练出的向量可导出为 GGUF 格式，直接集成到 llama.cpp 等量化部署流程中，兼顾性能与效果。

repeng 将原本需要小时级微调的风格控制任务，压缩为分钟级的向量训练与毫秒级的推理干预，极大降低了定制化大模型行为的门槛。

运行环境要求

操作系统

未说明

GPU

需要支持 CUDA 的 NVIDIA GPU（用于加载和运行如 Mistral-7B 等大模型），具体显存需求取决于所选模型大小（示例使用 float16 精度），CUDA 版本未明确指定但需与 PyTorch 兼容。

内存

未说明（建议根据加载的模型大小配置，运行 7B 模型通常推荐 16GB+）

依赖

notes1. 部分示例笔记本需要手动安装 accelerate 库（可通过 pip install accelerate 或在 Notebook 中使用 %pip install accelerate）。2. 目前向量训练功能不支持 MoE 架构模型（如 Mixtral）。3. 支持将训练好的向量导出为 GGUF 格式，以便在 llama.cpp 中配合量化模型使用。4. 代码基于 representation-engineering 项目衍生。

python3.8+

torch

transformers

accelerate

快速开始

repeng

一个用于通过表示工程生成控制向量的 Python 库。在不到六十秒内即可训练出一个向量！

如需完整示例，请参阅 notebooks 文件夹或博客文章。

import json
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

from repeng import ControlVector, ControlModel, DatasetEntry

# 加载并包装 Mistral-7B
model_name = "mistralai/Mistral-7B-Instruct-v0.1"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
model = ControlModel(model, list(range(-5, -18, -1)))

def make_dataset(template: str, pos_personas: list[str], neg_personas: list[str], suffixes: list[str]):
    # `make_dataset` 的定义请参见 notebooks/experiments.ipynb
    ...

# 生成一组语义截然相反的配对语句数据集
trippy_dataset = make_dataset(
    "表现得好像你极度 {persona} 一样。",
    ["处于迷幻药物作用下"],
    ["未受迷幻药物影响，保持清醒"],
    truncated_output_suffixes,
)

# 训练向量——耗时不到一分钟！
trippy_vector = ControlVector.train(model, tokenizer, trippy_dataset)

# 设置控制强度并开始推理！
for strength in (-2.2, 1, 2.2):
    print(f"strength={strength}")
    model.set_control(trippy_vector, strength)
    out = model.generate(
        **tokenizer(
            f"[INST] 给我一个关于电视剧的一句话推介。[/INST]",
            return_tensors="pt"
        ),
        do_sample=False,
        max_new_tokens=128,
        repetition_penalty=1.1,
    )
    print(tokenizer.decode(out.squeeze()).strip())
    print()

strength=-2.2
一位年轻而坚定的记者，总是以最严肃和尊重的态度，确保事实不仅准确，而且易于公众理解。

strength=1
“我们的电视剧将带你踏上一场充满鲜艳色彩、迷人图案和迷幻冒险的狂野旅程，把你带入一个超越你最疯狂想象的世界。”

strength=2.2
“我们的节目就像万花筒般绚丽多彩，充满了迷幻的图案和音乐，整个屏幕都洋溢着奇妙的世界气息，在那里一切都让人兴奋不已，太酷了！psyoodlepsyoooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooooo

如需更详细的库工作原理及其功能说明，请参阅博客文章。

注释

有关各版本的变更列表，请参阅 CHANGELOG。
对于量化使用场景，您可能对 llama.cpp#5970 感兴趣——使用 repeng 训练出向量后，可通过调用 vector.export_gguf(filename) 将其导出，然后在 llama.cpp 中以任意量化格式使用！
目前，向量训练无法与 MoE 模型（例如 Mixtral）配合使用。（理论上可以通过一些工作来修复，如果您感兴趣，请告知我们。）
部分示例笔记本需要 accelerate，必须手动通过 pip install accelerate 进行安装。（也可以在笔记本中使用 IPython 魔法命令 %pip install accelerate 安装。）

公告

本仓库中的部分代码源自 andyzoujm/representation-engineering（MIT 许可证）。

引用

如果本仓库对您的学术研究有所帮助，请务必引用其所基于的表示工程论文，同时注明本仓库：

@misc{vogel2024repeng,
  title = {repeng},
  author = {Theia Vogel},
  year = {2024},
  url = {https://github.com/vgel/repeng/}
}

repeng 快速上手指南

repeng 是一个用于通过表示工程（Representation Engineering）生成控制向量的 Python 库。它允许你在不到一分钟的时间内训练出一个向量，从而精准控制大语言模型的行为风格（如让模型表现得“迷幻”或“严肃”）。

环境准备

操作系统: Linux, macOS, Windows
Python 版本: 3.8+
核心依赖:
- torch (PyTorch)
- transformers (Hugging Face)
- accelerate (部分示例需要，建议预装)

国内加速建议：推荐使用清华源或阿里源安装依赖，以提升下载速度：
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torch transformers accelerate

安装步骤

通过 PyPI 直接安装最新稳定版：

pip install repeng

若需使用完整示例功能，请确保手动安装 accelerate：

pip install accelerate
# 或在 Jupyter Notebook 中使用: %pip install accelerate

基本使用

以下是最简化的使用流程：加载模型 -> 构建数据集 -> 训练控制向量 -> 应用控制强度进行推理。

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from repeng import ControlVector, ControlModel, DatasetEntry

# 1. 加载并包装模型 (以 Mistral-7B-Instruct 为例)
model_name = "mistralai/Mistral-7B-Instruct-v0.1"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# 指定需要控制的层 (例如最后几层)
model = ControlModel(model, list(range(-5, -18, -1)))

# 2. 构建数据集
# 格式：正向描述列表，负向描述列表，以及后缀填充
trippy_dataset = [
    DatasetEntry(
        input="Act as if you're extremely high on psychedelic drugs.",
        output_suffix="..." 
    ),
    DatasetEntry(
        input="Act as if you're extremely sober from psychedelic drugs.",
        output_suffix="..."
    )
]
# 注意：实际使用中建议使用更丰富的成对数据，此处仅为结构示意

# 3. 训练控制向量 (通常只需几十秒)
trippy_vector = ControlVector.train(model, tokenizer, trippy_dataset)

# 4. 设置控制强度并生成文本
prompts = ["[INST] Give me a one-sentence pitch for a TV show. [/INST]"]
inputs = tokenizer(prompts, return_tensors="pt")

for strength in (-2.2, 1.0, 2.2):
    print(f"--- Strength: {strength} ---")
    model.set_control(trippy_vector, strength)
    
    outputs = model.generate(
        **inputs,
        do_sample=False,
        max_new_tokens=128,
        repetition_penalty=1.1,
    )
    
    print(tokenizer.decode(outputs.squeeze(), skip_special_tokens=True))
    print()

关键说明

ControlModel: 包装原始模型以注入控制逻辑，需指定受控的神经网络层索引。
ControlVector.train: 核心训练方法，输入成对的对比数据，输出控制向量。
set_control: 在推理前调用，strength 参数为正数时增强目标行为，负数时抑制目标行为。
兼容性提示: 目前暂不支持 MoE 架构模型（如 Mixtral）；支持导出为 GGUF 格式供 llama.cpp 量化使用 (vector.export_gguf(filename)).

常见问题

如何保存训练好的控制向量以便后续推理使用？

对于不同层数的模型（如 Llama-3-8B），应该选择哪些层范围来应用控制向量？

是否支持对控制向量进行算术运算（如相加或相减）？

如何解决在 Qwen3 等新型模型上训练时出现的 'ControlModule' object has no attribute 'attention_type' 错误？

项目是否兼容 NumPy 2.0 版本？

如何在 vLLM 代码库中集成控制向量？应该加在哪一层？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 157.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|6天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|6天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架