P-tuning

938 114 中等 1 次阅读 3个月前MIT语言模型

AI 解读由 AI 自动生成，仅供参考

P-tuning 是一种高效微调大型语言模型的创新方法，源自清华大学团队发表的论文《GPT Understands, Too》。传统的全参数微调不仅需要巨大的计算资源，还难以在少样本场景下取得理想效果，而 P-tuning 通过引入可学习的连续提示向量（Continuous Prompts），仅更新极少量参数即可让模型适应下游任务，显著降低了算力门槛。

该方法特别适合 AI 研究人员和开发者使用，尤其是那些希望在有限硬件条件下（如消费级显卡）探索大模型应用，或专注于少样本学习、知识探测等场景的技术人员。P-tuning 的核心亮点在于其“参数高效”特性：它证明了即使不调整模型主体权重，仅优化输入端的提示嵌入，也能让 GPT 等大模型达到甚至超越全参数微调的性能。此外，该技术已迭代至 P-tuning v2，进一步提升了在不同规模模型和任务上的通用性与稳定性。项目开源了完整的代码及 LAMA、SuperGLUE 等基准数据集，方便用户快速复现实验或进行二次开发，是连接大模型理论与落地实践的有力工具。

使用场景

某电商初创公司的算法团队需要在资源有限的情况下，快速让大语言模型掌握垂直领域的商品评论情感分析能力。

没有 P-tuning 时

算力门槛极高：团队试图对预训练模型进行全量微调，但受限于显存，必须租用昂贵的多卡 A100 集群，导致推理成本远超预算。
小样本效果差：由于标注数据稀缺（仅几百条特定品类评论），传统微调方法极易过拟合，模型在测试集上表现不稳定，无法泛化到新商品。
部署周期漫长：每次迭代都需要保存和加载完整的巨型模型权重文件，传输与更新耗时数小时，严重拖慢产品上线节奏。
灾难性遗忘：模型在学习新任务后，丢失了原有的通用语言理解能力，导致在处理非垂直领域问题时胡言乱语。

使用 P-tuning 后

消费级显卡即可运行：利用 P-tuning 仅优化连续提示向量（Continuous Prompts）的特性，团队仅用单张 RTX 3090 甚至更低的配置就完成了高效训练。
小样本性能卓越：在极少标注数据下，P-tuning 激发了模型的内在理解力，情感分析准确率迅速达到生产可用标准，且泛化能力强。
轻量化极速部署：只需存储和更新极少量的提示参数（通常不到模型总参数的 1%），模型切换与更新可在秒级完成。
保留通用能力：模型主体参数被冻结，完美保留了预训练时的通用知识，既能精准分析评论，又能流畅回答用户的一般咨询。

P-tuning 通过参数高效微调技术，让中小团队也能以极低算力成本，将通用大模型快速转化为高精度的垂直领域专家。

运行环境要求

GPU

未说明具体型号，但新闻提及运行 GLM-130B 需 4*RTX 3090 或 8*RTX 2080 Ti
基础 P-tuning 需求未在本文档明确

内存

未说明

依赖

notesREADME 中未直接列出环境配置，具体依赖请查看子目录中的 requirement.txt 文件。新闻部分提到大规模模型（GLM-130B）的推理和微调需要高端多卡环境（如 4 张 RTX 3090），但基础 P-tuning 方法的硬件门槛需参考原始论文或代码实现细节。数据集（LAMA 和 FewGLUE_32dev）需手动下载并放置于指定目录。

python未说明

快速开始

P-tuning

❗ 新闻

🌟 [2022-10-06] 我们非常高兴地推出 GLM-130B：一个开源的双语预训练模型。这是一个开源的大规模语言模型，在多个基准测试中表现超越 GPT-3 175B。只需 4 张 RTX 3090 或 8 张 RTX 2080 Ti，即可免费获取模型权重并进行推理和 P-Tuning！立即访问！

🌟 [2022-07-14] 论文参数高效的提示调优使神经文本检索器具备泛化能力和校准性已发布！请查看我们的代码。

🌟 [2021-10-15] P-tuning v2 已发布！请访问我们的 GitHub 仓库。

一种全新的语言模型调优方法。附带论文 [``GPT 也懂了''](https://arxiv.org/abs/2103.10385) 的代码和数据集。

Xiao Liu*, Yanan Zheng*, Zhengxiao Du, Ming Ding, Yujie Qian, Zhilin Yang, Jie Tang

您可能也会对我们的另一项工作 GLM 感兴趣：所有 NLP 任务都是生成任务：一种通用的预训练框架

如何使用我们的代码

我们已发布了用于 LAMA 和少样本 SuperGLUE (32-dev) 实验的代码和数据集。详情请参阅相应子目录中的 README.md 和 requirement.txt 文件。

LAMA 和 FewGLUE_32dev 数据集现已开放下载。LAMA 数据集应放置在 ./data 目录下，而 SuperGLUE 数据集则应放置在 ./（项目根目录）下。

引用方式

如果您认为我们的工作有所帮助，请引用以下论文：

    @article{liu2021gpt,
    title={GPT 也懂了},
    author={刘晓、郑雅楠、杜正霄、丁明、钱宇杰、杨志林、唐杰},
    journal={arXiv:2103.10385},
    year={2021}
    }

P-tuning 快速上手指南

P-tuning 是一种新颖的语言模型微调方法，旨在让预训练模型（如 GPT）更好地理解和执行下游任务。本指南基于官方仓库 THUDM/P-tuning 整理，帮助开发者快速启动 LAMA 和 Few-shot SuperGLUE 实验。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux (推荐) 或 macOS
Python 版本：Python 3.6+
深度学习框架：PyTorch (需匹配您的 CUDA 版本)
硬件建议：支持 CUDA 的 NVIDIA GPU（显存需求视模型大小而定）

前置依赖安装： 建议使用 pip 安装基础依赖。国内用户可使用清华源加速安装：

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

注意：具体的依赖包列表请查看项目对应子目录下的 requirements.txt 文件。

安装步骤与数据配置

本项目代码已开源，需克隆仓库并配置数据集。

1. 克隆代码库

git clone https://github.com/THUDM/P-tuning.git
cd P-tuning

2. 数据集下载与放置

项目主要涉及 LAMA 和 FewGLUE_32dev (SuperGLUE few-shot) 两个数据集。请按照以下路径规范放置数据：

LAMA 数据集：
- 下载地址：LAMA Dataset
- 放置路径：解压后放入项目根目录下的 ./data 文件夹中。
FewGLUE_32dev 数据集：
- 下载地址：FewGLUE_32dev Repo
- 放置路径：直接放置在项目根目录 ./ 下。

最终目录结构应类似于：

P-tuning/
├── data/
│   └── [LAMA 数据集内容]
├── FewGLUE_32dev/
│   └── [SuperGLUE 数据集内容]
├── src/
├── requirements.txt
└── README.md

基本使用

完成环境配置和数据准备后，您可以参考各任务子目录下的具体脚本运行实验。以下以典型的训练流程为例（具体参数请参考对应任务的 README.md）：

运行示例

进入对应的实验目录（例如 LAMA 或 SuperGLUE 的子目录），执行训练脚本。假设当前位于包含训练脚本的目录：

python train.py \
    --model_name_or_path bert-base-uncased \
    --task_name lama \
    --data_dir ./data \
    --output_dir ./outputs \
    --do_train \
    --do_eval \
    --per_device_train_batch_size 16 \
    --learning_rate 5e-4 \
    --num_train_epochs 10

提示：

--model_name_or_path 可替换为您本地下载的预训练模型路径。

对于 SuperGLUE 任务，请将 --task_name 和 --data_dir 调整为对应的配置。

更多高级用法（如 P-tuning v2 或 GLM-130B 适配）请访问 P-tuning v2 仓库。

如果您在研究中使用了此工具，请引用论文：

Liu, Xiao, et al. "GPT Understands, Too." arXiv preprint arXiv:2103.10385 (2021).

常见问题

为什么更换预训练模型（如从 ALBERT 换成 BERT）后会报错 embedding_dim 不一致？

在 SuperGLUE 任务中，寻找 prompt 和微调模型是分开进行的还是同时进行的？

运行代码时遇到 'output' object has no attribute 'loss' 或 'logits' 报错怎么办？

P-tuning 中的伪提示（pseudo prompts）是如何初始化的？是随机初始化还是使用模板嵌入？

论文中提到的优化过程中的“离散性”（discreteness）问题具体指什么？Prompt Encoder 如何解决这个问题？

为什么 P-tuning V2 论文中报告的 SuperGLUE 指标比 P-tuning V1 论文中的差，甚至不如全量微调？

如果预测标签不在给定的词表中，或者标签被分成多个子词，应该如何处理？

在哪里可以找到运行该项目所需的依赖包和环境配置信息？

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 140.4k|★★☆☆☆|今天

开发框架Agent语言模型

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|昨天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。

★ 74.9k|★★★☆☆|今天

语言模型图像开发框架

OpenHands

OpenHands 是一个专注于 AI 驱动开发的开源平台，旨在让智能体（Agent）像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点，通过自动化流程显著提升开发速度。无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员，还是需要快速原型验证的技术团队，都能从中受益。OpenHands 提供了灵活多样的使用方式：既可以通过命令行（CLI）或本地图形界面在个人电脑上轻松上手，体验类似 Devin 的流畅交互；也能利用其强大的 Python SDK 自定义智能体逻辑，甚至在云端大规模部署上千个智能体并行工作。其核心技术亮点在于模块化的软件智能体 SDK，这不仅构成了平台的引擎，还支持高度可组合的开发模式。此外，OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩，证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能，支持与 Slack、Jira 等工具集成，并提供细粒度的权限管理，适合从个人开发者到大型企业的各类用户场景。

★ 70.6k|★★★☆☆|今天

语言模型Agent开发框架