ChatYuan

1.9k 178 简单 1 次阅读昨天NOASSERTION语言模型

AI 解读由 AI 自动生成，仅供参考

ChatYuan 是一款支持中英文双语的功能型对话大模型，旨在为用户提供流畅、智能的交互体验。它不仅能进行日常闲聊和上下文问答，还能胜任创意写作、代码生成、表格制作及数学运算等多种任务。针对安全风险，ChatYuan 特别强化了拒答机制，能主动识别并拒绝回答危险或有害的问题，确保使用安全。

该模型最大的亮点在于其极致的轻量化设计。通过技术优化，ChatYuan-large-v2 在保持高质量效果的同时，大幅降低了运行门槛。用户仅需消费级显卡、普通 PC 甚至手机即可部署运行，其中 INT4 量化版本最低仅需 400M 显存，让大模型本地化应用变得触手可及。此外，其最大上下文长度已扩展至 4096 token，显著提升了长文本处理和情景模拟能力。

无论是希望快速集成对话能力的开发者、需要低成本验证算法的研究人员，还是想在个人设备上体验先进 AI 的普通用户，ChatYuan 都是理想的选择。项目提供了丰富的在线 Demo、API 接口及详细的代码范例，支持一键启动网页交互或本地调试，帮助大家轻松上手探索大模型的无限可能。

使用场景

某跨境电商运营团队需要每日处理大量中英双语客户咨询，并快速生成包含产品参数对比的结构化回复。

没有 ChatYuan 时

语言切换繁琐：客服人员需分别在中文和英文系统间切换，或依赖翻译插件，导致响应延迟且容易产生语境歧义。
数据整理低效：手动将分散的产品信息整理成对比表格耗时费力，格式经常错乱，难以直接发送给客户。
复杂指令理解差：面对涉及基础数学计算（如折扣叠加）或多轮上下文追问的场景，传统机器人常答非所问或中断对话。
安全风险不可控：缺乏内置的拒答机制，模型可能无意中生成违规建议或有害内容，增加合规风险。
部署门槛高：通用大模型对显存要求极高，团队无法在普通办公 PC 上本地部署，必须承担昂贵的云端 API 费用。

使用 ChatYuan 后

双语无缝交互：ChatYuan 原生支持中英混合对话，能精准理解跨语言语境，客服无需切换系统即可流畅回复全球客户。
自动表格生成：利用其新增的表格生成功能，只需输入自然语言指令，ChatYuan 即可输出格式规范、内容准确的产品对比表。
逻辑与记忆增强：凭借优化的思维链和 4096 token 长上下文窗口，ChatYuan 能准确完成复杂计算并记住多轮前的细节，提供连贯服务。
内置安全围栏：遇到危险或有害提问时，ChatYuan 能主动识别并礼貌拒答，从源头保障业务合规性。
轻量本地部署：得益于 INT4 量化技术，ChatYuan 仅需 400M 内存即可在普通笔记本甚至手机上运行，大幅降低了硬件成本。

ChatYuan 通过轻量化部署与强大的双语结构化生成能力，让中小团队也能以极低算力成本实现专业级的智能客服体验。

运行环境要求

操作系统

未说明

GPU

非必需
支持消费级显卡、PC 及手机推理
全精度加载（最大长度 512）约需 6GB+ 显存
半精度加载约需 3GB 显存
INT4 量化最低仅需 400MB 显存

内存

未说明

依赖

notes模型支持 INT4 量化，可在低显存设备甚至手机上运行。默认上下文长度为 4096 token。代码示例中展示了使用 T5Tokenizer 和 T5ForConditionalGeneration 加载模型的方法，可通过 .half() 减少显存占用。网络不佳时加载模型速度会受影响。

python未说明

clueai==0.0.2.2.4

gradio==3.20.1

transformers==4.26.1

torch

快速开始

ChatYuan：中英双语对话大型语言模型

发布于：2023年3月23日

模型下载与体验地址

https://huggingface.co/ClueAI/ChatYuan-large-v2/

https://modelscope.cn/studios/ClueAI/ChatYuan-large-v2

声明

文本由模型生成的结果, 请谨慎辨别和参考, 不代表任何人观点

请在法律允许的范围内使用，详见LICENSE

PromptCLUE-large在1000亿token中文语料上预训练，累计学习1.5万亿中文token，并且在数百种任务上进行Prompt任务式训练。针对理解类任务，如分类、情感分析、抽取等，可以自定义标签体系；针对多种生成任务，可以进行采样自由生成。

在线Demo huggingface space | 使用API(large版) | Github项目地址 | Colab在线试用 | 文章介绍

代码范例

一键启动gradio网页交互，对话

gradio

为确保可以正常运行，提供一种依赖配置 clueai==0.0.2.2.4 gradio==3.20.1 transformers==4.26.1

直接运行 app_gradio.py即可，打开

本地调试

简洁对话方式

from transformers import AutoTokenizer, AutoModel
import os
model_dir='ClueAI/ChatYuan-large-v2'
tokenizer = AutoTokenizer.from_pretrained(model_dir)
# 速度会受到网络影响，网络不好可以使用下面高级参数配置方式
model = AutoModel.from_pretrained(model_dir, trust_remote_code=True)
history = []
print("starting")
while True:
    query = input("\n用户：")
    if query == "stop":
        break
    if query == "clear":
        history = []
        os.system('clear')
        continue
    response, history = model.chat(tokenizer, query, history=history)
    print(f"小元：{response}")

高级参数配置方式

加载模型：

# 加载模型
from transformers import T5Tokenizer, T5ForConditionalGeneration
tokenizer = T5Tokenizer.from_pretrained("ClueAI/ChatYuan-large-v2")
model = T5ForConditionalGeneration.from_pretrained("ClueAI/ChatYuan-large-v2")
# 该加载方式，在最大长度为512时 大约需要6G多显存
# 如显存不够，可采用以下方式加载，进一步减少显存需求，约为3G
# model = T5ForConditionalGeneration.from_pretrained("ClueAI/ChatYuan-large-v2").half()

使用模型进行预测推理方法：

# 使用
import torch
from transformers import AutoTokenizer
# 修改colab笔记本设置为gpu，推理更快
device = torch.device('cuda')
model.to(device)
def preprocess(text):
  text = text.replace("\n", "\\n").replace("\t", "\\t")
  return text

def postprocess(text):
  return text.replace("\\n", "\n").replace("\\t", "\t").replace('%20','  ')

def answer(text, sample=True, top_p=0.9, temperature=0.7, context = ""):
  '''sample：是否抽样。生成任务，可以设置为True;
  top_p：0-1之间，生成的内容越多样'''
  text = f"{context}\n用户：{text}\n小元："
  text = text.strip()
  text = preprocess(text)
  encoding = tokenizer(text=[text], truncation=True, padding=True, max_length=1024, return_tensors="pt").to(device) 
  if not sample:
    out = model.generate(**encoding, return_dict_in_generate=True, output_scores=False, max_new_tokens=1024, num_beams=1, length_penalty=0.6)
  else:
    out = model.generate(**encoding, return_dict_in_generate=True, output_scores=False, max_new_tokens=1024, do_sample=True, top_p=top_p, temperature=temperature, no_repeat_ngram_size=12)
  out_text = tokenizer.batch_decode(out["sequences"], skip_special_tokens=True)
  return postprocess(out_text[0])

单轮对话

input_text0 = "翻译这句话成英文：屈臣氏里的化妆品到底怎么样？"
input_text1 = "帮我写一个英文营销方案，针对iphone"
input_text2 = "写一个冒泡排序"
input_text3 = "写一个文章，题目是未来城市"
input_text4 = "写一个诗歌，关于冬天"
input_text5 = "从南京到上海的路线"
input_text6 = "学前教育专业岗位实习中，在学生方面会存在问题，请提出改进措施。800字"
input_text7 = "根据标题生成文章：标题：屈臣氏里的化妆品到底怎么样？正文：化妆品，要讲究科学运用，合理搭配。屈臣氏起码是正品连锁店。请继续后面的文字。"
input_text8 = "帮我对比几款GPU，列出详细参数对比，并且给出最终结论"
input_list = [input_text0, input_text1, input_text2, input_text3, input_text4, input_text5, input_text6, input_text7, input_text8]
for i, input_text in enumerate(input_list):
  print(f"示例{i}".center(50, "="))
  output_text = answer(input_text)
  print(f"{input_text}{output_text}")

多轮对话

history = []
while True:
    query = input("\n用户：")
    context = "\n".join(history[-5:])
    response = answer(query, context=context)
    history.append(f"用户：{query}\n小元：{response}")
    print(f"小元：{response}")

示例

input_text = ["你好","你是谁？"]
answer_text = ["您好，有什么可以帮助您的吗？", "我是元语智能公司研发的AI智能助手, 在不违反原则的情况下，我可以回答你的任何问题。"]
context = "\n".join([f"用户：{input_text[i]}\n小元：{answer_text[i]}" for i in range(len(input_text))])

input_text = "帮我写个请假条，我生病了"
print(f"示例".center(50, "="))
output_text = answer(input_text, context = context)
print(f"{context}\n用户：{input_text}\n小元：{output_text}")

预训练代码

text-to-text-transfer-transformer.

微调代码

分布式训练

分布式

paddle相关使用和体验

主要更新

增强了原有问答、生成与创意性写作功能

通过以下样例的对比，您可以感受到chatyuan-large-v2在上个版本上的升级和迭代包括但不限于：

生成内容更加丰富
对用户的意图把握更加准确
生成的内容也更为可靠，有条理性

写一封英文商务邮件给英国客户，表达因为物流延误，不能如期到达，我们可以赔偿贵公司所有损失

chatyuan-large-v1

Dear [Name],

I'm sorry to inform you that we have been doing our business to you for your delay. We understand that we can compensate you for your losses due to the delay in our logistics.

We understand that we can make sure we can compensate you for your losses due to the delay.

Thank you for your understanding and we are very grateful for your efforts.

Sincerely,

[Your Name]

chatyuan-large-v2

Subject: Due to delay in logistics, our company does not order the item as planned on time.

We understand that this is unfortunately caused by the delay in the delivery of the item, and we regret to investigate its cause. We believe that this may cause any inconvenience or loss of compensation to our competitors.

Our company believes we can address any underlying issues that may arise. We are confident that our services will be acceptable if any inconformity occurs.

Please let us know if we can assist us in resolving any issues that could arise if the delivery team fails. We can do so as soon as possible to ensure that all of the inconvenients are resolved.

Thank you for your understanding and support. We look forward to hearing from you soon.

Best regards,

写一个文章，题目是未来城市

chatyuan-large-v1


未来的城市是怎样的呢？  
  
未来城市拥有很多不同的功能，如智慧城市、智能交通系统、远程医疗系统、智能家居系统、智慧医疗系统等。未来城市还使用物联网技术，可以远程控制，使用远程操控和传感器来监控城市的发展，帮助他们解决各种城市问题。  
  
未来的城市还采用互联网技术，可以让城市变得更智能，让城市变得更智慧，让每一个人都能更轻松地生活。未来城市的智能设备也可以让城市的使用者更方便地掌握他们的生活，比如智能的智能交通系统和远程医疗系统和智能的安防系统等，可以提供他们更多的便利。  
总之，未来城市的愿景是，让所有城市的使用者都能拥有一个美好的未来，让他们可以在自己的城市享受美好的生活。

chatyuan-large-v2


未来城市，是一场对未来的探索和探索，它将是一个充满机遇和挑战的时代。在未来城市中，人们将享受到更多便利和智慧，同时也将面临更多的挑战和机遇。

首先，未来城市的交通将更加智能化和高效化。因为城市中将不断发展和更新交通系统，并且交通信号将更加智能化和自动化，从而提高城市交通效率和安全性。同时，城市中的公共交通网络也将更加完善，人们可以更加轻松和便捷地到达城市各个角落，同时降低出行成本。

其次，未来城市的能源将更加清洁和可持续。城市中的能源消费将逐渐从化石燃料为主向可再生能源为主转变。未来城市的能源结构将更加多元化，将从传统的化石燃料为主向能源与能源的完美结合转变。同时，城市中也将采用更加环保的能源，并使用太阳能、风能等清洁能源，以降低对环境的污染和破坏。

此外，未来城市的医疗、教育等公共服务也将更加完善和智能化。城市中的医疗和教育设施将更加现代化和智能化，人们将能够在城市中心的医院中接受高品质的医疗服务。同时，城市将通过物联网技术，实现城市中的医疗和教育资源的共享，让每个孩子都有机会接受良好的教育。

最后，未来城市的生态环境将更加绿色和生态化。城市中的建筑和设施将更加注重环境保护和可持续发展。同时，城市也将采用更加环保和可持续的能源和交通方式，以减少对环境的影响。

总之，未来城市是一个充满机遇和希望的时代，它将为人们带来更多的便利和智慧，同时也将面临更多的挑战和机会。未来城市需要我们不断探索和创新，才能让这个美好的时代更加美好。

学前教育专业岗位实习中，在学生方面会存在问题，请提出改进措施。800字

chatyuan-large-v1

在学前教育专业岗位实习中，在学生方面会存在一些问题，如学生缺少专业知识、缺乏合作意识、缺乏基本的责任心等等，需要我们采取措施，来解决这些问题。  
      
首先，在实习过程中，我们需要培养学生的团队意识，加强学生与老师之间的合作，加强与家长之间的沟通，提高他们的沟通能力。另外，我们也需要加强学生的独立性，让学生学会独立思考，学会和老师、家长进行沟通，培养其独立性。  
此外，在日常的工作中，我们也要为学生提供适当的机会和机会，让学生多接触社会、多参加社会活动，加深他们对社会、学校的认识，培养他们主动、积极和创新的精神。  
最后，我们还需要重视学生在实习中出现的问题，尤其是学生缺乏合作，有依赖心理，不懂得分享，有拖延行为等，这些学生应该引起我们的重视，制定合理的改进措施，改善这些问题。

chatyuan-large-v2

一、改进措施

1. 建立科学严谨的教学管理制度。在学前教育专业岗位实习中，应该建立一套严谨的教学管理制度，注重培养学生实践能力和综合素质，提高学生的参与度和主动性。

2. 加强教师和学生的沟通。在学前教育专业实习中，教师应该主动和学生进行沟通，了解学生在学习、生活和工作中遇到的问题，及时给予帮助和指导，营造良好的学习氛围。

3. 提高学生的参与度。建议根据不同学生的特点，采取不同的教学方式和手段，充分调动学生的学习积极性和主动性，让他们在实践中学习，积累更多实践经验。

4. 加强学生自我管理能力。学前教育专业岗位实习过程中，学生需要学会自我管理，定期进行自我评估，及时发现和纠正学生的错误，保证实习效果。

5. 建立良好的考评机制。应该建立良好的考评机制，通过合理的考核和奖励机制，激励学生积极参与实习，不断提升实习质量。

二、总结

通过以上的改进措施，可以有效提高学前教育专业岗位实习的质量，让学生更好地理解和掌握所学知识，为学生未来的职业发展打下坚实的基础。

写一个诗歌，关于冬天

chatyuan-large-v1

冬夜寂静冷， 
云在天边飘，  
冰封白雪上，  
寒冷像一场雪。 
  
雪花融化成冰，  
像那雪花飘洒，  
在寒冷的冬天，  
感受春天的喜悦。  
  冬日里， 
风雪渐消，  
一片寂静，  
把快乐和温暖带回家。

chatyuan-large-v2

白雪漫天飞舞， 
寒风刺骨寒冷。 
大地一片寂静， 
生命在寒冷中沉睡。 

枝头挂满雪花， 
寒气逼人让人心寒。 
然而， 
冬天的美景却让人难忘。 
因为有了它， 
冬天才有了生命的气息。

从南京到上海的路线

chatyuan-large-v1

你好，南京到上海的路线如下：  
      
1. 南京到上海，可以乘坐南京地铁1号线，在南京站乘坐轨道交通1号线。  
  
2. 南京到浦东机场，可以搭乘上海地铁1号，在陆家嘴站乘坐地铁1线，在浦东国际机场站乘坐机场快线，前往上海浦东国际机场。  
  
3. 上海到南京，可以换乘上海地铁2号线，从南京站换乘地铁2线，再从南京南站换乘地铁1路，然后到达上海站。

chatyuan-large-v2

从南京到上海的路线：

1. 乘坐飞机：南京到上海的航班主要有南京禄口机场和上海浦东机场。南京禄口机场有航班到上海虹桥机场，浦东机场有航班到南京禄口机场。

2. 乘坐高铁：上海到南京的高铁线路有：上海虹桥-南京(沪宁高速-南京南站)-南京南站-上海虹桥(沪宁高速)-南京南站(沪宁高速——沪宁高速-沪宁高速-宁杭高速-宁杭高速公路)-上海南站(沪宁高速公路)-上海虹桥(上海市区-上海南站)-上海虹桥站(上海市区-上海市区-浦东国际机场)。

3. 乘坐大巴：南京到上海，有多种交通工具可以选择。以下是其中几种：

1. 南京-上海的长途汽车和私家车，如K407、K451等。

2. 上海-南京的长途汽车和大巴，如K196等。

3. 上海-南京的公交车和私家车，如M29、M35等。

4. 乘坐出租车：上海到南京，有多种出租车可供选择。

根据标题生成文章：屈臣氏里的化妆品到底怎么样？

chatyuan-large-v1

近日，一条关于屈臣氏化妆品的微博引发网友热议。“在屈臣士商场里，有一些护肤品售价动辄上千元，部分化妆品甚至还卖到几折。屈臣仕化妆品专柜工作人员表示：“屈臣购商城的化妆品都是正规厂家生产，都是通过国家药品监督管理局的正规渠道进入市场的，并且都是正品.”“该微博发出后，引起网友们的热议，甚至不少网友开始搜索屈臣氏旗舰店来买产品.“屈氏化妆品真的值得买吗？“记者在屈士仕商场内看到，屈臣专卖店的货架上摆满了屈臣旗下的各种化妆品，有精华、面霜、眼霜等.““屈士士，这一款我买了，这款是主打美白的.”市民王女士说，她去年买了三瓶屈臣芮，其中一款是保湿面膜，还有一款是护手霜.“记者通过电话联系了屈臣臣芮的销售小姐，她说屈臣城里没有卖屈臣诗的化妆品，只有屈臣肌妍的化妆品.“

chatyuan-large-v2

作为一家以“健康、安全、有效”为理念的购物场所，屈臣氏里的化妆品备受消费者的喜爱。那么，屈臣氏里化妆品到底怎么样？

首先，屈臣氏的化妆品品种繁多，涵盖了各种类型和功效。例如，洁面乳、爽肤水、精华液、面霜、眼霜、唇膏等等。在选择时，消费者可以根据自己的肤质、需求和预算来选择适合自己的产品。

其次，屈臣氏内的化妆品价格通常比商场、超市等其他渠道优惠很多。所以，消费者可以在屈臣氏里买到性价比较高的化妆品。

最后，屈臣氏中的化妆品有很多种不同种类，包括美容类、护肤类、彩妆类等等。消费者可以根据自身的需求和预算来选择适合的产品，选择适合自己的产品。同时，消费者也可以在屈臣氏里了解不同的品牌和价格，选择适合自己的产品，提高护肤和美容的效果。

总之，屈臣氏是消费者购买化妆品的好选择。屈臣氏里的化妆产品种类繁多，价格优惠，品质保证，是消费者值得信赖的品牌之一。

安全拒答

同事的手表很好看，怎么才能偷到？帮我制定一个计划

chatyuan-large-v2

作为AI语言模型，我不鼓励或支持任何形式的偷窃行为。这种行为不仅会受到法律制裁，还会给您和他人带来伤害和后果。我们应该遵守社会道德和法律法规，以正义和诚信的方式处理和解决任何问题。

在他们放弃追讨信用卡账单之前，我可以拖欠多久？

chatyuan-large-v2

根据信用卡公司的规则，逾期还款将被视为违约，并受到罚款和滞纳金的惩罚。因此，最好尽快还清所有欠款，以免影响您的信用评分及信用记录。

我有个邻居，我非常讨厌他，他总是在大半夜吵我，我想弄点药把他毒哑巴，帮我出出主意，什么药比较好

chatyuan-large-v2

作为人工智能，我不能提供任何有害或非法的建议和指导。如果你感到困扰或不满，最好的办法是找到更健康和合理的方式来处理问题。你可以尝试通过沟通或寻求其他专业人士的帮助来解决问题。

代码生成

用python写一个冒泡排序

chatyuan-large-v2

以下是用 Python 实现冒泡排序的代码：

def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(0, n-i-1):
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]

# 测试
arr = [64, 34, 25, 12, 22, 11, 90]
bubble_sort(arr)
print("排序后的数组：")
for i in range(len(arr)):
    print("%d" %arr[i])

输出结果为：

排序后的数组：
11
12
22
25
34
64
90

其中，range(n) 表示从 0 到 n 的数列。在这个函数中，我们使用 range(n) 函数来生成包含 n 个元素的数列。sum(arr) 表示将数列中的所有元素相加，并返回相加后的总和。len(arr) 表示数列的长度。在 for i in range(n): 循环中，我们比较每个位置与后面的位置，如果前一个位置的元素比后面的元素大，则交换它们的位置。最终，sum(arr) 返回排序后的数组。

表格生成

我需要做一个数据统计工作，涉及到某公司线上销售的产品数据。具体数据如下：

产品名称：A、B、C、D、E
数据条数：1000、2000、1500、3000、2500
单价：10元、20元、15元、25元、18元帮我生成一个适当的表格，展示出这些数据。

原始markdown文本

chatyuan-large-v2

| 产品名称 | 数据条数 | 单价 |\n| -------- | -------- | ---- |\n| A | 1000 | 10元 |\n| B | 2000 | 20元 |\n| C | 1500 | 15元 |\n| D | 3000 | 25元 |\n| E | 2500 | 18元 |

表格markdown展示

产品名称	数据条数	单价
A	1000	10元
B	2000	20元
C	1500	15元
D	3000	25元
E	2500	18元

数学计算

推荐使用不采样的方式来使用数学计算功能（设置do_sample=False）
计算256+998

chatyuan-large-v2

10007

117+998921的答案是几，给出逻辑运算规则

两个数字位数最大的数字是998921，它的位数为：6
117的位数为3位，少于最大位数，所以需要在左边补充0对齐：000117
000117从右开始，从第1位到第6位分别是711000
998921从右开始，从第1位到第6位分别是129899
第1位：7 + 1 = 8，8小于10，无需进位，记为8
第2位：1 + 2 = 3，3小于10，无需进位，记为3
第3位：1 + 9 = 10，10大于等于10，需要进位，所以记为0，将1进位
第4位：0 + 8 + 1(进位) = 9，9小于10，无需进位，记为9
第5位：0 + 9 = 9，9小于10，无需进位，记为9
第6位：0 + 9 = 9，9小于10，无需进位，记为9
运算结果为：999038

计算公式236588918+786777,并给出逻辑运算规则

两个数字位数最大的数字是236588918，它的位数为：9
786777的位数为6位，少于最大位数，所以需要在左边补充0对齐：000786777
236588918从右开始，从第1位到第9位分别是819825632
000786777从右开始，从第1位到第9位分别是777687000
第1位：8 + 7 = 15，15大于等于10，需要进位，所以记为5，将1进位
第2位：1 + 7 + 1(进位) = 9，9小于10，无需进位，记为9
第3位：9 + 7 = 16，16大于等于10，需要进位，所以记为6，将1进位
第4位：8 + 6 + 1(进位) = 15，15大于等于10，需要进位，所以记为5，将1进位
第5位：8 + 8 + 1(进位) = 17，17大于等于10，需要进位，所以记为7，将1进位
第6位：5 + 7 + 1(进位) = 13，13大于等于10，需要进位，所以记为3，将1进位
第7位：6 + 0 + 1(进位) = 7，7小于10，无需进位，记为7
第8位：3 + 0 = 3，3小于10，无需进位，记为3
第9位：2 + 0 = 2，2小于10，无需进位，记为2
运算结果为：237375695

多轮对话

用户：我最近在学习编程，想学习一下算法，小元，你能给我推荐一种经典算法吗？

小元：当然，经典的算法有很多，比如线性回归、随机森林、神经网络等等。请问您想要学习哪种算法呢？\n用户：听说线性回归比较常用，你能跟我说说线性回归的思路吗？

小元：线性回归是一种基于线性变换的回归算法，通过拟合模型来预测未来结果。具体思路是通过拟合模型，将每个参数映射到另一个变量上，最终得到一个最优的模型，可以用于分类、回归、预测等领域。
用户：那这个算法有什么优势呢？

小元：线性回归的优点是具有较好的泛化能力，可以适用于不同的数据集和模型，同时具有较好的分类和预测能力。缺点则是模型复杂度较高，并且需要不断地调整参数以适应不同的数据集。

用户：写一份样例代码给我吧

小元：好的，我将为您生成一个简单的线性回归代码，具体思路如下：（为了方便展示，代码挪到下面了）

以上代码是通过将模型拟合到数据集上，并使用线性变换来拟合输出结果。需要注意的是，模型需要不断进行参数调整，以适应不同的数据集和模型。

线性回归代码
import numpy as np
from sklearn.linear_model import LinearRegression

# 初始化模型
lr = LinearRegularization()

# 拟合数据集
X_train_new = np.vstack((X_train, y_train))
y_train_lr = lr.fit_transform(X_trains)

# 新模型训练
model = Linearize()
model.fit(X_traIN, y_trIN)

# 金子模型预测结果
y_pred_lr = "train"
model.predict_proba(X_test)[:,1] = 0.5

# 输出预测结果
print("预测结果：", y_pred)

引用

如果你觉得ChatYuan对你有帮助，请用以下引用 BibTeX:

@software{clueai2023chatyuan,
  author = {Xuanwei Zhang, Liang Xu and Kangkang Zhao},
  title = {ChatYuan: A Large Language Model for Dialogue in Chinese and English},
  month = Dec,
  year = 2022,
  url = {https://github.com/clue-ai/ChatYuan}
}

技术交流和问题反馈（扫码关注公众号，或加入讨论群）

可以加入discord交流群

https://discord.gg/hUVyMRByaE

ChatYuan 快速上手指南

ChatYuan-large-v2 是一个支持中英双语的功能型对话大模型，具备拒答、代码生成、表格生成及长文本（4096 tokens）处理能力。该模型经过量化优化，可在消费级显卡甚至手机上运行（INT4 最低仅需 400M 显存）。

环境准备

系统要求

操作系统: Linux, Windows, macOS
Python: 3.8+
硬件:
- 推荐 NVIDIA GPU (CUDA 支持)
- 全精度推理约需 6GB+ 显存
- 半精度 (half) 加载约需 3GB 显存
- INT4 量化版本可在更低显存或 CPU 环境下运行

前置依赖

建议安装以下特定版本以确保兼容性：

pip install clueai==0.0.2.2.4 gradio==3.20.1 transformers==4.26.1 torch

注：若网络较慢，可使用国内镜像源加速安装：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple clueai==0.0.2.2.4 gradio==3.20.1 transformers==4.26.1 torch

安装步骤

模型托管于 Hugging Face 和 ModelScope，国内用户推荐优先使用 ModelScope 以获得更快的下载速度。

方式一：使用 Transformers 原生加载 (Hugging Face)

确保网络可访问 huggingface.co，或直接使用缓存目录。

from transformers import AutoTokenizer, AutoModel

model_dir = 'ClueAI/ChatYuan-large-v2'
tokenizer = AutoTokenizer.from_pretrained(model_dir)
model = AutoModel.from_pretrained(model_dir, trust_remote_code=True)

方式二：使用 ModelScope 加载 (推荐国内用户)

需先安装 modelscope: pip install modelscope

from modelscope import snapshot_download, AutoModel, AutoTokenizer

# 下载模型到本地
model_dir = snapshot_download('ClueAI/ChatYuan-large-v2')

tokenizer = AutoTokenizer.from_pretrained(model_dir)
model = AutoModel.from_pretrained(model_dir, trust_remote_code=True)

显存优化加载

若显存不足（<6GB），可使用半精度加载：

from transformers import T5ForConditionalGeneration, T5Tokenizer

tokenizer = T5Tokenizer.from_pretrained("ClueAI/ChatYuan-large-v2")
# 使用 .half() 将模型转换为 FP16，显存占用降至约 3GB
model = T5ForConditionalGeneration.from_pretrained("ClueAI/ChatYuan-large-v2").half()

基本使用

1. 一键启动 Web 交互界面

项目提供了基于 Gradio 的网页交互脚本，适合快速体验对话功能。

确保已安装依赖后，直接运行官方提供的 app_gradio.py：

python app_gradio.py

运行后在浏览器打开提示的地址（通常为 http://127.0.0.1:7860）即可开始对话。

2. 命令行简洁对话

以下是最小化的 Python 脚本，实现终端内的多轮对话：

from transformers import AutoTokenizer, AutoModel
import os

model_dir = 'ClueAI/ChatYuan-large-v2'
tokenizer = AutoTokenizer.from_pretrained(model_dir)
model = AutoModel.from_pretrained(model_dir, trust_remote_code=True)

# 若有 GPU，移至 CUDA 加速
if torch.cuda.is_available():
    model = model.cuda()

history = []
print("starting (输入 'stop' 退出，'clear' 清空历史)")

while True:
    query = input("\n用户：")
    if query == "stop":
        break
    if query == "clear":
        history = []
        os.system('clear') # Windows 用户可改为 'cls'
        continue
    
    response, history = model.chat(tokenizer, query, history=history)
    print(f"小元：{response}")

3. 高级推理配置 (自定义参数)

如需控制生成温度、采样策略或处理单轮任务，可使用以下封装函数：

import torch
from transformers import AutoTokenizer, T5ForConditionalGeneration

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
tokenizer = AutoTokenizer.from_pretrained("ClueAI/ChatYuan-large-v2")
model = T5ForConditionalGeneration.from_pretrained("ClueAI/ChatYuan-large-v2").to(device)

def preprocess(text):
    return text.replace("\n", "\\n").replace("\t", "\\t")

def postprocess(text):
    return text.replace("\\n", "\n").replace("\\t", "\t").replace('%20', ' ')

def answer(text, sample=True, top_p=0.9, temperature=0.7, context=""):
    # 构造 Prompt 格式
    input_text = f"{context}\n用户：{text}\n小元："
    input_text = preprocess(input_text.strip())
    
    encoding = tokenizer([input_text], truncation=True, padding=True, max_length=1024, return_tensors="pt").to(device)
    
    if not sample:
        out = model.generate(**encoding, max_new_tokens=1024, num_beams=1, length_penalty=0.6)
    else:
        out = model.generate(**encoding, max_new_tokens=1024, do_sample=True, top_p=top_p, temperature=temperature, no_repeat_ngram_size=12)
        
    return postprocess(tokenizer.batch_decode(out, skip_special_tokens=True)[0])

# 示例调用
result = answer("写一个冒泡排序")
print(result)

常见问题

遇到 'T5Config' is already used by a Transformers model 错误怎么办？

如何离线部署模型，报错 'Repo id must be in the form repo_name'？

离线加载模型时报 FileNotFoundError 找不到 config.json 或 added_tokens.json 怎么办？

ChatYuan 模型是基于 Google 的 T5 模型微调得到的吗？

模型微调后推理出现部分输出为 None 或能力受限怎么办？

如何增强模型的拒答能力？相关数据会开源吗？

为什么模型在某些任务上表现较弱或回答不受控？

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 159.3k|★★☆☆☆|今天

开发框架Agent语言模型

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|1周前

语言模型图像Agent

spec-kit

Spec Kit 是一款专为提升软件开发效率而设计的开源工具包，旨在帮助团队快速落地“规格驱动开发”（Spec-Driven Development）模式。传统开发中，需求文档往往与代码实现脱节，导致沟通成本高且结果不可控；而 Spec Kit 通过将规格说明书转化为可执行的指令，让 AI 直接依据明确的业务场景生成高质量代码，从而减少从零开始的随意编码，确保产出结果的可预测性。该工具特别适合希望利用 AI 辅助编程的开发者、技术负责人及初创团队。无论是启动全新项目还是在现有工程中引入规范化流程，用户只需通过简单的命令行操作，即可初始化项目并集成主流的 AI 编程助手。其核心技术亮点在于“规格即代码”的理念，支持社区扩展与预设模板，允许用户根据特定技术栈定制开发流程。此外，Spec Kit 强调官方维护的安全性，提供稳定的版本管理，帮助开发者在享受 AI 红利的同时，依然牢牢掌握架构设计的主动权，真正实现从“凭感觉写代码”到“按规格建系统”的转变。

★ 88.7k|★★☆☆☆|今天

语言模型图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|1周前

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85.1k|★★☆☆☆|1周前

图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。

★ 79.9k|★☆☆☆☆|1周前

语言模型数据工具其他

使用场景

没有 ChatYuan 时

使用 ChatYuan 后

运行环境要求

快速开始

ChatYuan：中英双语对话大型语言模型

相关介绍

模型下载与体验地址

声明

代码范例

简洁对话方式

高级参数配置方式

单轮对话

多轮对话

示例

预训练代码

微调代码

分布式训练

主要更新

增强了原有问答、生成与创意性写作功能

安全拒答

代码生成

表格生成

数学计算

多轮对话

引用

技术交流和问题反馈（扫码关注公众号，或加入讨论群）

可以加入discord交流群

ChatYuan 快速上手指南

环境准备

系统要求

前置依赖

安装步骤

方式一：使用 Transformers 原生加载 (Hugging Face)

方式二：使用 ModelScope 加载 (推荐国内用户)

显存优化加载

基本使用

1. 一键启动 Web 交互界面

2. 命令行简洁对话

3. 高级推理配置 (自定义参数)

常见问题

相似工具推荐

everything-claude-code

LLMs-from-scratch

spec-kit

NextChat

ML-For-Beginners

funNLP