BianQue

872 110 中等 1 次阅读昨天语言模型

AI 解读由 AI 自动生成，仅供参考

扁鹊（BianQue）是一款专为中文医疗场景打造的开源对话大模型，由华南理工大学团队研发。与传统医疗 AI 往往在用户描述不清时便急于给出建议不同，扁鹊核心解决了“患者表述模糊”这一痛点。它独创了“询问链（CoQ）”机制，能够像真实医生一样，通过多轮主动问询来引导用户补充关键病情细节，而非仅基于单轮信息草率作答，从而显著提升诊断建议的准确性与安全性。

该项目基于千万级规模的中文健康对话数据微调而成，特别强化了对慢性病管理及日常健康咨询的支持。其技术亮点在于混合了指令微调与多轮医生问询数据集，使模型具备了优秀的“提问能力”和上下文理解力，填补了国内开源医疗模型在多轮交互领域的空白。

扁鹊非常适合人工智能研究人员、医疗科技开发者以及希望构建智能问诊系统的机构使用。研究者可以利用其高质量数据集探索医疗大模型的新方向；开发者则可基于此基座快速搭建具备专业问诊逻辑的应用程序。对于关注数字健康的普通用户，扁鹊也提供了一个更懂倾听、更具同理心的健康咨询新选择，助力实现主动健康管理。

使用场景

某社区健康管理平台正在开发一款针对慢性病患者及儿童家长的智能预诊助手，旨在缓解线下儿科与全科医生资源紧张的问题。

没有 BianQue 时

盲目给出建议：当家长模糊描述“孩子便秘”时，通用模型往往直接罗列饮食建议或药物名称，忽略了关键病史的缺失。
缺乏追问逻辑：模型无法模拟医生“询问链（CoQ）”思维，不会主动追问大便性状、持续时间或伴随症状，导致信息收集不全。
误判风险高：由于缺乏多轮交互确认，系统可能将严重的器质性病变误判为普通功能性问题，延误就医时机。
用户体验割裂：用户需要反复手动补充信息，对话过程像“挤牙膏”，缺乏专业医疗咨询的流畅感与信任感。

使用 BianQue 后

主动引导问询：BianQue 识别到描述不足时，会像真人医生一样主动追问：“宝宝之前大便什么样？是干硬还是成形？最近饮食如何？”
构建完整病历：通过多轮共情对话，模型能逐步收集起病程时长、症状细节及生活习惯，形成结构化的预诊信息链。
精准分诊建议：基于充分的信息上下文，BianQue 能更准确地判断是否需要立即就医或进行家庭护理，显著降低误判率。
拟人化交互体验：对话流程自然顺畅，模型展现出专业的倾听与引导能力，让家长感到被重视，提升了依从性与满意度。

BianQue 通过将单向问答转化为专业的多轮“询问链”，真正实现了从“简单检索”到“主动预诊”的跨越，让 AI 具备了临床医生的思维逻辑。

运行环境要求

操作系统

Linux
Windows
macOS

GPU

必需（用于运行模型），训练需 8 张 NVIDIA RTX 4090
推理支持 CUDA 11.6 (cu116)，Windows 单卡用户需设置 CUDA_VISIBLE_DEVICES='0'

内存

未说明

依赖

notes1. 推荐使用 conda 创建名为 'proactivehealthgpt_py38' 或 'bianque_py38' 的环境。2. Windows 用户需手动安装 CUDA 11.6 和 cuDNN 8.4.0。3. BianQue-2.0 基于 ChatGLM-6B，BianQue-1.0 基于 ChatYuan-large-v2。4. 代码中加载模型时使用了 .half()，表明需要支持半精度推理的 GPU。5. 训练 BianQue-1.0 曾在 8 张 RTX 4090 上耗时约 16 天。

python3.8+

torch==1.13.1+cu116

torchvision==0.14.1+cu116

torchaudio==0.13.1

transformers

cpm_kernels

streamlit

streamlit_chat

rouge_chinese

nltk

jieba

快速开始

扁鹊（BianQue）

基于主动健康的主动性、预防性、精确性、个性化、共建共享、自律性六大特征，华南理工大学未来技术学院-广东省数字孪生人重点实验室开源了中文领域生活空间主动健康大模型基座ProactiveHealthGPT，包括：

经过千万规模中文健康对话数据指令微调的生活空间健康大模型扁鹊（BianQue）
经过百万规模心理咨询领域中文长文本指令与多轮共情对话数据联合指令微调的心理健康大模型灵心（SoulChat）

我们期望，生活空间主动健康大模型基座ProactiveHealthGPT 可以帮助学术界加速大模型在慢性病、心理咨询等主动健康领域的研究与应用。本项目为 生活空间健康大模型扁鹊（BianQue） 。

扁鹊健康大数据BianQueCorpus

我们经过调研发现，在健康领域，用户通常不会在一轮交互当中清晰地描述自己的问题，而当前常见的开源医疗问答模型（例如：ChatDoctor、本草(HuaTuo，原名华驼 )、DoctorGLM、MedicalGPT-zh）侧重于解决单轮用户描述的问题，而忽略了“用户描述可能存在不足”的情况。哪怕是当前大火的ChatGPT也会存在类似的问题：如果用户不强制通过文本描述让ChatGPT采用一问一答的形式，ChatGPT也偏向于针对用户的描述，迅速给出它认为合适的建议和方案。然而，实际的医生与用户交谈往往会存在“医生根据用户当前的描述进行持续多轮的询问”。并且医生在最后根据用户提供的信息综合给出建议，如下图所示。我们把医生不断问询的过程定义为 询问链（CoQ, Chain of Questioning） ，当模型处于询问链阶段，其下一个问题通常由对话上下文历史决定。

我们结合当前开源的中文医疗问答数据集（MedDialog-CN、IMCS-V2、CHIP-MDCFNPC、MedDG、cMedQA2、Chinese-medical-dialogue-data），分析其中的单轮/多轮特性以及医生问询特性，结合实验室长期自建的生活空间健康对话大数据，构建了千万级别规模的扁鹊健康大数据BianQueCorpus。对话数据通过“病人：xxx\n医生：xxx\n病人：xxx\n医生：”的形式统一为一种指令格式，如下图所示。

input: "病人：六岁宝宝拉大便都是一个礼拜或者10天才一次正常吗，要去医院检查什么项目\n医生：您好\n病人：六岁宝宝拉大便都是一个礼拜或者10天才一次正常吗，要去医院检查什么项目\n医生：宝宝之前大便什么样呢？多久一次呢\n病人：一般都是一个礼拜，最近这几个月都是10多天\n医生：大便干吗？\n病人：每次10多天拉的很多\n医生："
target: "成形还是不成形呢？孩子吃饭怎么样呢？"

训练数据当中混合了大量target文本为医生问询的内容而非直接的建议，这将有助于提升AI模型的问询能力。

使用方法

克隆本项目

cd ~
git clone https://github.com/scutcyr/BianQue.git

安装依赖需要注意的是torch的版本需要根据你的服务器实际的cuda版本选择，详情参考pytorch安装指南

cd BianQue
conda env create -n proactivehealthgpt_py38 --file proactivehealthgpt_py38.yml
conda activate proactivehealthgpt_py38

pip install cpm_kernels
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

【补充】Windows下的用户推荐参考如下流程配置环境

cd BianQue
conda create -n proactivehealthgpt_py38 python=3.8
conda activate proactivehealthgpt_py38
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116
pip install -r requirements.txt
pip install rouge_chinese nltk jieba datasets
# 以下安装为了运行demo
pip install streamlit
pip install streamlit_chat

【补充】Windows下配置CUDA-11.6：下载并且安装CUDA-11.6、下载cudnn-8.4.0，解压并且复制其中的文件到CUDA-11.6对应的路径，参考：win11下利用conda进行pytorch安装-cuda11.6-泛用安装思路
在Python当中调用BianQue-2.0模型：

import torch
from transformers import AutoModel, AutoTokenizer
# GPU设置
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
# 加载模型与tokenizer
model_name_or_path = 'scutcyr/BianQue-2'
model = AutoModel.from_pretrained(model_name_or_path, trust_remote_code=True).half()
model.to(device)
tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True)

# 单轮对话调用模型的chat函数
user_input = "我的宝宝发烧了，怎么办？"
input_text = "病人：" + user_input + "\n医生："
response, history = model.chat(tokenizer, query=input_text, history=None, max_length=2048, num_beams=1, do_sample=True, top_p=0.75, temperature=0.95, logits_processor=None)

# 多轮对话调用模型的chat函数
# 注意：本项目使用"\n病人："和"\n医生："划分不同轮次的对话历史
# 注意：user_history比bot_history的长度多1
user_history = ['你好', '我最近失眠了']
bot_history = ['我是利用人工智能技术，结合大数据训练得到的智能医疗问答模型扁鹊，你可以向我提问。']

# 拼接对话历史
context = "\n".join([f"病人：{user_history[i]}\n医生：{bot_history[i]}" for i in range(len(bot_history))])
input_text = context + "\n病人：" + user_history[-1] + "\n医生："

response, history = model.chat(tokenizer, query=input_text, history=None, max_length=2048, num_beams=1, do_sample=True, top_p=0.75, temperature=0.95, logits_processor=None)

启动服务

本项目提供了bianque_v2_app.py作为BianQue-2.0模型的使用示例，通过以下命令即可开启服务，然后，通过http://:9005访问。

streamlit run bianque_v2_app.py --server.port 9005

特别地，在bianque_v2_app.py当中，可以修改以下代码更换指定的显卡：

os.environ['CUDA_VISIBLE_DEVICES'] = '1'

对于Windows单显卡用户，需要修改为：os.environ['CUDA_VISIBLE_DEVICES'] = '0'，否则会报错！

可以通过更改以下代码指定模型路径为本地路径：

model_name_or_path = "scutcyr/BianQue-2"

我们还提供了bianque_v1_app.py作为BianQue-1.0模型的使用示例，以及bianque_v1_v2_app.py作为BianQue-1.0模型和BianQue-2.0模型的联合使用示例。

扁鹊-2.0

基于扁鹊健康大数据BianQueCorpus，我们选择了 ChatGLM-6B 作为初始化模型，经过全量参数的指令微调训练得到了新一代BianQue【BianQue-2.0】。与扁鹊-1.0模型不同的是，扁鹊-2.0扩充了药品说明书指令、医学百科知识指令以及ChatGPT蒸馏指令等数据，强化了模型的建议与知识查询能力。以下为两个测试样例。

样例1：宝宝特别喜欢打嗝，是什么原因啊，该怎么预防啊

样例2：我外婆近来身体越来越差了，带她去医院检查，医生说她得了肾静脉血栓，我们全家都很担心，医生开了很多注射用低分子量肝素钙，我想问它的药理毒理？

扁鹊-2.0与扁鹊-1.0联合使用，兼顾多轮问询与出色的健康建议能力

通过以下命令实现联合使用扁鹊-2.0与扁鹊-1.0构建主动健康服务：

streamlit run bianque_v1_v2_app.py --server.port 9005

以下为应用例子：前面若干轮为经过扁鹊-1.0模型进行问询的过程，最后一轮回复为经过扁鹊-2.0模型的回答。

扁鹊-1.0

扁鹊-1.0（BianQue-1.0） 是一个经过指令与多轮问询对话联合微调的医疗对话大模型。我们经过调研发现，在医疗领域，往往医生需要通过多轮问询才能进行决策，这并不是单纯的“指令-回复”模式。用户在咨询医生时，往往不会在最初就把完整的情况告知医生，因此医生需要不断进行询问，最后才能进行诊断并给出合理的建议。基于此，我们构建了 扁鹊-1.0（BianQue-1.0） ，拟在 强化AI系统的问询能力 ，从而达到模拟医生问诊的过程。我们把这种能力定义为“望闻问切”当中的“问”。综合考虑当前中文语言模型架构、参数量以及所需要的算力，我们采用了ClueAI/ChatYuan-large-v2作为基准模型，在8张 NVIDIA RTX 4090显卡上微调了1个epoch得到扁鹊-1.0（BianQue-1.0），用于训练的中文医疗问答指令与多轮问询对话混合数据集包含了超过900万条样本，这花费了大约16天的时间完成一个epoch的训练。我们将计划围绕扁鹊模型的“望闻问切”能力，结合医学专家知识、多模态技术、多生理信号计算等，进行多个版本的模型迭代研究。扁鹊（BianQue）模型欢迎你的贡献！我们鼓励你在 BianQue GitHub 页面报告问题、贡献 PR 并参与讨论。我们期待与更多的高校、医院、研究实验室、公司等进行合作，共同开展下一代扁鹊模型研究。对于此类需求（以及其他不适合在 GitHub 上提出的需求），请直接发送电子邮件至 eeyirongchen@mail.scut.edu.cn。

模型“问”能力示例

“望闻问切”四诊法由扁鹊发明。“四诊法”（望、闻、问、切），是中医诊病的基本方法。其中，“问”的能力可以被建模到语言模型当中。我们把AI模型的“问”能力定义为：
“问”能力：AI模型能够根据病人输入的信息，结合医学知识来进行恰当的问询，并且结合进一步的问询得到的病人的信息，给出“合适的诊断或建议”。“问”的过程通常是一个多轮对话过程。

以下是2个简单的例子：

例子1
用户：我最近感觉全身疲惫
扁鹊-1.0：是劳累了，还是熬夜了？
用户：这周都在熬夜赶论文
扁鹊-1.0：嗯，熬夜容易引起各种不适，如头晕、乏力、失眠、多梦等，多休息，可以口服谷维素、维生素B1和安神补脑液，避免熬夜。
例子2
用户：我最近经常失眠
扁鹊-1.0：失眠多久了？
用户：两周了
扁鹊-1.0：睡眠怎么样？
用户：上床几小时才睡得着
扁鹊-1.0：可以口服一些药物
用户：有具体推荐吗
扁鹊-1.0：需要先检查一下
用户：那我需要做什么检查？
扁鹊-1.0：心电图

使用方法

直接使用扁鹊-1.0模型

import os
from transformers import T5Tokenizer, T5ForConditionalGeneration, AutoTokenizer
import torch
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")


tokenizer = T5Tokenizer.from_pretrained("scutcyr/BianQue-1.0")
model = T5ForConditionalGeneration.from_pretrained("scutcyr/BianQue-1.0")
model = model.to(device)

def preprocess(text):
    text = text.replace("\n", "\\n").replace("\t", "\\t")
    return text

def postprocess(text):
    return text.replace("\\n", "\n").replace("\\t", "\t")

def answer(user_history, bot_history, sample=True, top_p=1, temperature=0.7):
    '''sample：是否抽样。生成任务，可以设置为True;
    top_p：0-1之间，生成的内容越多样
    max_new_tokens=512 lost...'''

    if len(bot_history)>0:
        context = "\n".join([f"病人：{user_history[i]}\n医生：{bot_history[i]}" for i in range(len(bot_history))])
        input_text = context + "\n病人：" + user_history[-1] + "\n医生："
    else:
        input_text = "病人：" + user_history[-1] + "\n医生："
        return "我是利用人工智能技术，结合大数据训练得到的智能医疗问答模型扁鹊，你可以向我提问。"
    

    input_text = preprocess(input_text)
    print(input_text)
    encoding = tokenizer(text=input_text, truncation=True, padding=True, max_length=768, return_tensors="pt").to(device) 
    if not sample:
        out = model.generate(**encoding, return_dict_in_generate=True, output_scores=False, max_new_tokens=512, num_beams=1, length_penalty=0.6)
    else:
        out = model.generate(**encoding, return_dict_in_generate=True, output_scores=False, max_new_tokens=512, do_sample=True, top_p=top_p, temperature=temperature, no_repeat_ngram_size=3)
    out_text = tokenizer.batch_decode(out["sequences"], skip_special_tokens=True)
    print('医生: '+postprocess(out_text[0]))
    return postprocess(out_text[0])

answer_text = answer(user_history=["你好！",
                                   "我最近经常失眠",
                                   "两周了",
                                   "上床几小时才睡得着"], 
                     bot_history=["我是利用人工智能技术，结合大数据训练得到的智能医疗问答模型扁鹊，你可以向我提问。",
                                  "失眠多久了？",
                                  "睡眠怎么样？"])

使用个人数据在扁鹊-1.0模型基础上进一步微调模型

环境创建
以下为在RTX 4090显卡，CUDA-11.6驱动配置下的环境配置

conda env create -n bianque_py38 --file py38_conda_env.yml
conda activate bianque_py38
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

数据集构建
参考.data/cMedialog_example.csv格式，构建你的数据集
基于扁鹊-1.0模型微调你的模型
修改./scripts/run_train_model_bianque.sh，通过绝对路径指定PREPROCESS_DATA，并且调整其他变量，然后运行：

cd scripts
bash run_train_model_bianque.sh

声明

扁鹊-1.0（BianQue-1.0） 当前仅经过1个epoch的训练，尽管模型具备了一定的医疗问询能力，但其仍然存在以下局限：

训练数据来源于开源数据集以及互联网，尽管我们采用了严格的数据清洗流程，数据集当中仍然不可避免地存在大量噪声，这会使得部分回复产生错误；
医生“问询”是一项复杂的能力，这是非医生群体所不具备的，当前的模型对于模拟“医生问询”过程是通过大量样本学习得到的，因此在问询过程当中，有可能出现一些奇异的提问风格。换一句话来说，当前版本的模型强化了“问”的能力，但是“望”、“闻”、“切”的能力仍待进一步研究！

**扁鹊-2.0（BianQue-2.0）**使用了ChatGLM-6B 模型的权重，需要遵循其MODEL_LICENSE，因此，本项目仅可用于您的非商业研究目的。

本项目提供的BianQue模型致力于提升大模型的健康对话能力（多轮问询及健康建议），然而，模型的输出文本具有一定的随机性，本项目不保证模型输出的文本完全适合于用户，用户在使用本模型时需要承担其带来的所有风险！
您不得出于任何商业、军事或非法目的使用、复制、修改、合并、发布、分发、复制或创建BianQue模型的全部或部分衍生作品。
您不得利用BianQue模型从事任何危害国家安全和国家统一、危害社会公共利益、侵犯人身权益的行为。
您在使用BianQue模型时应知悉，其不能替代医生、心理医生等专业人士，不应过度依赖、服从、相信模型的输出，不能过度依赖于与BianQue模型聊天获取的健康建议。

致谢

本项目由华南理工大学未来技术学院广东省数字孪生人重点实验室发起，得到了华南理工大学信息网络工程研究中心、电子与信息学院等学院部门的支撑，同时致谢广东省妇幼保健院、广州市妇女儿童医疗中心、中山大学附属第三医院、合肥综合性国家科学中心人工智能研究院等合作单位。

同时，我们感谢以下媒体或公众号对本项目的报道（排名不分先后）：

媒体报道人民日报、中国网、光明网、TOM科技、未来网、大众网、中国发展报道网、中国日报网、新华资讯网、中华网、今日头条、搜狐、腾讯新闻、网易新闻、中国资讯网、中国传播网、中国都市报道网、中华城市网
公众号广东实验室建设、智能语音新青年、深度学习与NLP、AINLP

引用

@misc{chen2023bianque,
      title={BianQue: Balancing the Questioning and Suggestion Ability of Health LLMs with Multi-turn Health Conversations Polished by ChatGPT}, 
      author={Yirong Chen and Zhenyu Wang and Xiaofen Xing and huimin zheng and Zhipei Xu and Kai Fang and Junhong Wang and Sihang Li and Jieling Wu and Qi Liu and Xiangmin Xu},
      year={2023},
      eprint={2310.15896},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

扁鹊（BianQue）快速上手指南

扁鹊（BianQue）是由华南理工大学开源的中文生活空间主动健康大模型。本项目包含两个主要版本：

BianQue-1.0：基于 ChatYuan 架构，专注于强化模型的“问询”能力（模拟医生多轮问诊）。
BianQue-2.0：基于 ChatGLM-6B 架构，增强了药品说明书、医学百科知识及健康建议能力。

1. 环境准备

在开始之前，请确保您的系统满足以下要求：

操作系统：Linux, Windows, macOS
Python 版本：3.8+
GPU 支持：推荐 NVIDIA GPU，需安装对应的 CUDA 驱动（示例中使用 CUDA 11.6）
显存要求：运行 6B 参数模型建议显存至少 8GB（量化后可更低），全量微调需更高配置。

2. 安装步骤

2.1 克隆项目

cd ~
git clone https://github.com/scutcyr/BianQue.git
cd BianQue

2.2 创建虚拟环境并安装依赖

Linux / macOS 用户

推荐使用提供的配置文件一键安装：

conda env create -n proactivehealthgpt_py38 --file proactivehealthgpt_py38.yml
conda activate proactivehealthgpt_py38

pip install cpm_kernels
# 请根据实际 CUDA 版本调整 torch 安装命令，此处以 cu116 为例
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

Windows 用户

Windows 用户建议手动逐步配置环境：

# 1. 创建环境
conda create -n proactivehealthgpt_py38 python=3.8
conda activate proactivehealthgpt_py38

# 2. 安装 PyTorch (以 CUDA 11.6 为例)
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

# 3. 安装其他依赖
pip install -r requirements.txt
pip install rouge_chinese nltk jieba datasets

# 4. 安装 Demo 运行所需组件
pip install streamlit
pip install streamlit_chat

注意：Windows 用户需自行下载并安装 CUDA 11.6 和 cuDNN 8.4.0，并将 cuDNN 文件复制到 CUDA 安装目录。

3. 基本使用

3.1 代码调用 BianQue-2.0（推荐）

BianQue-2.0 具备更强的知识问答和建议能力。以下是单轮和多轮对话的最小化示例：

import torch
from transformers import AutoModel, AutoTokenizer

# GPU 设置
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 加载模型与 tokenizer
model_name_or_path = 'scutcyr/BianQue-2'
model = AutoModel.from_pretrained(model_name_or_path, trust_remote_code=True).half()
model.to(device)
tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True)

# --- 单轮对话示例 ---
user_input = "我的宝宝发烧了，怎么办？"
# 注意输入格式需包含 "病人：" 和 "医生：" 前缀
input_text = "病人：" + user_input + "\n医生："

response, history = model.chat(
    tokenizer, 
    query=input_text, 
    history=None, 
    max_length=2048, 
    num_beams=1, 
    do_sample=True, 
    top_p=0.75, 
    temperature=0.95
)
print(response)

# --- 多轮对话示例 ---
# 构建历史对话上下文
user_history = ['你好', '我最近失眠了']
bot_history = ['我是利用人工智能技术，结合大数据训练得到的智能医疗问答模型扁鹊，你可以向我提问。']

# 拼接历史数据，格式为：病人：xxx\n医生：xxx\n...
context = "\n".join([f"病人：{user_history[i]}\n医生：{bot_history[i]}" for i in range(len(bot_history))])
input_text = context + "\n病人：" + user_history[-1] + "\n医生："

response, history = model.chat(
    tokenizer, 
    query=input_text, 
    history=None, 
    max_length=2048, 
    num_beams=1, 
    do_sample=True, 
    top_p=0.75, 
    temperature=0.95
)
print(response)

3.2 启动 Web 演示服务

项目提供了基于 Streamlit 的交互式界面，方便快速体验。

启动 BianQue-2.0 服务：

streamlit run bianque_v2_app.py --server.port 9005

启动后，在浏览器访问 http://<your_ip>:9005 即可使用。

Windows 单显卡用户特别注意：在运行 bianque_v2_app.py 前，请打开该文件，将指定显卡的代码修改为：
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
否则可能因默认识别错误导致报错。

3.3 联合使用（问诊 + 建议）

若需模拟完整的“先问询后建议”流程，可联合使用 BianQue-1.0（负责问诊）和 BianQue-2.0（负责最终建议）：

streamlit run bianque_v1_v2_app.py --server.port 9005

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 154.3k|★★☆☆☆|今天

开发框架Agent语言模型

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|1周前

语言模型图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|1周前

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85.1k|★★☆☆☆|3天前

图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。

★ 79.9k|★☆☆☆☆|5天前

语言模型数据工具其他

gpt4all

GPT4All 是一款让普通电脑也能轻松运行大型语言模型（LLM）的开源工具。它的核心目标是打破算力壁垒，让用户无需依赖昂贵的显卡（GPU）或云端 API，即可在普通的笔记本电脑和台式机上私密、离线地部署和使用大模型。对于担心数据隐私、希望完全掌控本地数据的企业用户、研究人员以及技术爱好者来说，GPT4All 提供了理想的解决方案。它解决了传统大模型必须联网调用或需要高端硬件才能运行的痛点，让日常设备也能成为强大的 AI 助手。无论是希望构建本地知识库的开发者，还是单纯想体验私有化 AI 聊天的普通用户，都能从中受益。技术上，GPT4All 基于高效的 `llama.cpp` 后端，支持多种主流模型架构（包括最新的 DeepSeek R1 蒸馏模型），并采用 GGUF 格式优化推理速度。它不仅提供界面友好的桌面客户端，支持 Windows、macOS 和 Linux 等多平台一键安装，还为开发者提供了便捷的 Python 库，可轻松集成到 LangChain 等生态中。通过简单的下载和配置，用户即可立即开始探索本地大模型的无限可能。

★ 77.3k|★☆☆☆☆|3天前

语言模型开发框架

使用场景

没有 BianQue 时

使用 BianQue 后

运行环境要求

快速开始

扁鹊（BianQue）

最近更新

扁鹊健康大数据BianQueCorpus

使用方法

扁鹊-2.0

扁鹊-2.0与扁鹊-1.0联合使用，兼顾多轮问询与出色的健康建议能力

扁鹊-1.0

模型“问”能力示例

使用方法

直接使用扁鹊-1.0模型

使用个人数据在扁鹊-1.0模型基础上进一步微调模型

声明

致谢

引用

扁鹊（BianQue）快速上手指南

1. 环境准备

2. 安装步骤

2.1 克隆项目

2.2 创建虚拟环境并安装依赖

Linux / macOS 用户

Windows 用户

3. 基本使用

3.1 代码调用 BianQue-2.0（推荐）

3.2 启动 Web 演示服务

3.3 联合使用（问诊 + 建议）

相似工具推荐

everything-claude-code

LLMs-from-scratch

NextChat

ML-For-Beginners

funNLP

gpt4all