[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-MarkWuNLP--MultiTurnResponseSelection":3,"tool-MarkWuNLP--MultiTurnResponseSelection":64},[4,18,28,36,44,52],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":24,"last_commit_at":25,"category_tags":26,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",159636,2,"2026-04-17T23:33:34",[14,13,27],"语言模型",{"id":29,"name":30,"github_repo":31,"description_zh":32,"stars":33,"difficulty_score":10,"last_commit_at":34,"category_tags":35,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[27,15,13,14],{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":24,"last_commit_at":42,"category_tags":43,"status":17},8553,"spec-kit","github\u002Fspec-kit","Spec Kit 是一款专为提升软件开发效率而设计的开源工具包，旨在帮助团队快速落地“规格驱动开发”（Spec-Driven Development）模式。传统开发中，需求文档往往与代码实现脱节，导致沟通成本高且结果不可控；而 Spec Kit 通过将规格说明书转化为可执行的指令，让 AI 直接依据明确的业务场景生成高质量代码，从而减少从零开始的随意编码，确保产出结果的可预测性。\n\n该工具特别适合希望利用 AI 辅助编程的开发者、技术负责人及初创团队。无论是启动全新项目还是在现有工程中引入规范化流程，用户只需通过简单的命令行操作，即可初始化项目并集成主流的 AI 编程助手。其核心技术亮点在于“规格即代码”的理念，支持社区扩展与预设模板，允许用户根据特定技术栈定制开发流程。此外，Spec Kit 强调官方维护的安全性，提供稳定的版本管理，帮助开发者在享受 AI 红利的同时，依然牢牢掌握架构设计的主动权，真正实现从“凭感觉写代码”到“按规格建系统”的转变。",88749,"2026-04-17T09:48:14",[27,15,13,14],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":24,"last_commit_at":50,"category_tags":51,"status":17},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[14,27],{"id":53,"name":54,"github_repo":55,"description_zh":56,"stars":57,"difficulty_score":24,"last_commit_at":58,"category_tags":59,"status":17},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",85092,"2026-04-10T11:13:16",[15,16,60,61,13,62,27,14,63],"视频","插件","其他","音频",{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":79,"owner_location":80,"owner_email":81,"owner_twitter":81,"owner_website":82,"owner_url":83,"languages":84,"stars":89,"forks":90,"last_commit_at":91,"license":81,"difficulty_score":92,"env_os":93,"env_gpu":94,"env_ram":94,"env_deps":95,"category_tags":100,"github_topics":81,"view_count":24,"oss_zip_url":81,"oss_zip_packed_at":81,"status":17,"created_at":101,"updated_at":102,"faqs":103,"releases":144},8917,"MarkWuNLP\u002FMultiTurnResponseSelection","MultiTurnResponseSelection","This repo contains our ACL 2017 paper data and source code ","MultiTurnResponseSelection 是一个专注于检索式聊天机器人的开源项目，核心提供了著名的“豆瓣对话语料库”及相关源代码。它主要解决了多轮对话场景中响应选择的难题，即如何让机器在复杂的上下文环境中，从候选回复中精准挑选出最自然、最贴切的回答。该项目发布了包含训练集、开发集和测试集的完整数据，其中测试集更是业界首个经过人工标注的多轮对话评测基准，极大地提升了模型评估的可靠性。\n\n其技术亮点在于实现了论文提出的“序列匹配网络（SMN）”架构，该架构擅长捕捉对话历史与候选回复之间的深层语义关联，显著优于传统的单轮匹配方法。代码基于 TensorFlow 构建，并提供了完整的预处理脚本和预训练词向量资源，方便用户复现论文结果或进行二次开发。\n\n这套工具非常适合自然语言处理领域的研究人员、算法工程师以及希望深入探索多轮对话技术的开发者使用。对于想要构建更智能客服系统或研究对话生成机制的团队来说，MultiTurnResponseSelection 提供了一套高质量的数据基础和经过验证的模型实现，是进入该细分领域的重要起点。","# Douban Conversation Corpus\n\n## Data set\nWe release Douban Conversation Corpus, comprising a training data set, a development set and a test set for retrieval based chatbot. The statistics of Douban Conversation Corpus are shown in the following table. \n\n|      |Train|Val| Test         | \n| ------------- |:-------------:|:-------------:|:-------------:|\n| session-response pairs  | 1m|50k| 10k |\n| Avg. positive response per session     | 1|1| 1.18    | \n| Fless Kappa | N\\A|N\\A|0.41      | \n| Min turn per session | 3|3| 3      | \n| Max ture per session | 98|91|45    | \n| Average turn per session | 6.69|6.75|5.95    | \n| Average Word per utterance | 18.56|18.50|20.74   | \n\n\nThe test data contains 1000 dialogue context, and for each context we create 10 responses as candidates. We recruited three labelers to judge if a candidate is a proper response to the session. A proper response means the response can naturally reply to the message given the context. Each pair received three labels and the majority of the labels was taken as the final decision.\n\n\u003Cbr>\nAs far as we known, this is the first human-labeled test set for retrieval-based chatbots. The entire corpus link https:\u002F\u002Fwww.dropbox.com\u002Fs\u002F90t0qtji9ow20ca\u002FDoubanConversaionCorpus.zip?dl=0\n\n\n## Data template\nlabel \\t conversation utterances (splited by \\t) \\t response\n\n\n## Source Code\nWe also release our source code to help others reproduce our result. The code has been tested under Ubuntu 14.04 with python 2.7. \n\nPlease first run preprocess.py and edit the code with the correct path, and it will give you a .bin file. After that, please run SMN_Last.py with the generated .bin file, and the training loss will be printed on the screen. If you set the train_flag = False, it will give your predicted score with your model. \n\nSome tips:\n\nThe 200-d word embedding is shared at https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jF0bjeaKHEUNwitA . The shared file is a list has 3 elements, one of which is a word2vec file. Please Download it and replace the input path (Training data) in my scripy. \n\nTensorflow resources:\n\nThe tensorflow code requires several data set, which has been uploaded on the following path:\n\nResource file: https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jGn5kPzsH03lnG6U \n\nWorddict file: https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jGrCjg8liK1wE-N9\n\nRequirement: tensorflow>=1.3\n\n\n## Reference\nPlease cite our paper if you use the data or code in this repos.\n\nWu, Yu, et al. \"Sequential Matching Network: A New Archtechture for Multi-turn Response Selection in Retrieval-based Chatbots.\" ACL. 2017.\n","# 豆瓣对话语料库\n\n## 数据集\n我们发布了豆瓣对话语料库，包含用于基于检索的聊天机器人训练的数据集、开发集和测试集。豆瓣对话语料库的统计信息如下表所示。\n\n|      |训练集|验证集| 测试集         | \n| ------------- |:-------------:|:-------------:|:-------------:|\n| 会话-回复对数  | 100万|5万| 1万 |\n| 每个会话的平均正向回复数     | 1|1| 1.18    | \n| Fless Kappa | 不适用|不适用|0.41      | \n| 每个会话的最少轮次 | 3|3| 3      | \n| 每个会话的最大轮次 | 98|91|45    | \n| 每个会话的平均轮次 | 6.69|6.75|5.95    | \n| 每条话语的平均词数 | 18.56|18.50|20.74   | \n\n\n测试数据包含1000个对话上下文，针对每个上下文我们生成了10个候选回复。我们招募了三位标注员来判断某个候选回复是否适合作为该会话的回应。所谓“合适的回应”，是指在给定上下文的情况下，该回复能够自然地对消息作出回应。每一对对话都会收到三份标注，最终以多数票决定作为最终结果。\n\n\u003Cbr>\n据我们所知，这是首个由人工标注的基于检索的聊天机器人测试集。整个语料库的下载链接为：https:\u002F\u002Fwww.dropbox.com\u002Fs\u002F90t0qtji9ow20ca\u002FDoubanConversaionCorpus.zip?dl=0\n\n\n## 数据模板\n标签 \\t 对话语句（以\\t分隔） \\t 回复\n\n\n## 源代码\n我们还发布了源代码，以帮助他人复现我们的实验结果。该代码已在Ubuntu 14.04系统上使用Python 2.7进行了测试。\n\n请首先运行preprocess.py脚本，并根据实际情况修改路径，运行后会生成一个.bin文件。随后，请使用生成的.bin文件运行SMN_Last.py脚本，训练过程中的损失值将会显示在屏幕上。如果将train_flag设置为False，则会输出使用您的模型预测得到的分数。\n\n一些提示：\n\n200维的词嵌入可以在以下链接共享：https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jF0bjeaKHEUNwitA 。共享文件包含三个元素，其中之一是一个word2vec格式的文件。请下载该文件，并替换我脚本中输入路径（训练数据）的位置。\n\nTensorFlow相关资源：\n\nTensorFlow代码需要若干数据集，这些数据集已上传至以下路径：\n\n资源文件：https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jGn5kPzsH03lnG6U \n\n词汇字典文件：https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jGrCjg8liK1wE-N9\n\n要求：tensorflow>=1.3\n\n\n## 参考文献\n如果您在本仓库中使用了数据或代码，请引用我们的论文。\n\nWu, Yu, et al. “序列匹配网络：一种用于基于检索的聊天机器人多轮回复选择的新架构。” ACL. 2017.","# MultiTurnResponseSelection 快速上手指南\n\n本指南基于豆瓣对话语料库（Douban Conversation Corpus）及 Sequential Matching Network (SMN) 模型，帮助开发者快速复现多轮对话响应选择任务。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Ubuntu 14.04 或更高版本（已在该环境测试通过）\n*   **Python 版本**：Python 2.7\n*   **核心依赖**：TensorFlow >= 1.3\n*   **数据资源**：需手动下载预训练词向量及字典文件（见下文安装步骤）\n\n## 安装步骤\n\n### 1. 获取源代码与数据\n克隆或下载本项目源代码。随后，请下载以下必需的资源文件：\n\n*   **数据集**：[Douban Conversation Corpus](https:\u002F\u002Fwww.dropbox.com\u002Fs\u002F90t0qtji9ow20ca\u002FDoubanConversaionCorpus.zip?dl=0)\n*   **200 维词向量 (Word Embedding)**：[下载链接](https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jF0bjeaKHEUNwitA)\n    *   *注意*：下载后解压，找到其中的 word2vec 文件。\n*   **TensorFlow 资源文件**：[Resource file](https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jGn5kPzsH03lnG6U)\n*   **词典文件 (Worddict)**：[Worddict file](https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jGrCjg8liK1wE-N9)\n\n> **提示**：由于原始资源托管于 Dropbox 和 OneDrive，国内访问可能较慢。建议使用代理工具加速下载，或寻找社区提供的国内镜像源。\n\n### 2. 配置路径\n下载完成后，您需要修改源代码中的文件路径以指向本地文件位置。\n\n打开 `preprocess.py`，找到输入数据路径部分，将其修改为您存放**训练数据**和**词向量文件**的实际路径。\n\n### 3. 安装 Python 依赖\n确保已安装 TensorFlow 1.3 及以上版本：\n\n```bash\npip install tensorflow>=1.3\n```\n\n## 基本使用\n\n完成环境配置后，按照以下两个步骤运行模型：\n\n### 第一步：数据预处理\n运行预处理脚本生成二进制数据文件 (`.bin`)。\n\n```bash\npython preprocess.py\n```\n*执行成功后，当前目录下将生成处理好的 `.bin` 文件。*\n\n### 第二步：训练或预测\n使用生成的 `.bin` 文件运行主程序 `SMN_Last.py`。\n\n**场景 A：开始训练模型**\n直接运行脚本，屏幕将打印训练损失 (Training Loss)。\n\n```bash\npython SMN_Last.py\n```\n\n**场景 B：使用模型进行预测**\n若需使用已有模型进行评分预测，请在代码中将 `train_flag` 参数设置为 `False`，然后运行：\n\n```bash\n# 需先编辑 SMN_Last.py，设置 train_flag = False\npython SMN_Last.py\n```\n*运行后将输出模型对候选响应的预测分数。*\n\n---\n**引用说明**：如果您在研究中使用了本项目的数据或代码，请务必引用以下论文：\n> Wu, Yu, et al. \"Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-based Chatbots.\" ACL. 2017.","某电商团队正在开发一款基于检索的智能客服机器人，需要让系统根据用户的历史多轮对话记录，从海量候选回复中精准匹配出最自然的回答。\n\n### 没有 MultiTurnResponseSelection 时\n- **上下文理解断裂**：传统模型往往只关注最后一句用户输入，忽略了前几轮的对话脉络，导致回复“断片”，无法承接上文逻辑。\n- **人工评估成本高昂**：缺乏像 Douban 语料库这样经过三人标注、包含明确正负样本的大规模测试集，团队难以量化评估模型在多轮场景下的真实表现。\n- **匹配精度低下**：由于缺少 Sequential Matching Network (SMN) 等专用架构，系统难以捕捉长对话中的深层语义依赖，常出现答非所问或机械重复的情况。\n- **复现与迭代困难**：没有开源的预处理脚本和预训练词向量资源，算法工程师需从零构建数据管道，极大拖慢了研发进度。\n\n### 使用 MultiTurnResponseSelection 后\n- **全链路语境感知**：利用 SMN 架构对完整对话序列进行建模，机器人能准确识别指代关系和情感变化，回复如同真人般连贯自然。\n- **标准化评测体系**：直接复用包含 1000 个多轮上下文及人工标注标签的测试集，团队可快速计算 Fless Kappa 等指标，客观验证优化效果。\n- **显著提升响应质量**：基于 100 万组会话 - 回复对的训练，模型在复杂多轮交互中的命中率大幅提升，有效减少了无效沟通。\n- **快速落地验证**：借助提供的 Python 预处理代码、TensorFlow 实现及预训练资源，团队可在 Ubuntu 环境下迅速复现基准结果并开展定制化微调。\n\nMultiTurnResponseSelection 通过提供权威的多轮对话数据集与核心算法实现，彻底解决了检索式聊天机器人在长上下文理解与标准化评估上的两大难题。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FMarkWuNLP_MultiTurnResponseSelection_18789198.png","MarkWuNLP","Yu Wu (吴俣)","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FMarkWuNLP_f5b335f5.jpg","Senior Researcher @ Microsoft Research Asia","Microsoft Research","Beijing, China",null,"https:\u002F\u002Fscholar.google.co.jp\u002Fcitations?user=aQizmzsAAAAJ&hl=en","https:\u002F\u002Fgithub.com\u002FMarkWuNLP",[85],{"name":86,"color":87,"percentage":88},"Python","#3572A5",100,729,187,"2026-04-14T21:52:37",4,"Linux","未说明",{"notes":96,"python":97,"dependencies":98},"代码已在 Ubuntu 14.04 环境下测试通过。运行前需先执行 preprocess.py 生成.bin 文件，并手动配置正确的数据路径。此外，需要单独下载 200 维词向量文件、资源文件及词典文件，并替换脚本中的输入路径方可运行。","2.7",[99],"tensorflow>=1.3",[27,16],"2026-03-27T02:49:30.150509","2026-04-18T14:13:05.717294",[104,109,114,119,124,129,134,139],{"id":105,"question_zh":106,"answer_zh":107,"source_url":108},39979,"如何获取或生成项目所需的 word2vec.model 文件？","该文件未直接提供，但可以使用 Python 的 gensim 库自行训练生成。训练时输入应为所有用于训练的句子数据。","https:\u002F\u002Fgithub.com\u002FMarkWuNLP\u002FMultiTurnResponseSelection\u002Fissues\u002F7",{"id":110,"question_zh":111,"answer_zh":112,"source_url":113},39980,"在哪里可以下载完整的豆瓣（Douban）数据集和预训练的二进制文件？","作者曾通过 OneDrive 链接分享数据（https:\u002F\u002F1drv.ms\u002Fu\u002Fs!AtcxwlQuQjw1jF0bjeaKHEUNwitA），所有人都可免费下载。如果链接失效，可以尝试发送邮件给作者索取。此外，Liu Yang 基于提供的词嵌入文件重新实现了代码，也可作为参考。","https:\u002F\u002Fgithub.com\u002FMarkWuNLP\u002FMultiTurnResponseSelection\u002Fissues\u002F11",{"id":115,"question_zh":116,"answer_zh":117,"source_url":118},39981,"在 TensorFlow 版本中，action、true_utt 和 negs 有什么区别？它们是如何用于负采样的？","action 是所有回复的全集；true_utt 是原始消息对应的真实回复（即正例 m_i 对应 r_i）；negs 是随机抽取的一个回复 r_j（即负例 m_i 对应 r_j）。虽然在数据内容上 action 和 true_utt 可能相同，但在实际使用时，action 中的 utterance 会被随机抽取，从而达到负采样的效果。","https:\u002F\u002Fgithub.com\u002FMarkWuNLP\u002FMultiTurnResponseSelection\u002Fissues\u002F21",{"id":120,"question_zh":121,"answer_zh":122,"source_url":123},39982,"SMN 模型输入时，response candidate 必须传入完整句子还是只需传入 ID？","必须传入完整的句子，而不能只传 ID。因为如果只传 ID 会丢失 response 的词特征，导致模型无法正常运行。虽然 response 有一个固定的库，且 conversation 和 response 在正例上一一对应，但源码实现需要完整的文本输入。","https:\u002F\u002Fgithub.com\u002FMarkWuNLP\u002FMultiTurnResponseSelection\u002Fissues\u002F2",{"id":125,"question_zh":126,"answer_zh":127,"source_url":128},39983,"在 Ubuntu Dialogue Corpus (UDC) 上训练模型需要多少个 epoch？","通常只需要 1 到 2 个 epoch。使用 Adam 优化器时模型很容易拟合。","https:\u002F\u002Fgithub.com\u002FMarkWuNLP\u002FMultiTurnResponseSelection\u002Fissues\u002F28",{"id":130,"question_zh":131,"answer_zh":132,"source_url":133},39984,"项目使用了什么方法进行中文分词（Tokenize）？","作者使用的是微软内部的分词工具进行预处理。由于微软的政策限制，该工具无法公开分享。建议用户寻找其他合适的中文分词工具（如 jieba 等）来处理新数据。","https:\u002F\u002Fgithub.com\u002FMarkWuNLP\u002FMultiTurnResponseSelection\u002Fissues\u002F23",{"id":135,"question_zh":136,"answer_zh":137,"source_url":138},39985,"为什么在计算 M2 时要添加矩阵 A，而不是像 M1 一样直接相乘？","这是为了引入特定的注意力机制或变换逻辑。具体数学推导和结构差异请参考论文中的公式定义及作者提供的示意图（见原 Issue 评论中的图片链接），添加矩阵 A 是为了更好地捕捉上下文交互特征，区别于简单的点积操作。","https:\u002F\u002Fgithub.com\u002FMarkWuNLP\u002FMultiTurnResponseSelection\u002Fissues\u002F33",{"id":140,"question_zh":141,"answer_zh":142,"source_url":143},39986,"embedding.pkl 文件是如何生成的？对应的词典文件是什么？","该文件是基于提供的词嵌入数据生成的二进制文件。作者提到 Liu Yang 已经基于提供的 word embedding 文件重新实现了工作。关于具体的词字典文件（word_id -> word），通常需要与 embedding 文件配套使用，若需复现结果，建议参考复现者的代码或直接联系作者获取详细的映射关系。","https:\u002F\u002Fgithub.com\u002FMarkWuNLP\u002FMultiTurnResponseSelection\u002Fissues\u002F12",[]]