[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-williamSYSU--TextGAN-PyTorch":3,"tool-williamSYSU--TextGAN-PyTorch":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":80,"owner_location":81,"owner_email":82,"owner_twitter":83,"owner_website":84,"owner_url":85,"languages":86,"stars":91,"forks":92,"last_commit_at":93,"license":94,"difficulty_score":95,"env_os":96,"env_gpu":97,"env_ram":98,"env_deps":99,"category_tags":108,"github_topics":109,"view_count":10,"oss_zip_url":83,"oss_zip_packed_at":83,"status":16,"created_at":119,"updated_at":120,"faqs":121,"releases":152},288,"williamSYSU\u002FTextGAN-PyTorch","TextGAN-PyTorch","TextGAN is a PyTorch framework for Generative Adversarial Networks (GANs) based text generation models.","TextGAN-PyTorch 是一个基于 PyTorch 深度学习框架的开源文本生成工具，专门用于实现基于生成对抗网络（GAN）的各种文本生成模型。简单来说，它能帮助计算机学习如何“写”出自然流畅的文字。\n\n这个项目解决了两个主要问题：首先，很多先进的文本生成技术都是用 TensorFlow 实现的，但如果你更熟悉 PyTorch，学习成本会比较高；其次，TextGAN-PyTorch 整合了多种主流的 GAN 文本生成模型（如 SeqGAN、LeakGAN、RelGAN 等），并提供了统一的代码框架，相当于为研究者搭建了一个便捷的实验平台。\n\nTextGAN-PyTorch 特别适合以下用户：机器学习和自然语言处理领域的研究人员、想学习 GAN 文本生成技术的学生、以及需要在项目中快速实验不同文本生成模型的开发者。对于需要生成特定类别文本（如情感文本、新闻文章等）的应用场景，它也提供了专门的类别文本生成模型支持。\n\n技术上，TextGAN-PyTorch 的亮点在于它同时支持通用文本生成和类别感知的文本生成，并且实现了超过 10 种不同的 GAN 变体。此外，项目还提供了完整的数据","TextGAN-PyTorch 是一个基于 PyTorch 深度学习框架的开源文本生成工具，专门用于实现基于生成对抗网络（GAN）的各种文本生成模型。简单来说，它能帮助计算机学习如何“写”出自然流畅的文字。\n\n这个项目解决了两个主要问题：首先，很多先进的文本生成技术都是用 TensorFlow 实现的，但如果你更熟悉 PyTorch，学习成本会比较高；其次，TextGAN-PyTorch 整合了多种主流的 GAN 文本生成模型（如 SeqGAN、LeakGAN、RelGAN 等），并提供了统一的代码框架，相当于为研究者搭建了一个便捷的实验平台。\n\nTextGAN-PyTorch 特别适合以下用户：机器学习和自然语言处理领域的研究人员、想学习 GAN 文本生成技术的学生、以及需要在项目中快速实验不同文本生成模型的开发者。对于需要生成特定类别文本（如情感文本、新闻文章等）的应用场景，它也提供了专门的类别文本生成模型支持。\n\n技术上，TextGAN-PyTorch 的亮点在于它同时支持通用文本生成和类别感知的文本生成，并且实现了超过 10 种不同的 GAN 变体。此外，项目还提供了完整的数据集和预训练模型，方便用户直接上手实验。如果你想在 PyTorch 生态中开展文本生成相关的研究或应用，这个开源项目是一个不错的起点。","# TextGAN-PyTorch\n\nTextGAN is a PyTorch framework for Generative Adversarial Networks (GANs) based text generation models, including general text generation models and category text generation models. TextGAN serves as a benchmarking platform to support research on GAN-based text generation models. Since most GAN-based text generation models are implemented by Tensorflow, TextGAN can help those who get used to PyTorch to enter the text generation field faster.\n\nIf you find any mistake in my implementation, please let me know! Also, please feel free to contribute to this repository if you want to add other models.\n\n![LICENSE](https:\u002F\u002Fimg.shields.io\u002Fpackagist\u002Fl\u002Fdoctrine\u002Form.svg)\n![Contributions welcome](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fcontributions-welcome-brightgreen.svg)\n\n## Requirements\n\n- **PyTorch >= 1.1.0**\n- Python 3.6\n- Numpy 1.14.5\n- CUDA 7.5+ (For GPU)\n- nltk 3.4\n- tqdm 4.32.1\n- KenLM (https:\u002F\u002Fgithub.com\u002Fkpu\u002Fkenlm)\n\nTo install, run `pip install -r requirements.txt`. In case of CUDA problems, consult the official PyTorch [Get Started guide](https:\u002F\u002Fpytorch.org\u002Fget-started\u002Flocally\u002F).\n\n## KenLM Installation\n\n- Download stable release and unzip: http:\u002F\u002Fkheafield.com\u002Fcode\u002Fkenlm.tar.gz\n\n- Need Boost >= 1.42.0 and bjam\n\n  - Ubuntu: `sudo apt-get install libboost-all-dev`\n  - Mac: `brew install boost; brew install bjam`\n\n- Run *within* kenlm directory:\n\n  ```bash\n  mkdir -p build\n  cd build\n  cmake ..\n  make -j 4\n  ```\n\n- `pip install https:\u002F\u002Fgithub.com\u002Fkpu\u002Fkenlm\u002Farchive\u002Fmaster.zip`\n\n- For more information on KenLM see: https:\u002F\u002Fgithub.com\u002Fkpu\u002Fkenlm and http:\u002F\u002Fkheafield.com\u002Fcode\u002Fkenlm\u002F\n\n## Implemented Models and Original Papers\n\n### General Text Generation\n\n- **SeqGAN** - [SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient](https:\u002F\u002Farxiv.org\u002Fabs\u002F1609.05473)\n- **LeakGAN** - [Long Text Generation via Adversarial Training with Leaked Information](https:\u002F\u002Farxiv.org\u002Fabs\u002F1709.08624)\n- **MaliGAN** - [Maximum-Likelihood Augmented Discrete Generative Adversarial Networks](https:\u002F\u002Farxiv.org\u002Fabs\u002F1702.07983)\n- **JSDGAN** - [Adversarial Discrete Sequence Generation without Explicit Neural Networks as Discriminators](http:\u002F\u002Fproceedings.mlr.press\u002Fv89\u002Fli19g.html)\n- **RelGAN** - [RelGAN: Relational Generative Adversarial Networks for Text Generation](https:\u002F\u002Fopenreview.net\u002Fforum?id=rJedV3R5tm)\n- **DPGAN** - [DP-GAN: Diversity-Promoting Generative Adversarial Network for Generating Informative and Diversified Text](https:\u002F\u002Farxiv.org\u002Fabs\u002F1802.01345)\n- **DGSAN** - [DGSAN: Discrete Generative Self-Adversarial Network](https:\u002F\u002Farxiv.org\u002Fabs\u002F1908.09127)\n- **CoT** - [CoT: Cooperative Training for Generative Modeling of Discrete Data](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.03782)\n\n### Category Text Generation\n\n- **SentiGAN** - [SentiGAN: Generating Sentimental Texts via Mixture Adversarial Networks](https:\u002F\u002Fwww.ijcai.org\u002Fproceedings\u002F2018\u002F618)\n- **CatGAN** (ours) - [CatGAN: Category-aware Generative Adversarial Networks with Hierarchical Evolutionary Learning for Category Text Generation](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.06641)\n\n## Get Started\n\n- Get Started\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch.git\ncd TextGAN-PyTorch\n```\n\n- For real data experiments, all datasets (`Image COCO`, `EMNLP NEWs`, `Movie Review`, `Amazon Review`) can be downloaded from [here](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1XvT3GqbK1wh3XhTgqBLWUtH_mLzGnKZP?usp=sharing). \n- Run with a specific model\n\n```bash\ncd run\npython3 run_[model_name].py 0 0\t# The first 0 is job_id, the second 0 is gpu_id\n\n# For example\npython3 run_seqgan.py 0 0\n```\n\n## Features\n\n1. **Instructor**\n\n   For each model, the entire runing process is defined in `instructor\u002Foracle_data\u002Fseqgan_instructor.py`. (Take SeqGAN in Synthetic data experiment for example). Some basic functions like `init_model()`and `optimize()` are defined in the base class `BasicInstructor` in `instructor.py`. If you want to add a new GAN-based text generation model, please create a new instructor under `instructor\u002Foracle_data` and define the training process for the model.\n\n2. **Visualization**\n   \n   Use `utils\u002Fvisualization.py` to visualize the log file, including model loss and metrics scores. Custom your log files in `log_file_list`, no more than `len(color_list)`. The log filename should exclude `.txt`.\n   \n3. **Logging**\n\n   The TextGAN-PyTorch use the `logging` module in Python to record the running process, like generator's loss and metric scores. For the convenience of visualization, there would be two same log file saved in `log\u002Flog_****_****.txt` and `save\u002F**\u002Flog.txt` respectively. Furthermore, The code would automatically save the state dict of models and a batch-size of generator's samples in `.\u002Fsave\u002F**\u002Fmodels` and `.\u002Fsave\u002F**\u002Fsamples` per log step, where `**` depends on your hyper-parameters.\n   \n4. **Running Signal**\n\n   You can easily control the training process with the class `Signal` (please refer to `utils\u002Fhelpers.py`) based on dictionary file `run_signal.txt`.\n\n   For using the `Signal`, just edit the local file `run_signal.txt` and set `pre_sig` to `Fasle` for example, the program will stop pre-training process and step into next training phase. It is convenient to early stop the training if you think the current training is enough.\n\n5. **Automatiaclly select GPU**\n\n   In `config.py`, the program would automatically select a GPU device with the least `GPU-Util` in `nvidia-smi`. This feature is enabled by default. If you want to manually select a GPU device, please uncomment the `--device` args in `run_[run_model].py` and specify a GPU device with command.\n\n## Implementation Details\n\n### SeqGAN\n\n- run file: [run_seqgan.py](run\u002Frun_seqgan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fseqgan_instructor.py), [real_data](instructor\u002Freal_data\u002Fseqgan_instructor.py)\n\n- Models: [generator](models\u002FSeqGAN_G.py), [discriminator](models\u002FSeqGAN_D.py)\n\n- Structure (from [SeqGAN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1609.05473.pdf))\n\n  ![model_seqgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_fbeb84746ca8.png)\n\n### LeakGAN\n\n- run file: [run_leakgan.py](run\u002Frun_leakgan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fleakgan_instructor.py), [real_data](instructor\u002Freal_data\u002Fleakgan_instructor.py)\n\n- Models: [generator](models\u002FLeakGAN_G.py), [discriminator](models\u002FLeakGAN_D.py)\n\n- Structure (from [LeakGAN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1709.08624.pdf))\n\n  ![model_leakgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_e6b01831b6d5.png)\n\n### MaliGAN\n\n- run file: [run_maligan.py](run\u002Frun_maligan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fmaligan_instructor.py), [real_data](instructor\u002Freal_data\u002Fmaligan_instructor.py)\n\n- Models: [generator](models\u002FMaliGAN_G.py), [discriminator](models\u002FMaliGAN_D.py)\n\n- Structure (from my understanding)\n\n  ![model_maligan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_e21d1fcada07.png)\n\n### JSDGAN\n\n- run file: [run_jsdgan.py](run\u002Frun_jsdgan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fjsdgan_instructor.py), [real_data](instructor\u002Freal_data\u002Fjsdgan_instructor.py)\n\n- Models: [generator](models\u002FJSDGAN_G.py) (No discriminator)\n\n- Structure (from my understanding)\n\n  ![model_jsdgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_bcc23cf20d72.png)\n\n### RelGAN\n\n- run file: [run_relgan.py](run\u002Frun_relgan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Frelgan_instructor.py), [real_data](instructor\u002Freal_data\u002Frelgan_instructor.py)\n\n- Models: [generator](models\u002FRelGAN_G.py), [discriminator](models\u002FRelGAN_D.py)\n\n- Structure  (from my understanding)\n\n  ![model_relgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_9bd95f1b0452.png)\n  \n### DPGAN\n\n- run file: [run_dpgan.py](run\u002Frun_dpgan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fdpgan_instructor.py), [real_data](instructor\u002Freal_data\u002Fdpgan_instructor.py)\n\n- Models: [generator](models\u002FDPGAN_G.py), [discriminator](models\u002FDPGAN_D.py)\n\n- Structure  (from [DPGAN](https:\u002F\u002Farxiv.org\u002Fabs\u002F1802.01345))\n\n  ![model_dpgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_f34b8292066a.png)\n  \n### DGSAN\n\n- run file: [run_dgsan.py](run\u002Frun_dgsan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fdgsan_instructor.py), [real_data](instructor\u002Freal_data\u002Fdgsan_instructor.py)\n\n- Models: [generator](models\u002FDGSAN_G.py), [discriminator](models\u002FDGSAN_D.py)\n\n### CoT\n\n- run file: [run_cot.py](run\u002Frun_cot.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fcot_instructor.py), [real_data](instructor\u002Freal_data\u002Fcot_instructor.py)\n\n- Models: [generator](models\u002FCoT_G.py), [discriminator](models\u002FCoT_D.py)\n\n- Structure  (from [CoT](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.03782))\n\n  ![model_cot](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_5b2457e1da04.png)\n\n### SentiGAN\n\n- run file: [run_sentigan.py](run\u002Frun_sentigan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fsentigan_instructor.py), [real_data](instructor\u002Freal_data\u002Fsentigan_instructor.py)\n\n- Models: [generator](models\u002FSentiGAN_G.py), [discriminator](models\u002FSentiGAN_D.py)\n\n- Structure (from [SentiGAN](https:\u002F\u002Fwww.ijcai.org\u002Fproceedings\u002F2018\u002F0618.pdf))\n\n  ![model_sentigan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_430304fc5fae.png)\n\n### CatGAN\n\n- run file: [run_catgan.py](run\u002Frun_catgan.py)\n\n- Instructors: [oracle_data](instructor\u002Foracle_data\u002Fcatgan_instructor.py), [real_data](instructor\u002Freal_data\u002Fcatgan_instructor.py)\n\n- Models: [generator](models\u002FCatGAN_G.py), [discriminator](models\u002FCatGAN_D.py)\n\n- Structure (from [CatGAN](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.06641))\n\n  ![model_catgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_5d22d19b59c7.png)\n\n  \n\n## Licence\n\n**MIT lincense**\n\n","# TextGAN-PyTorch\n\nTextGAN 是一个基于 PyTorch 的生成对抗网络（GANs）文本生成模型框架，包括通用文本生成模型和类别文本生成模型。TextGAN 作为基准测试平台，支持基于 GAN 的文本生成模型研究。由于大多数基于 GAN 的文本生成模型都是用 Tensorflow 实现的，TextGAN 可以帮助习惯使用 PyTorch 的研究者更快地进入文本生成领域。\n\n如果您发现我的实现中有任何错误，请告诉我！此外，如果您想添加其他模型，欢迎为此仓库做出贡献。\n\n![LICENSE](https:\u002F\u002Fimg.shields.io\u002Fpackagist\u002Fl\u002Fdoctrine\u002Form.svg)\n![Contributions welcome](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fcontributions-welcome-brightgreen.svg)\n\n## 依赖环境\n\n- **PyTorch >= 1.1.0**\n- Python 3.6\n- Numpy 1.14.5\n- CUDA 7.5+ (用于 GPU)\n- nltk 3.4\n- tqdm 4.32.1\n- KenLM (https:\u002F\u002Fgithub.com\u002Fkpu\u002Fkenlm)\n\n安装依赖请运行 `pip install -r requirements.txt`。如遇到 CUDA 问题，请查阅官方 PyTorch [入门指南](https:\u002F\u002Fpytorch.org\u002Fget-started\u002Flocally\u002F)。\n\n## KenLM 安装\n\n- 下载稳定版本并解压：http:\u002F\u002Fkheafield.com\u002Fcode\u002Fkenlm.tar.gz\n\n- 需要 Boost >= 1.42.0 和 bjam\n\n  - Ubuntu: `sudo apt-get install libboost-all-dev`\n  - Mac: `brew install boost; brew install bjam`\n\n- 在 kenlm 目录下运行：\n\n  ```bash\n  mkdir -p build\n  cd build\n  cmake ..\n  make -j 4\n  ```\n\n- `pip install https:\u002F\u002Fgithub.com\u002Fkpu\u002Fkenlm\u002Farchive\u002Fmaster.zip`\n\n- 更多信息请查看：https:\u002F\u002Fgithub.com\u002Fkpu\u002Fkenlm 和 http:\u002F\u002Fkheafield.com\u002Fcode\u002Fkenlm\u002F\n\n## 已实现的模型及原始论文\n\n### 通用文本生成\n\n- **SeqGAN** - [SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient](https:\u002F\u002Farxiv.org\u002Fabs\u002F1609.05473)\n- **LeakGAN** - [Long Text Generation via Adversarial Training with Leaked Information](https:\u002F\u002Farxiv.org\u002Fabs\u002F1709.08624)\n- **MaliGAN** - [Maximum-Likelihood Augmented Discrete Generative Adversarial Networks](https:\u002F\u002Farxiv.org\u002Fabs\u002F1702.07983)\n- **JSDGAN** - [Adversarial Discrete Sequence Generation without Explicit Neural Networks as Discriminators](http:\u002F\u002Fproceedings.mlr.press\u002Fv89\u002Fli19g.html)\n- **RelGAN** - [RelGAN: Relational Generative Adversarial Networks for Text Generation](https:\u002F\u002Fopenreview.net\u002Fforum?id=rJedV3R5tm)\n- **DPGAN** - [DP-GAN: Diversity-Promoting Generative Adversarial Network for Generating Informative and Diversified Text](https:\u002F\u002Farxiv.org\u002Fabs\u002F1802.01345)\n- **DGSAN** - [DGSAN: Discrete Generative Self-Adversarial Network](https:\u002F\u002Farxiv.org\u002Fabs\u002F1908.09127)\n- **CoT** - [CoT: Cooperative Training for Generative Modeling of Discrete Data](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.03782)\n\n### 类别文本生成\n\n- **SentiGAN** - [SentiGAN: Generating Sentimental Texts via Mixture Adversarial Networks](https:\u002F\u002Fwww.ijcai.org\u002Fproceedings\u002F2018\u002F618)\n- **CatGAN** (我们的模型) - [CatGAN: Category-aware Generative Adversarial Networks with Hierarchical Evolutionary Learning for Category Text Generation](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.06641)\n\n## 快速开始\n\n- 快速开始\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch.git\ncd TextGAN-PyTorch\n```\n\n- 对于真实数据实验，所有数据集（`Image COCO`、`EMNLP NEWs`、`Movie Review`、`Amazon Review`）都可以从[这里](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1XvT3GqbK1wh3XhTgqBLWUtH_mLzGnKZP?usp=sharing)下载。\n- 运行特定模型\n\n```bash\ncd run\npython3 run_[model_name].py 0 0\t# 第一个 0 是 job_id，第二个 0 是 gpu_id\n\n# 例如\npython3 run_seqgan.py 0 0\n```\n\n## 功能特性\n\n1. **训练器（Instructor）**\n\n   对于每个模型，整个运行过程都定义在 `instructor\u002Foracle_data\u002Fseqgan_instructor.py` 中（以合成数据实验中的 SeqGAN 为例）。一些基本函数如 `init_model()` 和 `optimize()` 定义在基类 `BasicInstructor` 的 `instructor.py` 中。如果您想添加新的基于 GAN 的文本生成模型，请在 `instructor\u002Foracle_data` 下创建新的训练器并定义模型的训练过程。\n\n2. **可视化（Visualization）**\n   \n   使用 `utils\u002Fvisualization.py` 可视化日志文件，包括模型损失和评估指标分数。在 `log_file_list` 中自定义您的日志文件，数量不超过 `len(color_list)`。日志文件名应去掉 `.txt` 后缀。\n   \n3. **日志记录（Logging）**\n\n   TextGAN-PyTorch 使用 Python 的 `logging` 模块记录运行过程，如生成器的损失和评估指标分数。为了便于可视化，会有两个相同的日志文件分别保存在 `log\u002Flog_****_****.txt` 和 `save\u002F**\u002Flog.txt` 中。此外，代码会自动将模型的状态字典和一批生成器样本保存在 `.\u002Fsave\u002F**\u002Fmodels` 和 `.\u002Fsave\u002F**\u002Fsamples` 中（每 log 一步保存一次），其中 `**` 取决于您的超参数。\n   \n4. **运行信号（Running Signal）**\n\n   您可以使用 `Signal` 类（请参考 `utils\u002Fhelpers.py`）基于字典文件 `run_signal.txt` 轻松控制训练过程。\n\n   使用 `Signal` 时，只需编辑本地文件 `run_signal.txt` 并将 `pre_sig` 设置为 `False`（例如），程序将停止预训练并进入下一训练阶段。如果您认为当前训练已经足够，这可以方便地提前停止训练。\n\n5. **自动选择 GPU**\n\n   在 `config.py` 中，程序会自动选择 `nvidia-smi` 中 GPU 使用率（GPU-Util）最低的 GPU 设备。此功能默认启用。如果您想手动选择 GPU 设备，请在 `run_[run_model].py` 中取消注释 `--device` 参数并通过命令指定 GPU 设备。\n\n## 实现细节\n\n### SeqGAN\n\n- 运行文件：[run_seqgan.py](run\u002Frun_seqgan.py)\n\n- 训练器：[oracle_data](instructor\u002Foracle_data\u002Fseqgan_instructor.py)，[real_data](instructor\u002Freal_data\u002Fseqgan_instructor.py)\n\n- 模型：[生成器](models\u002FSeqGAN_G.py)，[判别器](models\u002FSeqGAN_D.py)\n\n- 结构图（来自 [SeqGAN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1609.05473.pdf)）\n\n  ![model_seqgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_fbeb84746ca8.png)\n\n### LeakGAN\n\n- 运行文件：[run_leakgan.py](run\u002Frun_leakgan.py)\n\n- 训练器：[oracle_data](instructor\u002Foracle_data\u002Fleakgan_instructor.py)，[real_data](instructor\u002Freal_data\u002Fleakgan_instructor.py)\n\n- 模型：[生成器](models\u002FLeakGAN_G.py)，[判别器](models\u002FLeakGAN_D.py)\n\n- 结构图（来自 [LeakGAN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1709.08624.pdf)）\n\n  ![model_leakgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_e6b01831b6d5.png)\n\n### MaliGAN\n\n- 运行文件：[run_maligan.py](run\u002Frun_maligan.py)\n\n- 训练器：[oracle_data](instructor\u002Foracle_data\u002Fmaligan_instructor.py)，[real_data](instructor\u002Freal_data\u002Fmaligan_instructor.py)\n\n- 模型：[生成器](models\u002FMaliGAN_G.py)，[判别器](models\u002FMaliGAN_D.py)\n\n- 结构图（来自我的理解）\n\n  ![model_maligan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_e21d1fcada07.png)\n\n### JSDGAN\n\n- 运行文件：[run_jsdgan.py](run\u002Frun_jsdgan.py)\n\n- 指导器：[oracle_data](instructor\u002Foracle_data\u002Fjsdgan_instructor.py)、[real_data](instructor\u002Freal_data\u002Fjsdgan_instructor.py)\n\n- 模型：[generator](models\u002FJSDGAN_G.py)（无判别器，discriminator）\n\n- 结构（根据我的理解）\n\n  ![model_jsdgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_bcc23cf20d72.png)\n\n### RelGAN\n\n- 运行文件：[run_relgan.py](run\u002Frun_relgan.py)\n\n- 指导器：[oracle_data](instructor\u002Foracle_data\u002Frelgan_instructor.py)、[real_data](instructor\u002Freal_data\u002Frelgan_instructor.py)\n\n- 模型：[generator](models\u002FRelGAN_G.py)、[discriminator](models\u002FRelGAN_D.py)\n\n- 结构（根据我的理解）\n\n  ![model_relgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_9bd95f1b0452.png)\n  \n### DPGAN\n\n- 运行文件：[run_dpgan.py](run\u002Frun_dpgan.py)\n\n- 指导器：[oracle_data](instructor\u002Foracle_data\u002Fdpgan_instructor.py)、[real_data](instructor\u002Freal_data\u002Fdpgan_instructor.py)\n\n- 模型：[generator](models\u002FDPGAN_G.py)、[discriminator](models\u002FDPGAN_D.py)\n\n- 结构（来自 [DPGAN](https:\u002F\u002Farxiv.org\u002Fabs\u002F1802.01345)）\n\n  ![model_dpgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_f34b8292066a.png)\n  \n### DGSAN\n\n- 运行文件：[run_dgsan.py](run\u002Frun_dgsan.py)\n\n- 指导器：[oracle_data](instructor\u002Foracle_data\u002Fdgsan_instructor.py)、[real_data](instructor\u002Freal_data\u002Fdgsan_instructor.py)\n\n- 模型：[generator](models\u002FDGSAN_G.py)、[discriminator](models\u002FDGSAN_D.py)\n\n### CoT\n\n- 运行文件：[run_cot.py](run\u002Frun_cot.py)\n\n- 指导器：[oracle_data](instructor\u002Foracle_data\u002Fcot_instructor.py)、[real_data](instructor\u002Freal_data\u002Fcot_instructor.py)\n\n- 模型：[generator](models\u002FCoT_G.py)、[discriminator](models\u002FCoT_D.py)\n\n- 结构（来自 [CoT](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.03782)）\n\n  ![model_cot](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_5b2457e1da04.png)\n\n### SentiGAN\n\n- 运行文件：[run_sentigan.py](run\u002Frun_sentigan.py)\n\n- 指导器：[oracle_data](instructor\u002Foracle_data\u002Fsentigan_instructor.py)、[real_data](instructor\u002Freal_data\u002Fsentigan_instructor.py)\n\n- 模型：[generator](models\u002FSentiGAN_G.py)、[discriminator](models\u002FSentiGAN_D.py)\n\n- 结构（来自 [SentiGAN](https:\u002F\u002Fwww.ijcai.org\u002Fproceedings\u002F2018\u002F0618.pdf)）\n\n  ![model_sentigan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_430304fc5fae.png)\n\n### CatGAN\n\n- 运行文件：[run_catgan.py](run\u002Frun_catgan.py)\n\n- 指导器：[oracle_data](instructor\u002Foracle_data\u002Fcatgan_instructor.py)、[real_data](instructor\u002Freal_data\u002Fcatgan_instructor.py)\n\n- 模型：[generator](models\u002FCatGAN_G.py)、[discriminator](models\u002FCatGAN_D.py)\n\n- 结构（来自 [CatGAN](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.06641)）\n\n  ![model_catgan](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_readme_5d22d19b59c7.png)\n\n  \n\n## 许可证\n\n**MIT 许可证**","# TextGAN-PyTorch 快速上手指南\n\nTextGAN-PyTorch 是一个基于 PyTorch 的 GAN 文本生成框架，支持通用文本生成和类别文本生成。\n\n## 环境准备\n\n### 系统要求\n\n- Python 3.6\n- CUDA 7.5+（如需 GPU 加速）\n\n### 前置依赖\n\n| 依赖 | 版本要求 |\n|------|----------|\n| PyTorch | >= 1.1.0 |\n| Numpy | 1.14.5 |\n| nltk | 3.4 |\n| tqdm | 4.32.1 |\n| KenLM | - |\n\n### 安装 KenLM（必需）\n\nKenLM 是语言模型工具，需要单独编译安装：\n\n```bash\n# 1. 下载并解压\nwget http:\u002F\u002Fkheafield.com\u002Fcode\u002Fkenlm.tar.gz\ntar -xzf kenlm.tar.gz\ncd kenlm\n\n# 2. 安装系统依赖\n# Ubuntu\nsudo apt-get install libboost-all-dev\n# Mac\nbrew install boost && brew install bjam\n\n# 3. 编译\nmkdir -p build\ncd build\ncmake ..\nmake -j 4\n\n# 4. 安装 Python 包\npip install https:\u002F\u002Fgithub.com\u002Fkpu\u002Fkenlm\u002Farchive\u002Fmaster.zip\n```\n\n## 安装步骤\n\n```bash\n# 1. 克隆仓库\ngit clone https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch.git\ncd TextGAN-PyTorch\n\n# 2. 安装 Python 依赖\npip install -r requirements.txt\n```\n\n> **国内加速**：如遇网络问题，可使用国内镜像：\n> ```bash\n> pip install -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple -r requirements.txt\n> ```\n\n## 基本使用\n\n### 运行示例\n\n```bash\ncd run\npython3 run_seqgan.py 0 0\n```\n\n参数说明：\n- 第一个 `0`：job_id（任务编号）\n- 第二个 `0`：gpu_id（GPU 编号）\n\n### 可用模型\n\n**通用文本生成**：\n- `run_seqgan.py` - SeqGAN\n- `run_leakgan.py` - LeakGAN\n- `run_maligan.py` - MaliGAN\n- `run_jsdgan.py` - JSDGAN\n- `run_relgan.py` - RelGAN\n- `run_dpgan.py` - DPGAN\n- `run_dgsan.py` - DGSAN\n- `run_cot.py` - CoT\n\n**类别文本生成**：\n- `run_sentigan.py` - SentiGAN\n- `run_catgan.py` - CatGAN\n\n### 数据集\n\n如需使用真实数据实验，可从 [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1XvT3GqbK1wh3XhTgqBLWUtH_mLzGnKZP?usp=sharing) 下载：Image COCO、EMNLP NEWS、Movie Review、Amazon Review。","某高校 NLP 实验室的研究生小李正在从事文本生成研究，需要复现多篇顶会论文中的 GAN 文本生成模型并进行比较实验。\n\n### 没有 TextGAN-PyTorch 时\n\n- 小李 发现大多数 GAN 文本生成论文（SeqGAN、LeakGAN、SentiGAN 等）都是用 TensorFlow 实现的，而她习惯使用 PyTorch，需要额外花费数周时间学习 TensorFlow 语法和 API\n- 每篇论文的代码实现细节各不相同，小李 需要从零开始手写整个生成器和判别器，光是调试就耗费了数月时间\n- 由于各模型代码风格不一致，小李 很难进行公平的对比实验，无法准确评估哪个模型在特定数据集上表现更好\n- 安装配置过程繁琐，需要手动安装 KenLM、Boost 等依赖库，且不同模型的环境配置方式差异很大\n- 训练过程中缺乏统一的可视化和日志工具，小李 只能自己编写代码来监控生成文本的质量\n\n### 使用 TextGAN-PyTorch 后\n\n- TextGAN-PyTorch 提供了统一的 PyTorch 实现框架，小李 可以直接用自己熟悉的 PyTorch 代码进行实验，无需切换技术栈\n- 框架内置了 10+ 种主流 GAN 文本生成模型的完整实现，下载后只需运行一条命令即可开始训练，如 `python3 run_seqgan.py 0 0`\n- 所有模型使用统一的训练接口和评估指标，小李 可以轻松在 Image COCO、EMNLP NEWS、Movie Review 等数据集上进行公平对比\n- 项目提供了详细的依赖安装说明和 requirements.txt，PyTorch >= 1.1.0、nltk、tqdm 等依赖一键安装，KenLM 也有清晰的编译指南\n- 内置的 Instructor 类封装了完整的训练流程和可视化功能，小李 可以专注于模型调优而非重复造轮子\n\nTextGAN-PyTorch 大幅降低了 GAN 文本生成模型的研究门槛，让研究者能够快速复现论文结果并进行公平的性能对比。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FwilliamSYSU_TextGAN-PyTorch_85498c6a.png","williamSYSU","WilliamLam","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FwilliamSYSU_b53e94b3.jpg","A Master student in Sun Yat-sen University (SYSU) researching NLP.","Sun Yat-sen University (SYSU)","Guangzhou, China","glosttty@gmail.com",null,"http:\u002F\u002Fzhiweil.ml\u002F","https:\u002F\u002Fgithub.com\u002FwilliamSYSU",[87],{"name":88,"color":89,"percentage":90},"Python","#3572A5",100,910,206,"2026-03-20T02:18:28","MIT",4,"Linux, macOS, Windows","需要 NVIDIA GPU，CUDA 7.5+（未说明具体显存要求）","未说明",{"notes":100,"python":101,"dependencies":102},"KenLM 需要从源码编译安装，需安装 Boost >= 1.42.0 和 bjam；Ubuntu 系统需安装 libboost-all-dev，Mac 系统需安装 boost 和 bjam；如遇 CUDA 问题请参考 PyTorch 官方安装指南","3.6",[103,104,105,106,107],"PyTorch >= 1.1.0","Numpy 1.14.5","nltk 3.4","tqdm 4.32.1","KenLM",[13,14,26],[110,111,112,113,114,115,116,117,118],"pytorch","generative-adversarial-network","text-generation","framework","seqgan","gan","nlp","natural-language-processing","deep-learning","2026-03-27T02:49:30.150509","2026-04-06T05:16:48.875090",[122,127,132,137,142,147],{"id":123,"question_zh":124,"answer_zh":125,"source_url":126},956,"RelGAN 训练时 NLL 分数持续上升而不是先上升后下降怎么办？","根据维护者的回复，要使代码与原始论文完全一致，需要在计算 NLL_gen 时设置 temperature=1（移除 forward 中的温度乘法）。原始论文中的 NLL 分数可能是使用预选随机种子多次运行取平均值的结果。另外，RMC（Relation Memory Core）使用注意力机制与 vanilla 模型的性能可能相似或略好，但 vanilla 版本已能达到论文中声明的性能。","https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch\u002Fissues\u002F20",{"id":128,"question_zh":129,"answer_zh":130,"source_url":131},957,"运行 RelGAN 时出现 SplitWithSizesBackward 错误怎么办？","在 relational_rnn_general.py 第174行，将 `q *= (self.key_size ** -0.5)` 修改为 `q = q * (self.key_size ** -0.5)` 即可解决此问题。这是由于 PyTorch 1.7+ 版本对 inplace 操作的限制导致的。","https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch\u002Fissues\u002F46",{"id":133,"question_zh":134,"answer_zh":135,"source_url":136},958,"LeakGAN_G 类缺少 init_param() 函数导致继承错误怎么办？","LeakGAN_G 类不能从 LSTMGenerator 继承 init_param() 方法，因为初始化参数不同。解决方案是在 LeakGAN_G 类中实现自己的初始化函数。维护者已修复此问题并更新了代码。","https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch\u002Fissues\u002F17",{"id":138,"question_zh":139,"answer_zh":140,"source_url":141},959,"RelGAN_D 的参数初始化方式是什么？","原始 RelGAN 代码中使用 truncated_normal 初始化判别器 D，而本项目使用 Uniform 初始化。维护者表示虽然初始化方式会影响性能，但不是导致 NLL_gen 曲线异常的主要原因。尝试在原始 RelGAN 代码中使用 Uniform 初始化，所有指标都正常，不受初始化方式影响。","https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch\u002Fissues\u002F21",{"id":143,"question_zh":144,"answer_zh":145,"source_url":146},960,"SentiGAN 中 get_reward 函数是否包含多分类分数？","根据代码分析，get_reward 函数返回的是单个类别的分数（out[:, current_k + 1]），而不是多分类分数。维护者提到模式崩溃是 GAN（尤其是文本生成）的长期问题，SentiGAN 在训练10-20个epoch后就开始生成重复句子，模式崩溃问题比较严重。","https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch\u002Fissues\u002F24",{"id":148,"question_zh":149,"answer_zh":150,"source_url":151},961,"如何处理大规模词汇表的 Out of Vocabulary（OOV）问题？","当前代码只有两个特殊标记：start_token 和 padding_token。COO Image 和 EMNLP 数据集的词汇量较小（约6K），可以直接包含所有唯一标记。对于更大词汇量的数据集，建议：1) 设置词汇表最大容量限制；2) 使用 UNK 标记替换低频词；3) 考虑使用子词 tokenizer（如 BPE）来处理未登录词。","https:\u002F\u002Fgithub.com\u002FwilliamSYSU\u002FTextGAN-PyTorch\u002Fissues\u002F25",[]]