[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-eriklindernoren--Keras-GAN":3,"tool-eriklindernoren--Keras-GAN":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",160015,2,"2026-04-18T11:30:52",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",109154,"2026-04-18T11:18:24",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":77,"owner_email":78,"owner_twitter":76,"owner_website":79,"owner_url":80,"languages":81,"stars":90,"forks":91,"last_commit_at":92,"license":93,"difficulty_score":32,"env_os":94,"env_gpu":95,"env_ram":96,"env_deps":97,"category_tags":103,"github_topics":104,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":109,"updated_at":110,"faqs":111,"releases":142},9252,"eriklindernoren\u002FKeras-GAN","Keras-GAN","Keras implementations of Generative Adversarial Networks.","Keras-GAN 是一个基于 Keras 框架的开源项目，汇集了多种生成对抗网络（GAN）的经典算法实现。它旨在帮助开发者和研究人员快速理解并复现学术界提出的各类 GAN 模型，如 CycleGAN、Pix2Pix、DCGAN 以及条件生成对抗网络等。\n\n在深度学习领域，从零开始复现论文中的 GAN 架构往往面临代码复杂、细节繁琐的挑战。Keras-GAN 通过提供结构清晰、核心逻辑突出的代码示例，有效降低了学习门槛，让用户能专注于掌握不同变体的核心思想，而非纠结于具体的层配置细节。虽然部分实现为了教学清晰做了简化，但其完整性足以支撑起有效的实验与验证。\n\n该项目特别适合人工智能领域的研究者、学生以及希望深入探索图像生成、风格迁移、超分辨率重建等任务的开发者使用。无论是用于学术研究的基准测试，还是作为入门 GAN 技术的实践教材，Keras-GAN 都能提供宝贵的参考资源。值得一提的是，作者还维护了相应的 PyTorch 版本，为不同框架偏好的用户提供了灵活选择。尽管目前主仓库更新频率降低，但其丰富的模型库依然是学习生成式人工智能的重要资产。","\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_a0dea720e232.png\" width=\"480\"\\>\n\u003C\u002Fp>\n\n**This repository has gone stale as I unfortunately do not have the time to maintain it anymore. If you would like to continue the development of it as a collaborator send me an email at eriklindernoren@gmail.com.**\n\n## Keras-GAN\nCollection of Keras implementations of Generative Adversarial Networks (GANs) suggested in research papers. These models are in some cases simplified versions of the ones ultimately described in the papers, but I have chosen to focus on getting the core ideas covered instead of getting every layer configuration right. Contributions and suggestions of GAN varieties to implement are very welcomed.\n\n\u003Cb>See also:\u003C\u002Fb> [PyTorch-GAN](https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FPyTorch-GAN)\n\n## Table of Contents\n  * [Installation](#installation)\n  * [Implementations](#implementations)\n    + [Auxiliary Classifier GAN](#ac-gan)\n    + [Adversarial Autoencoder](#adversarial-autoencoder)\n    + [Bidirectional GAN](#bigan)\n    + [Boundary-Seeking GAN](#bgan)\n    + [Conditional GAN](#cgan)\n    + [Context-Conditional GAN](#cc-gan)\n    + [Context Encoder](#context-encoder)\n    + [Coupled GANs](#cogan)\n    + [CycleGAN](#cyclegan)\n    + [Deep Convolutional GAN](#dcgan)\n    + [DiscoGAN](#discogan)\n    + [DualGAN](#dualgan)\n    + [Generative Adversarial Network](#gan)\n    + [InfoGAN](#infogan)\n    + [LSGAN](#lsgan)\n    + [Pix2Pix](#pix2pix)\n    + [PixelDA](#pixelda)\n    + [Semi-Supervised GAN](#sgan)\n    + [Super-Resolution GAN](#srgan)\n    + [Wasserstein GAN](#wgan)\n    + [Wasserstein GAN GP](#wgan-gp)     \n\n## Installation\n    $ git clone https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\n    $ cd Keras-GAN\u002F\n    $ sudo pip3 install -r requirements.txt\n\n## Implementations   \n### AC-GAN\nImplementation of _Auxiliary Classifier Generative Adversarial Network_.\n\n[Code](acgan\u002Facgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1610.09585\n\n#### Example\n```\n$ cd acgan\u002F\n$ python3 acgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_c65ee3f9a28b.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### Adversarial Autoencoder\nImplementation of _Adversarial Autoencoder_.\n\n[Code](aae\u002Faae.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1511.05644\n\n#### Example\n```\n$ cd aae\u002F\n$ python3 aae.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_874842805b21.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### BiGAN\nImplementation of _Bidirectional Generative Adversarial Network_.\n\n[Code](bigan\u002Fbigan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1605.09782\n\n#### Example\n```\n$ cd bigan\u002F\n$ python3 bigan.py\n```\n\n### BGAN\nImplementation of _Boundary-Seeking Generative Adversarial Networks_.\n\n[Code](bgan\u002Fbgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1702.08431\n\n#### Example\n```\n$ cd bgan\u002F\n$ python3 bgan.py\n```\n\n### CC-GAN\nImplementation of _Semi-Supervised Learning with Context-Conditional Generative Adversarial Networks_.\n\n[Code](ccgan\u002Fccgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.06430\n\n#### Example\n```\n$ cd ccgan\u002F\n$ python3 ccgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_4c37df42e329.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### CGAN\nImplementation of _Conditional Generative Adversarial Nets_.\n\n[Code](cgan\u002Fcgan.py)\n\nPaper:https:\u002F\u002Farxiv.org\u002Fabs\u002F1411.1784\n\n#### Example\n```\n$ cd cgan\u002F\n$ python3 cgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_3ae9f004f557.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### Context Encoder\nImplementation of _Context Encoders: Feature Learning by Inpainting_.\n\n[Code](context_encoder\u002Fcontext_encoder.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1604.07379\n\n#### Example\n```\n$ cd context_encoder\u002F\n$ python3 context_encoder.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_88de4c6585a4.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### CoGAN\nImplementation of _Coupled generative adversarial networks_.\n\n[Code](cogan\u002Fcogan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1606.07536\n\n#### Example\n```\n$ cd cogan\u002F\n$ python3 cogan.py\n```\n\n### CycleGAN\nImplementation of _Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks_.\n\n[Code](cyclegan\u002Fcyclegan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1703.10593\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_fcac6d24856d.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n#### Example\n```\n$ cd cyclegan\u002F\n$ bash download_dataset.sh apple2orange\n$ python3 cyclegan.py\n```   \n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_702d7af9d3a6.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n\n\n### DCGAN\nImplementation of _Deep Convolutional Generative Adversarial Network_.\n\n[Code](dcgan\u002Fdcgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1511.06434\n\n#### Example\n```\n$ cd dcgan\u002F\n$ python3 dcgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_150cd5a34831.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### DiscoGAN\nImplementation of _Learning to Discover Cross-Domain Relations with Generative Adversarial Networks_.\n\n[Code](discogan\u002Fdiscogan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1703.05192\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_ae76c24abe01.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n#### Example\n```\n$ cd discogan\u002F\n$ bash download_dataset.sh edges2shoes\n$ python3 discogan.py\n```   \n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_8d20d8f2e910.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### DualGAN\nImplementation of _DualGAN: Unsupervised Dual Learning for Image-to-Image Translation_.\n\n[Code](dualgan\u002Fdualgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1704.02510\n\n#### Example\n```\n$ cd dualgan\u002F\n$ python3 dualgan.py\n```\n\n### GAN\nImplementation of _Generative Adversarial Network_ with a MLP generator and discriminator.\n\n[Code](gan\u002Fgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1406.2661\n\n#### Example\n```\n$ cd gan\u002F\n$ python3 gan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_ddd3d6ddfe7d.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### InfoGAN\nImplementation of _InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets_.\n\n[Code](infogan\u002Finfogan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1606.03657\n\n#### Example\n```\n$ cd infogan\u002F\n$ python3 infogan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_242d9155faeb.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### LSGAN\nImplementation of _Least Squares Generative Adversarial Networks_.\n\n[Code](lsgan\u002Flsgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.04076\n\n#### Example\n```\n$ cd lsgan\u002F\n$ python3 lsgan.py\n```\n\n### Pix2Pix\nImplementation of _Image-to-Image Translation with Conditional Adversarial Networks_.\n\n[Code](pix2pix\u002Fpix2pix.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.07004\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_11179601e0f7.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n#### Example\n```\n$ cd pix2pix\u002F\n$ bash download_dataset.sh facades\n$ python3 pix2pix.py\n```   \n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_4cabbc6ea49f.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### PixelDA\nImplementation of _Unsupervised Pixel-Level Domain Adaptation with Generative Adversarial Networks_.\n\n[Code](pixelda\u002Fpixelda.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1612.05424\n\n#### MNIST to MNIST-M Classification\nTrains a classifier on MNIST images that are translated to resemble MNIST-M (by performing unsupervised image-to-image domain adaptation). This model is compared to the naive solution of training a classifier on MNIST and evaluating it on MNIST-M. The naive model manages a 55% classification accuracy on MNIST-M while the one trained during domain adaptation gets a 95% classification accuracy.\n\n```\n$ cd pixelda\u002F\n$ python3 pixelda.py\n```\n\n| Method       | Accuracy  |\n| ------------ |:---------:|\n| Naive        | 55%       |\n| PixelDA      | 95%       |\n\n### SGAN\nImplementation of _Semi-Supervised Generative Adversarial Network_.\n\n[Code](sgan\u002Fsgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1606.01583\n\n#### Example\n```\n$ cd sgan\u002F\n$ python3 sgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_361da7f2e294.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### SRGAN\nImplementation of _Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network_.\n\n[Code](srgan\u002Fsrgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1609.04802\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_e0f76b8e3740.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n\n#### Example\n```\n$ cd srgan\u002F\n\u003Cfollow steps at the top of srgan.py>\n$ python3 srgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_328a7ec198f3.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### WGAN\nImplementation of _Wasserstein GAN_ (with DCGAN generator and discriminator).\n\n[Code](wgan\u002Fwgan.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1701.07875\n\n#### Example\n```\n$ cd wgan\u002F\n$ python3 wgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_220234723187.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### WGAN GP\nImplementation of _Improved Training of Wasserstein GANs_.\n\n[Code](wgan_gp\u002Fwgan_gp.py)\n\nPaper: https:\u002F\u002Farxiv.org\u002Fabs\u002F1704.00028\n\n#### Example\n```\n$ cd wgan_gp\u002F\n$ python3 wgan_gp.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_bbd7ca602035.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n","\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_a0dea720e232.png\" width=\"480\"\\>\n\u003C\u002Fp>\n\n**由于我目前没有时间维护该仓库，它已经不再更新。如果您希望以协作者的身份继续开发，请发送邮件至 eriklindernoren@gmail.com。**\n\n## Keras-GAN\n本仓库收集了基于研究论文提出的生成对抗网络（GAN）的 Keras 实现。这些模型在某些情况下是对论文中最终描述版本的简化，但我更倾向于覆盖核心思想，而非完全复现每一层的配置。欢迎各位贡献代码或提出新的 GAN 变体实现建议。\n\n\u003Cb>另请参阅：\u003C\u002Fb> [PyTorch-GAN](https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FPyTorch-GAN)\n\n## 目录\n  * [安装](#installation)\n  * [实现](#implementations)\n    + [辅助分类器 GAN](#ac-gan)\n    + [对抗自编码器](#adversarial-autoencoder)\n    + [双向 GAN](#bigan)\n    + [边界搜索 GAN](#bgan)\n    + [条件 GAN](#cgan)\n    + [上下文条件 GAN](#cc-gan)\n    + [上下文编码器](#context-encoder)\n    + [耦合 GAN](#cogan)\n    + [CycleGAN](#cyclegan)\n    + [深度卷积 GAN](#dcgan)\n    + [DiscoGAN](#discogan)\n    + [DualGAN](#dualgan)\n    + [生成对抗网络](#gan)\n    + [InfoGAN](#infogan)\n    + [LSGAN](#lsgan)\n    + [Pix2Pix](#pix2pix)\n    + [PixelDA](#pixelda)\n    + [半监督 GAN](#sgan)\n    + [超分辨率 GAN](#srgan)\n    + [Wasserstein GAN](#wgan)\n    + [Wasserstein GAN GP](#wgan-gp)     \n\n## 安装\n    $ git clone https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\n    $ cd Keras-GAN\u002F\n    $ sudo pip3 install -r requirements.txt\n\n## 实现   \n### AC-GAN\n实现 _辅助分类器生成对抗网络_。\n\n[代码](acgan\u002Facgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1610.09585\n\n#### 示例\n```\n$ cd acgan\u002F\n$ python3 acgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_c65ee3f9a28b.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### 对抗自编码器\n实现 _对抗自编码器_。\n\n[代码](aae\u002Faae.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1511.05644\n\n#### 示例\n```\n$ cd aae\u002F\n$ python3 aae.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_874842805b21.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### BiGAN\n实现 _双向生成对抗网络_。\n\n[代码](bigan\u002Fbigan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1605.09782\n\n#### 示例\n```\n$ cd bigan\u002F\n$ python3 bigan.py\n```\n\n### BGAN\n实现 _边界搜索生成对抗网络_。\n\n[代码](bgan\u002Fbgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1702.08431\n\n#### 示例\n```\n$ cd bgan\u002F\n$ python3 bgan.py\n```\n\n### CC-GAN\n实现 _基于上下文条件生成对抗网络的半监督学习_。\n\n[代码](ccgan\u002Fccgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.06430\n\n#### 示例\n```\n$ cd ccgan\u002F\n$ python3 ccgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_4c37df42e329.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### CGAN\n实现 _条件生成对抗网络_。\n\n[代码](cgan\u002Fcgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1411.1784\n\n#### 示例\n```\n$ cd cgan\u002F\n$ python3 cgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_3ae9f004f557.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### 上下文编码器\n实现 _上下文编码器：通过修复进行特征学习_。\n\n[代码](context_encoder\u002Fcontext_encoder.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1604.07379\n\n#### 示例\n```\n$ cd context_encoder\u002F\n$ python3 context_encoder.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_88de4c6585a4.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### CoGAN\n实现 _耦合生成对抗网络_。\n\n[代码](cogan\u002Fcogan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1606.07536\n\n#### 示例\n```\n$ cd cogan\u002F\n$ python3 cogan.py\n```\n\n### CycleGAN\n实现 _使用循环一致性对抗网络进行无配对图像到图像转换_。\n\n[代码](cyclegan\u002Fcyclegan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1703.10593\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_fcac6d24856d.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n#### 示例\n```\n$ cd cyclegan\u002F\n$ bash download_dataset.sh apple2orange\n$ python3 cyclegan.py\n```   \n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_702d7af9d3a6.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n\n\n### DCGAN\n实现 _深度卷积生成对抗网络_。\n\n[代码](dcgan\u002Fdcgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1511.06434\n\n#### 示例\n```\n$ cd dcgan\u002F\n$ python3 dcgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_150cd5a34831.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### DiscoGAN\n实现 _利用生成对抗网络学习跨域关系_。\n\n[代码](discogan\u002Fdiscogan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1703.05192\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_ae76c24abe01.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n#### 示例\n```\n$ cd discogan\u002F\n$ bash download_dataset.sh edges2shoes\n$ python3 discogan.py\n```   \n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_8d20d8f2e910.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### DualGAN\n实现 _DualGAN：用于图像到图像转换的无监督双学习_。\n\n[代码](dualgan\u002Fdualgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1704.02510\n\n#### 示例\n```\n$ cd dualgan\u002F\n$ python3 dualgan.py\n```\n\n### GAN\n实现 _生成对抗网络_，采用 MLP 架构的生成器和判别器。\n\n[代码](gan\u002Fgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1406.2661\n\n#### 示例\n```\n$ cd gan\u002F\n$ python3 gan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_ddd3d6ddfe7d.gif\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### InfoGAN\n实现 _InfoGAN：通过信息最大化生成对抗网络实现可解释的表征学习_。\n\n[代码](infogan\u002Finfogan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1606.03657\n\n#### 示例\n```\n$ cd infogan\u002F\n$ python3 infogan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_242d9155faeb.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### LSGAN\n实现 _最小二乘生成对抗网络_。\n\n[代码](lsgan\u002Flsgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.04076\n\n#### 示例\n```\n$ cd lsgan\u002F\n$ python3 lsgan.py\n```\n\n### Pix2Pix\n实现 _基于条件对抗网络的图像到图像转换_。\n\n[代码](pix2pix\u002Fpix2pix.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.07004\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_11179601e0f7.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n#### 示例\n```\n$ cd pix2pix\u002F\n$ bash download_dataset.sh facades\n$ python3 pix2pix.py\n```   \n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_4cabbc6ea49f.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### PixelDA\n《基于生成对抗网络的无监督像素级域适应》的实现。\n\n[代码](pixelda\u002Fpixelda.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1612.05424\n\n#### MNIST 到 MNIST-M 分类\n在经过无监督图像到图像域适应处理、使其外观类似于 MNIST-M 的 MNIST 图像上训练分类器。将该模型与直接在 MNIST 上训练并在 MNIST-M 上评估的朴素方法进行对比。朴素模型在 MNIST-M 上的分类准确率为 55%，而通过域适应训练得到的模型则达到了 95% 的分类准确率。\n\n```\n$ cd pixelda\u002F\n$ python3 pixelda.py\n```\n\n| 方法       | 准确率  |\n| ------------ |:---------:|\n| 朴素方法   | 55%       |\n| PixelDA    | 95%       |\n\n### SGAN\n《半监督生成对抗网络》的实现。\n\n[代码](sgan\u002Fsgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1606.01583\n\n#### 示例\n```\n$ cd sgan\u002F\n$ python3 sgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_361da7f2e294.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### SRGAN\n《基于生成对抗网络的逼真单幅图像超分辨率》的实现。\n\n[代码](srgan\u002Fsrgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1609.04802\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_e0f76b8e3740.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n\n#### 示例\n```\n$ cd srgan\u002F\n\u003C按照 srgan.py 文件顶部的步骤操作>\n$ python3 srgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_328a7ec198f3.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### WGAN\n《Wasserstein GAN》的实现（使用 DCGAN 架构的生成器和判别器）。\n\n[代码](wgan\u002Fwgan.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1701.07875\n\n#### 示例\n```\n$ cd wgan\u002F\n$ python3 wgan.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_220234723187.png\" width=\"640\"\\>\n\u003C\u002Fp>\n\n### WGAN GP\n《改进 Wasserstein GAN 的训练》的实现。\n\n[代码](wgan_gp\u002Fwgan_gp.py)\n\n论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F1704.00028\n\n#### 示例\n```\n$ cd wgan_gp\u002F\n$ python3 wgan_gp.py\n```\n\n\u003Cp align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_readme_bbd7ca602035.gif\" width=\"640\"\\>\n\u003C\u002Fp>","# Keras-GAN 快速上手指南\n\nKeras-GAN 是一个汇集了多种生成对抗网络（GAN）研究论文实现的代码库。它基于 Keras 框架，提供了从基础 GAN 到 CycleGAN、Pix2Pix 等高级模型的简化版实现，旨在帮助开发者快速理解核心思想并进行实验。\n\n> **注意**：该仓库目前处于非活跃维护状态（Stale），但代码仍具有极高的学习和参考价值。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Linux, macOS 或 Windows (推荐 Linux)\n*   **Python 版本**：Python 3.6+\n*   **核心依赖**：\n    *   TensorFlow (后端)\n    *   Keras\n    *   NumPy, SciPy, Pillow, Matplotlib 等科学计算库\n*   **硬件建议**：虽然可在 CPU 上运行，但训练 GAN 模型强烈建议使用 NVIDIA GPU 并安装 CUDA 加速。\n\n## 安装步骤\n\n### 1. 克隆项目\n使用 Git 将代码库下载到本地：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\ncd Keras-GAN\u002F\n```\n\n### 2. 安装依赖\n安装项目所需的 Python 包。\n\n**标准安装：**\n```bash\nsudo pip3 install -r requirements.txt\n```\n\n**国内加速安装（推荐）：**\n如果您在中国大陆，建议使用清华源或阿里源以加快下载速度：\n\n```bash\npip3 install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n## 基本使用\n\n该项目包含多种 GAN 模型实现，每个模型位于独立的文件夹中。以下以最经典的 **DCGAN (Deep Convolutional GAN)** 为例演示如何运行。\n\n### 1. 进入模型目录\n切换到对应的模型文件夹：\n\n```bash\ncd dcgan\u002F\n```\n\n### 2. 运行示例\n直接运行 Python 脚本即可开始训练（默认会使用 MNIST 数据集，脚本会自动处理数据加载）：\n\n```bash\npython3 dcgan.py\n```\n\n### 3. 查看结果\n程序运行后，会在当前目录下生成训练过程中的图像样本。随着训练迭代次数增加，生成的图像质量将逐渐提升。\n\n---\n\n### 其他模型运行示例\n\n项目支持多种变体，使用方法类似。部分模型需要额外下载数据集：\n\n*   **CycleGAN (风格迁移)**:\n    ```bash\n    cd cyclegan\u002F\n    bash download_dataset.sh apple2orange\n    python3 cyclegan.py\n    ```\n\n*   **Pix2Pix (图像翻译)**:\n    ```bash\n    cd pix2pix\u002F\n    bash download_dataset.sh facades\n    python3 pix2pix.py\n    ```\n\n*   **AC-GAN (辅助分类器)**:\n    ```bash\n    cd acgan\u002F\n    python3 acgan.py\n    ```\n\n您可以查阅项目根目录的 `Implementations` 列表，探索更多如 WGAN, InfoGAN, SRGAN 等模型的具体用法。","一家初创游戏公司的美术团队急需为复古像素风格的新游生成大量多样化的角色头像，但人工绘制耗时过长且风格难以统一。\n\n### 没有 Keras-GAN 时\n- 美术师需手动绘制上千张头像，耗时数周且成本高昂，严重拖慢开发进度。\n- 尝试从零复现论文中的 GAN 算法（如 CycleGAN 或 DCGAN），因复杂的数学公式和层配置导致代码调试困难，极易失败。\n- 缺乏现成的对比模型，难以快速验证哪种生成架构最适合当前的像素艺术风格。\n- 数据增强手段有限，仅靠旋转翻转无法创造出具有新特征的高质量素材。\n\n### 使用 Keras-GAN 后\n- 直接调用库中预置的 DCGAN 或 CycleGAN 实现，仅需几小时即可完成模型训练并批量生成高质量头像。\n- 依托封装好的核心逻辑，团队无需深究底层复杂的对抗训练细节，即可轻松调整参数优化生成效果。\n- 利用库内丰富的模型列表（如 AC-GAN、InfoGAN），快速测试不同变体，迅速锁定最适合像素风格的最佳架构。\n- 通过 Context Encoder 功能自动修复破损素材或补全缺失背景，极大提升了现有资产库的利用率。\n\nKeras-GAN 将高深的生成式对抗网络研究转化为即插即用的代码模块，让开发者能专注于创意落地而非重复造轮子。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Feriklindernoren_Keras-GAN_c65ee3f9.gif","eriklindernoren","Erik Linder-Norén","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Feriklindernoren_598153e0.jpg","ML engineer at Apple. Excited about machine learning, basketball and building things.",null,"Stockholm, Sweden","eriklindernoren@gmail.com","http:\u002F\u002Fwww.eriklindernoren.se","https:\u002F\u002Fgithub.com\u002Feriklindernoren",[82,86],{"name":83,"color":84,"percentage":85},"Python","#3572A5",99.2,{"name":87,"color":88,"percentage":89},"Shell","#89e051",0.8,9214,3088,"2026-04-18T03:08:17","MIT","Linux, macOS, Windows","未说明（依赖后端配置，通常建议 NVIDIA GPU 以加速训练）","未说明",{"notes":98,"python":99,"dependencies":100},"该项目已停止维护（stale）。安装需通过 pip3 安装 requirements.txt 中的依赖。部分模型（如 CycleGAN, Pix2Pix）运行前需执行 bash 脚本下载数据集。具体显存和内存需求取决于所运行的特定 GAN 模型及输入图像分辨率。","3.x (示例命令使用 python3)",[101,102],"keras","tensorflow",[14,15],[105,106,101,107,108],"deep-learning","gan","generative-adversarial-networks","neural-networks","2026-03-27T02:49:30.150509","2026-04-19T03:05:09.685329",[112,117,122,127,132,137],{"id":113,"question_zh":114,"answer_zh":115,"source_url":116},41530,"GAN 的目标函数与原始论文中的描述一致吗？使用二元交叉熵（Binary Cross Entropy）是否等同于最小化 log(prob_real)+log(1-prob_fake)？","是的，两者在数学上是等价的。原始论文中提到的负对数似然（negative log-likelihood）与本实现中使用的交叉熵损失（此处为二元交叉熵）是等效的。","https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\u002Fissues\u002F106",{"id":118,"question_zh":119,"answer_zh":120,"source_url":121},41531,"为什么在训练批次中没有将真实图像和生成图像进行混合（shuffle）？","这主要是出于批归一化（Batch Normalization, BN）的考虑。研究表明，当小批量数据在真实样本和假样本之间分开时，BN 的效果更好。对于不使用 BN 的其他实现，混合样本也未发现明显益处。","https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\u002Fissues\u002F146",{"id":123,"question_zh":124,"answer_zh":125,"source_url":126},41532,"如何将代码应用于自己的数据集（如 CIFAR-10 等 3 通道彩色图像），遇到输入通道不匹配错误怎么办？","建议先从浅层网络开始尝试，确保能跑通后再扩展架构。构建 GAN 网络架构没有保证成功的固定公式，通常需要基于论文架构并进行实验调整。可以参考 DCGAN 作者提供的技巧页面：https:\u002F\u002Fgithub.com\u002Fsoumith\u002Fganhacks。同时需确保修改代码中的输入尺寸和通道数以匹配数据。","https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\u002Fissues\u002F3",{"id":128,"question_zh":129,"answer_zh":130,"source_url":131},41533,"使用 pix2pix 模型时遇到 'Concatenate' 层输入形状不匹配的错误（例如维度相差 1），如何解决？","该错误通常由图像尺寸不是 2 的幂次导致。解决方法是将图像调整为 2 的幂次尺寸（如 128x128）。此外，pix2pix 的数据加载器假设图像是按宽度拼接的（左侧为目标图像，右侧为条件图像\u002F掩码），且两者必须具有相同的尺寸和通道数。请确保数据预处理符合此格式。","https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\u002Fissues\u002F16",{"id":133,"question_zh":134,"answer_zh":135,"source_url":136},41534,"在 pix2pix 代码中设置 `discriminator.trainable = False` 后，判别器是否还会被训练？这会不会影响单独训练判别器的步骤？","不会冲突。正确的执行顺序是：先编译判别器模型，然后设置 `discriminator.trainable = False`，最后编译联合模型（combined model）。这样，在调用 `discriminator.train_on_batch` 时判别器仍会被训练（因为它在设置为不可训练前已编译），但在调用 `combined.train_on_batch` 时判别器参数不会更新（因为联合模型编译时它已被标记为不可训练）。这是 Keras 中训练 GAN 的标准做法。","https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\u002Fissues\u002F73",{"id":138,"question_zh":139,"answer_zh":140,"source_url":141},41535,"Bidirectional GAN (BiGAN) 的代码中似乎没有直接训练编码器（Encoder）的步骤，它是如何学习的？","编码器和生成器是作为一个整体进行训练的。在代码中请查找 `train_on_batch()` 方法，编码器实际上是作为 `bigan_generator` 组合模型的一部分参与训练过程的，因此不需要单独调用编码器的训练方法。","https:\u002F\u002Fgithub.com\u002Feriklindernoren\u002FKeras-GAN\u002Fissues\u002F58",[]]