[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-robbiebarrat--art-DCGAN":3,"tool-robbiebarrat--art-DCGAN":62},[4,18,26,35,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108111,2,"2026-04-08T11:23:26",[14,15,13],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":10,"last_commit_at":41,"category_tags":42,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[43,15,13,14],"语言模型",{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":10,"last_commit_at":50,"category_tags":51,"status":17},4292,"Deep-Live-Cam","hacksider\u002FDeep-Live-Cam","Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。\n\n这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。\n\n其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。",88924,"2026-04-06T03:28:53",[14,15,13,52],"视频",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":59,"last_commit_at":60,"category_tags":61,"status":17},5646,"opencv","opencv\u002Fopencv","OpenCV 是一个功能强大的开源计算机视觉库，被誉为机器视觉领域的“瑞士军刀”。它主要解决让计算机“看懂”图像和视频的核心难题，提供了从基础的图像读取、色彩转换、边缘检测，到复杂的人脸识别、物体追踪、3D 重建及深度学习模型部署等全方位算法支持。无论是处理静态图片还是分析实时视频流，OpenCV 都能高效完成特征提取与模式识别任务。\n\n这款工具特别适合计算机视觉开发者、人工智能研究人员以及机器人工程师使用。对于希望将视觉感知能力集成到应用中的软件工程师，或是需要快速验证算法原型的学术研究者，OpenCV 都是不可或缺的基础设施。虽然普通用户通常不会直接操作代码，但日常生活中使用的扫码支付、美颜相机和自动驾驶系统，背后往往都有它的身影。\n\nOpenCV 的独特亮点在于其卓越的性能与广泛的兼容性。它采用 C++ 编写以确保高速运算，同时提供 Python、Java 等多种语言接口，极大降低了开发门槛。库中内置了数千种优化算法，并支持跨平台运行，能够无缝对接各类硬件加速器。作为社区驱动的项目，OpenCV 拥有活跃的生态系统和丰富的学习资源，持续推动着视觉技术的前沿发展。",86988,1,"2026-04-08T16:06:22",[14,15],{"id":63,"github_repo":64,"name":65,"description_en":66,"description_zh":67,"ai_summary_zh":68,"readme_en":69,"readme_zh":70,"quickstart_zh":71,"use_case_zh":72,"hero_image_url":73,"owner_login":74,"owner_name":75,"owner_avatar_url":76,"owner_bio":77,"owner_company":78,"owner_location":79,"owner_email":80,"owner_twitter":81,"owner_website":82,"owner_url":83,"languages":84,"stars":97,"forks":98,"last_commit_at":99,"license":100,"difficulty_score":101,"env_os":102,"env_gpu":103,"env_ram":104,"env_deps":105,"category_tags":116,"github_topics":117,"view_count":32,"oss_zip_url":122,"oss_zip_packed_at":122,"status":17,"created_at":123,"updated_at":124,"faqs":125,"releases":156},5859,"robbiebarrat\u002Fart-DCGAN","art-DCGAN","Modified implementation of DCGAN focused on generative art. Includes pre-trained models for landscapes, nude-portraits, and others.","art-DCGAN 是一个专注于生成艺术创作的开源项目，它基于经典的 DCGAN 架构进行了深度改良。该工具旨在解决传统生成模型在图像分辨率和艺术风格多样性上的局限，让用户能够轻松生成高质量的抽象风景、人物肖像及裸体艺术等风格的画作。\n\n相比原始版本，art-DCGAN 将生成图像的分辨率从 64x64 提升至 128x128，显著改善了画面细节。其独特的技术亮点在于支持“断点续训”与数据集切换：用户可以先用一种风格的数据集训练模型，随后切换至另一种数据集继续微调，从而实现类似风格迁移的效果（例如从写实风景平滑过渡到抽象风格）。此外，项目还内置了从 WikiArt 自动抓取并整理训练数据的脚本，以及将 GPU 训练模型转换为 CPU 可用格式的实用工具，并直接提供了多个预训练好的模型权重供快速体验。\n\n这款工具非常适合希望探索 AI 艺术生成的开发者、数字艺术家以及人工智能研究人员使用。对于想要尝试训练自定义艺术风格模型的技术人员，art-DCGAN 提供了灵活的训练策略和便捷的数据处理流程；而对于普通创作者，利用其预训练模型也能快速获得灵感素材。需要注意的是，使用预训练模型生成的作品","art-DCGAN 是一个专注于生成艺术创作的开源项目，它基于经典的 DCGAN 架构进行了深度改良。该工具旨在解决传统生成模型在图像分辨率和艺术风格多样性上的局限，让用户能够轻松生成高质量的抽象风景、人物肖像及裸体艺术等风格的画作。\n\n相比原始版本，art-DCGAN 将生成图像的分辨率从 64x64 提升至 128x128，显著改善了画面细节。其独特的技术亮点在于支持“断点续训”与数据集切换：用户可以先用一种风格的数据集训练模型，随后切换至另一种数据集继续微调，从而实现类似风格迁移的效果（例如从写实风景平滑过渡到抽象风格）。此外，项目还内置了从 WikiArt 自动抓取并整理训练数据的脚本，以及将 GPU 训练模型转换为 CPU 可用格式的实用工具，并直接提供了多个预训练好的模型权重供快速体验。\n\n这款工具非常适合希望探索 AI 艺术生成的开发者、数字艺术家以及人工智能研究人员使用。对于想要尝试训练自定义艺术风格模型的技术人员，art-DCGAN 提供了灵活的训练策略和便捷的数据处理流程；而对于普通创作者，利用其预训练模型也能快速获得灵感素材。需要注意的是，使用预训练模型生成的作品需遵守作者的署名与非商业使用协议。","\u003Cp align=\"right\">\n\u003Ci>contact: robbiebarrat (at) gmail (dot) com\u003C\u002Fi>\n\u003C\u002Fp>\n\n# art-DCGAN\nModified version of [Soumith Chintala's torch implementation](https:\u002F\u002Fgithub.com\u002Fsoumith\u002Fdcgan.torch) of [DCGAN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1511.06434.pdf) with a focus on generating artworks.\n\n# Examples \u002F Pre-trained networks\nDue to the nature of github, and the 100+ MB nature of the pre-trained networks, you'll have to click a link to get the pre-trained models, but it's worth it. Below are some of them and examples of what they can generate. **When using any outputs of the models, credit me. Don't sell the outputs of the pre-trained models, modified or not. If you have any questions email me before doing anything.**\n\n### Abstract Landscape GAN\n![Batch of Abstract Landscapes](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_ff7f290f15b9.png)\n#### Download the weights!\nThere is no download for abstract landscapes, yet. Scroll to the bottom to find out how to train your own from the regular landscapes network (involves switching the dataset towards the end of training).\n\n### Landscape GAN\n![Batch of Landscapes](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_75eb296792dc.png)\n#### Download the weights!\n##### [Generator](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKUFBmV09VOWlmNG8) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1HqoHuH1cefPN1A9i6j_CjbCuoQy_hpG1)\n\n##### [Discriminator](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKaC1MRkNiMHp0VHM) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1wz0Ke0TL8J9x2AkfpYTBII0UfO_OPVgH)\n\n### Nude-Portrait GAN\n![Batch of Nude-Portraits](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_5d37992c61e3.png)\n#### Download the weights!\n##### [Generator](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKdFJkdUFlNFRGRVE) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1WfGaeEMNgMp355J194NnfRr8TqHSlvVd)\n\n##### [Discriminator](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKUjdrckNQeGZqME0) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1bOLqlIsXrOYYxfQnwgNQloCy4D0p7bBe)\n\n\n### Portrait GAN\n![Batch of Portraits](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_29c8288d34d3.png)\n#### Download the weights\n##### [Generator](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKUXhmazg2eVF0bTA) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1Ul9poUdKBSdyb6IAJlSXBP8zVOVpzHBT)\n\n##### [Discriminator](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKMVh4S21BNlhzNEE) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1KJMUW0sOZ3CRjshCEsJPd76DN4GT6Otv)\n\n## The most notable changes are:\n* Doubled image size - now 128x128 instead of 64x64 (added a layer in both networks)\n\n* Ability to resume training from checkpoints (simply pass -netG=[path_to_network], and -netD=[path_to_network]). While this is convenient, it also allows for experimentation with training on one set of images, and then later in training shifting to another set of images. This allows you to train a landscape network, and then shift to abstract for a very short duration to get abstract landscapes (see example below in the \"resume from checkpoint\" section) - acting like a sort of style transfer for GANs.\n\n* Included a simple shell script that will keep the checkpoints folder reasonably empty - it is meant for leaving running when training a GAN. Default behavior is to keep the most recent 5 checkpoints of both the discriminator and generator for each different experiment name.\n\n* Added a python 3 script (utils\u002Fgenre-scraper.py) that allows easy image-scraping from wikiart into the format the GAN can draw from.\n\n* Added a script (utils\u002Fgpu2cpu.lua) that converts checkpoints trained on a gpu to models that can be used by a cpu.\n\n* The inclusion of multiple pre-trained GAN's (.t7 files) that can generate various types of images, including 128x128 landscape oil paintings, 128x128 nude oil paintings, and others highlighted below.\n\n## Usage:\n### Prerequisites:\nSee [INSTALL.md](INSTALL.md)\n\n### General Usage:\nThe usage is identical to Soumith's - with the exception of loading from a checkpoint, and the fact that an artwork scraper is included with this project.\n\n### Scraping Images from Wikiart\n`genre-scraper.py` will allow you to scrape artworks from wikiart based on their genres. The usage is quite simple.\nIn `genre-scraper.py` there is a variable called `genre_to_scrape` - simply change that to any of the genre's listed on [this page](https:\u002F\u002Fwww.wikiart.org\u002Fen\u002Fpaintings-by-genre\u002F), or to any of the values in the huge list of comments right after `genre_to_scrape` is defined.\n\nRun the program with python3 and a folder with the name of your genre will be created, with a subdirectory \"images\u002F\" containing all of the jpgs. Point your GAN to the directory with the name of your genre (so if I did landscapes, i'd just change `genre_to_scrape` to \"landscape\", and then run my GAN with DATA_ROOT=landscape)\n\n### Train a GAN on a folder of images\n\n#### Start Training\n`\nDATA_ROOT=myimages dataset=folder ndf=50 ngf=150 th main.lua\n`\n\nYou can adjust ndf (number of filters in discriminator's first layer) and ngf (number of filters in generator's first layer) freely, although it's reccomended that the generator has ~2x the filters as the discriminator to prevent the discriminator from beating the generator out, since the generator has a much much harder job.\n\nKeep in mind, you can also pass these arguments when training:\n```\nbatchSize=64              -- Batchsize - didn't get very good results with this over 128...\nnoise=normal, uniform     -- pass ONE Of these. It seems like normal works a lot better, though.\nnz=100                    -- number of dimensions for Z\nnThreads=1                -- number of data loading threads\ngpu=1                     -- gpu to use\nname=experiment1          -- just to make sure you don't overwrite anything cool, change the checkpoint filenames with this\n```\n\n\n#### Resume from checkpoint\n`\nDATA_ROOT=myimages dataset=folder netD=checkpoints\u002Fyour_discriminator_net.t7 netG=your_driscriminator_net.t7 th main.lua\n`\nPassing ndf and ngf will have no effect here - as the networks are loaded from the checkpoints. Resuming from the checkpoint and training on different data can have very interesting effects. Below, a GAN trained on generating landscapes is trained on abstract art for half of an epoch.\n\n![difference](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_521ffeae4eb4.png)\n\n\n#### Generate images with a pre-trained net\n`\nnet=your_generator_net.t7 th generate.lua\n`\nVery straightforward... I hope. Keep in mind; you can also pass these when generating images:\n```\nbatchSize=36                      -- How many images to generate - keep a multiple of six for unpadded output.\nimsize=1                          -- How large the image(s) should be (not in pixels!)\nnoisemode=normal, line, linefull  -- pass ONE of these. If you pass line, pass batchSize > 1 and imsize = 1, too.\nname=generation1                  -- just to make sure you don't overwrite anything cool, change the filename with this\n```\n####There are more passable arguments on [the unmodified network's page](https:\u002F\u002Fgithub.com\u002Fsoumith\u002Fdcgan.torch#all-training-options) - I think I included the more important ones here though####\n\n\n\n### Coming soon\n* Pre-trained networks: flower paintings, cityscapes (comment in the open issue if you have suggestions!)\n* creating animated gifs of walks throughout latent space\n* a GUI for this whole thing... maybe...\n","\u003Cp align=\"right\">\n\u003Ci>联系方式：robbiebarrat (at) gmail (dot) com\u003C\u002Fi>\n\u003C\u002Fp>\n\n# art-DCGAN\n基于[Soumith Chintala的torch实现](https:\u002F\u002Fgithub.com\u002Fsoumith\u002Fdcgan.torch)对[DCGAN](https:\u002F\u002Farxiv.org\u002Fpdf\u002F1511.06434.pdf)的修改版本，专注于生成艺术作品。\n\n# 示例 \u002F 预训练网络\n由于GitHub的特性以及预训练网络超过100MB的大小，你需要点击链接才能获取这些预训练模型，但绝对值得。以下是一些示例及其生成效果。**在使用任何模型输出时，请注明我的贡献。无论是否经过修改，都请勿出售这些预训练模型的输出。如有任何疑问，请在采取任何行动前先与我联系。**\n\n### 抽象风景GAN\n![抽象风景批次](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_ff7f290f15b9.png)\n#### 下载权重！\n目前还没有抽象风景的下载链接。请向下滚动至底部，了解如何从常规风景网络中训练出自己的模型（需要在训练后期切换数据集）。\n\n### 风景GAN\n![风景批次](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_75eb296792dc.png)\n#### 下载权重！\n##### [生成器](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKUFBmV09VOWlmNG8) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1HqoHuH1cefPN1A9i6j_CjbCuoQy_hpG1)\n\n##### [判别器](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKaC1MRkNiMHp0VHM) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1wz0Ke0TL8J9x2AkfpYTBII0UfO_OPVgH)\n\n### 裸体肖像GAN\n![裸体肖像批次](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_5d37992c61e3.png)\n#### 下载权重！\n##### [生成器](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKdFJkdUFlNFRGRVE) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1WfGaeEMNgMp355J194NnfRr8TqHSlvVd)\n\n##### [判别器](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKUjdrckNQeGZqME0) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1bOLqlIsXrOYYxfQnwgNQloCy4D0p7bBe)\n\n\n### 肖像GAN\n![肖像批次](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_29c8288d34d3.png)\n#### 下载权重\n##### [生成器](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKUXhmazg2eVF0bTA) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1Ul9poUdKBSdyb6IAJlSXBP8zVOVpzHBT)\n\n##### [判别器](https:\u002F\u002Fdrive.google.com\u002Fopen?id=0B-_m9VM1w1bKMVh4S21BNlhzNEE) [(CPU)](https:\u002F\u002Fdrive.google.com\u002Fopen?id=1KJMUW0sOZ3CRjshCEsJPd76DN4GT6Otv)\n\n## 最显著的改动包括：\n* 图像尺寸翻倍——现为128×128，而非之前的64×64（两个网络均增加了一层）\n\n* 支持从检查点恢复训练（只需传入-netG=[网络路径]和-netD=[网络路径]）。这一功能不仅方便，还允许你在训练过程中先用一组图像进行训练，随后再切换到另一组图像继续训练。例如，你可以先训练一个风景网络，然后短暂地切换到抽象风格的数据集以生成抽象风景画（详见“从检查点恢复”部分），这相当于GAN中的风格迁移。\n\n* 包含了一个简单的Shell脚本，用于保持检查点文件夹的整洁——适合在训练GAN时持续运行。默认情况下，该脚本会为每个实验名称分别保留判别器和生成器最近的5个检查点。\n\n* 添加了一个Python 3脚本（utils\u002Fgenre-scraper.py），可轻松从WikiArt网站抓取图片，并将其转换为GAN可用的格式。\n\n* 增加了一个脚本（utils\u002Fgpu2cpu.lua），用于将GPU上训练的检查点转换为可在CPU上使用的模型。\n\n* 附带了多个预训练的GAN模型（.t7文件），能够生成多种类型的图像，包括128×128分辨率的风景油画、128×128分辨率的裸体油画等，具体见下文。\n\n## 使用方法：\n### 前置条件：\n参阅[INSTALL.md](INSTALL.md)\n\n### 一般使用方法：\n使用方式与Soumith的原版相同，唯一的区别在于可以从检查点加载模型，以及本项目自带了一个艺术作品抓取工具。\n\n### 从WikiArt抓取图像\n`genre-scraper.py`脚本可以根据艺术作品的流派从WikiArt网站抓取相关图像。使用方法非常简单。\n在`genre-scraper.py`中有一个名为`genre_to_scrape`的变量——只需将其修改为[此页面](https:\u002F\u002Fwww.wikiart.org\u002Fen\u002Fpaintings-by-genre\u002F)上列出的任意流派名称，或直接使用`genre_to_scrape`定义后注释中提供的大量选项之一。\n\n使用Python 3运行该程序后，系统会创建一个以你选择的流派命名的文件夹，其中包含一个名为“images\u002F”的子目录，里面存放所有抓取到的jpg格式图片。只需将GAN的DATA_ROOT指向你所选流派的文件夹即可（例如，如果我想训练风景画，只需将`genre_to_scrape`改为“landscape”，然后运行GAN并将DATA_ROOT设置为“landscape”）。\n\n### 在一个图像文件夹上训练 GAN\n\n#### 开始训练\n```\nDATA_ROOT=myimages dataset=folder ndf=50 ngf=150 th main.lua\n```\n\n你可以自由调整 ndf（判别器第一层的滤波器数量）和 ngf（生成器第一层的滤波器数量），不过建议生成器的滤波器数量是判别器的两倍左右，以防止判别器过于强大而压制生成器，因为生成器的任务要困难得多。\n\n请注意，在训练时还可以传递以下参数：\n```\nbatchSize=64              -- 批量大小 - 不过超过 128 后效果并不理想...\nnoise=normal, uniform     -- 只需选择其中一个。看起来正态分布的效果更好。\nnz=100                    -- Z 的维度数\nnThreads=1                -- 数据加载线程数\ngpu=1                     -- 使用的 GPU 编号\nname=experiment1          -- 为了避免覆盖已有的成果，可以用这个参数更改检查点文件名\n```\n\n\n#### 从检查点恢复训练\n```\nDATA_ROOT=myimages dataset=folder netD=checkpoints\u002Fyour_discriminator_net.t7 netG=your_driscriminator_net.t7 th main.lua\n```\n\n在这里，即使你传递 ndf 和 ngf 参数也不会有任何效果——因为网络已经从检查点中加载了。从检查点恢复训练并在不同的数据集上继续训练，可能会产生非常有趣的效果。下面展示了一个在风景图像上训练的 GAN，随后在一个半轮次内转而学习抽象艺术：\n\n![difference](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_readme_521ffeae4eb4.png)\n\n\n#### 使用预训练网络生成图像\n```\nnet=your_generator_net.t7 th generate.lua\n```\n\n非常简单……希望如此。需要注意的是，在生成图像时也可以传递以下参数：\n```\nbatchSize=36                      -- 生成多少张图像 - 输出不带边框时，请保持为 6 的倍数。\nimsize=1                          -- 图像的大小（单位不是像素！）\nnoisemode=normal, line, linefull  -- 只需选择其中一个。如果选择 line，则 batchSize 应大于 1，且 imsize 也应设为 1。\nname=generation1                  -- 为了避免覆盖已有的成果，可以用这个参数更改文件名\n```\n#### 更多可传递的参数请参阅[未修改网络的页面](https:\u002F\u002Fgithub.com\u002Fsoumith\u002Fdcgan.torch#all-training-options)——不过我认为这里已经包含了比较重要的选项####\n\n\n\n### 即将推出\n* 预训练网络：花卉绘画、城市景观（如果你有建议，请在公开议题中留言！）\n* 制作穿越潜在空间的动画 GIF\n* 也许会开发一个用于整个项目的图形用户界面……","# art-DCGAN 快速上手指南\n\nart-DCGAN 是基于 Soumith Chintala 的 DCGAN Torch 实现修改而成的版本，专注于生成艺术作品（如风景画、肖像画等）。主要改进包括支持 128x128 高分辨率图像生成、断点续训功能以及 WikiArt 数据集爬虫工具。\n\n## 环境准备\n\n本项目基于 **Torch (Lua)** 框架开发，非 Python 原生项目。请确保满足以下系统要求：\n\n*   **操作系统**: Linux 或 macOS (Windows 需通过 WSL 或 Docker 运行)\n*   **核心依赖**: \n    *   [Torch](http:\u002F\u002Ftorch.ch\u002F) (LuaJIT 2.1 + LuaRocks)\n    *   CUDA (如需 GPU 加速训练)\n    *   Python 3 (仅用于 `utils\u002Fgenre-scraper.py` 图片爬取脚本)\n*   **前置知识**: 熟悉基本的 Linux 命令行操作及 Torch 框架基础。\n\n> **注意**: 原文未提供中国镜像源。国内用户安装 Torch 时若遇网络问题，建议配置 LuaRocks 国内镜像或使用离线安装包。\n\n## 安装步骤\n\n1.  **克隆项目代码**\n    ```bash\n    git clone https:\u002F\u002Fgithub.com\u002Frobbiebarrat\u002Fart-DCGAN.git\n    cd art-DCGAN\n    ```\n\n2.  **安装依赖包**\n    根据官方 `INSTALL.md` 指引，安装所需的 Torch 包（通常包含 `nn`, `image`, `optim`, `cunn`, `cudnn` 等）。\n    ```bash\n    luarocks install nn\n    luarocks install image\n    luarocks install optim\n    # 如有 GPU，继续安装 cuda 相关包\n    luarocks install cunn\n    luarocks install cudnn\n    ```\n\n3.  **准备预训练模型（可选）**\n    如果直接使用预训练模型生成图像，需手动下载权重文件（因文件大于 100MB，GitHub 未直接收录）。\n    *   访问 README 中提供的 Google Drive 链接下载 `.t7` 文件（Generator 和 Discriminator）。\n    *   将下载的文件放入项目目录或指定路径。\n    *   *提示*: 若模型是在 GPU 上训练的，在 CPU 运行时需先运行转换脚本：\n        ```bash\n        th utils\u002Fgpu2cpu.lua your_gpu_model.t7\n        ```\n\n## 基本使用\n\n### 1. 获取训练数据（使用内置爬虫）\n项目提供了一个 Python 脚本，可从 WikiArt 按流派抓取图片。\n\n*   编辑 `utils\u002Fgenre-scraper.py`，修改变量 `genre_to_scrape` 为目标流派（例如 `\"landscape\"`）。\n*   运行脚本：\n    ```bash\n    python3 utils\u002Fgenre-scraper.py\n    ```\n    脚本将创建以流派命名的文件夹，并在其下生成 `images\u002F` 子目录存放 JPG 图片。\n\n### 2. 训练模型\n假设你已准备好名为 `myimages` 的图像文件夹（包含 `images\u002F` 子目录），运行以下命令开始训练：\n\n```bash\nDATA_ROOT=myimages dataset=folder ndf=50 ngf=150 th main.lua\n```\n\n**关键参数说明：**\n*   `ndf`: 判别器第一层滤波器数量。\n*   `ngf`: 生成器第一层滤波器数量（建议设为 `ndf` 的 2 倍左右，以防判别器过早压倒生成器）。\n*   `name`: 实验名称，用于区分保存的检查点文件。\n\n其他常用参数：\n```bash\nbatchSize=64              # 批次大小 (建议不超过 128)\nnoise=normal              # 噪声模式 (推荐 normal)\nnz=100                    # Z 向量维度\ngpu=1                     # 使用的 GPU ID\nname=experiment1          # 实验标识\n```\n\n### 3. 断点续训\n若需从检查点恢复训练（例如切换数据集进行风格迁移），使用 `-netG` 和 `-netD` 参数：\n\n```bash\nDATA_ROOT=myimages dataset=folder netD=checkpoints\u002Fyour_discriminator_net.t7 netG=checkpoints\u002Fyour_generator_net.t7 th main.lua\n```\n*注意：此时传入 `ndf` 和 `ngf` 参数无效，网络结构将从检查点加载。*\n\n### 4. 生成图像\n使用训练好的生成器模型生成艺术作品：\n\n```bash\nnet=your_generator_net.t7 th generate.lua\n```\n\n**生成参数示例：**\n```bash\nbatchSize=36                      # 生成图片数量 (建议为 6 的倍数)\nimsize=1                          # 图像缩放比例 (非像素值)\nnoisemode=normal                  # 噪声模式 (可选: normal, line, linefull)\nname=generation1                  # 输出文件名前缀\n```\n\n> **版权提示**: 使用本项目预训练模型生成的图像，请务必注明作者 (Robbie Barrat)。严禁出售预训练模型的直接输出结果（无论是否修改）。","一位独立游戏开发者正在为一款超现实主义冒险游戏快速生成大量风格统一的背景概念图，以填充早期原型的世界观。\n\n### 没有 art-DCGAN 时\n- 设计师必须手动绘制数百张油画风格的风景草图，耗时数周且难以保持笔触风格的高度一致。\n- 若尝试从头训练通用的 GAN 模型，不仅需要将图像分辨率限制在低清的 64x64，还缺乏针对艺术数据集的预处理脚本，数据清洗极其痛苦。\n- 训练过程一旦中断就无法恢复，导致无法灵活调整策略（例如先学写实风景再微调为抽象风格），试错成本极高。\n- 缺乏现成的高质量预训练模型，团队只能从零开始收集数据并漫长的等待收敛，严重拖慢开发进度。\n\n### 使用 art-DCGAN 后\n- 直接加载官方提供的 128x128 高分辨率“风景 GAN\"预训练权重，几分钟内即可批量生成细节丰富、风格统一的油画背景素材。\n- 利用内置的 WikiArt 爬虫脚本快速构建自定义数据集，并通过断点续训功能，先将模型训练为写实风景，再短期微调为抽象风格，轻松实现独特的艺术迁移效果。\n- 自动化的检查点管理脚本确保持续训练时磁盘空间不被占满，同时支持将 GPU 训练好的模型无缝转换为 CPU 版本，便于在普通设备上部署推理。\n- 基于成熟的修改版架构，开发者无需纠结网络层级设计，直接将精力集中在游戏玩法迭代而非底层算法调优上。\n\nart-DCGAN 通过提供高分辨率预训练模型和灵活的风格迁移训练机制，将艺术资产的生产周期从数周压缩至数小时，极大降低了创意原型的验证门槛。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Frobbiebarrat_art-DCGAN_ff7f290f.png","robbiebarrat","Robbie Barrat","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Frobbiebarrat_2619151d.jpg","Artist working with new media + AI","N\u002FA","Paris, France","robbiebarrat@gmail.com","videodrome","robbiebarrat.github.io","https:\u002F\u002Fgithub.com\u002Frobbiebarrat",[85,89,93],{"name":86,"color":87,"percentage":88},"Lua","#000080",80.9,{"name":90,"color":91,"percentage":92},"Python","#3572A5",17.8,{"name":94,"color":95,"percentage":96},"Shell","#89e051",1.3,2000,328,"2026-03-25T05:21:09","NOASSERTION",4,"Linux, macOS","需要 NVIDIA GPU (训练时必需，推理有 CPU 版本)，具体型号和显存未说明，需支持 Torch7 CUDA 扩展","未说明",{"notes":106,"python":107,"dependencies":108},"该项目基于 Lua (Torch7) 而非现代 Python PyTorch。核心训练和生成脚本 (.lua) 需在 Torch7 环境下运行。提供将 GPU 模型转换为 CPU 可用的脚本 (gpu2cpu.lua)。预训练模型文件较大 (>100MB)，需从 Google Drive 单独下载。图像数据集可通过自带的 Python 3 脚本从 Wikiart 爬取。","3.x (仅用于图像爬取脚本 utils\u002Fgenre-scraper.py)",[109,110,111,112,113,114,115],"Torch7 (Lua)","torch","cunn","cutorch","image","paths","optim",[15],[118,119,120,121],"gan","generative-art","art","painting",null,"2026-03-27T02:49:30.150509","2026-04-09T20:52:37.886144",[126,131,136,141,146,151],{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},26575,"如何在 CPU 上恢复使用 GPU 训练的预训练模型检查点？","如果在 CPU 上加载在 GPU 上训练的模型（.t7 文件），会报错 'unknown Torch class \u003Ctorch.CudaTensor>'。这是因为模型包含 CUDA 张量类，而 CPU 环境无法直接识别。通常需要在加载前将模型转换为 CPU 兼容格式，或者确保在具有 CUDA 支持的环境中运行。如果必须在 CPU 上运行，可能需要修改加载代码以映射或移除 CUDA 特定的类引用。","https:\u002F\u002Fgithub.com\u002Frobbiebarrat\u002Fart-DCGAN\u002Fissues\u002F3",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},26576,"训练后生成的图像仍然是噪声，无法正常生成，该怎么办？","GAN 很难训练，如果判别器（Discriminator）过于强大，生成器（Generator）就无法学习，导致输出一直是噪声。解决方法是调整两个网络的层数或滤波器数量比例。例如，有用户将比例从 50:150 调整为 20:120 后成功解决了问题。建议观察日志中的损失值：如果判别器损失（d_loss）迅速下降到接近 0（如 0.00001）并保持不变，说明判别器太强，需要削弱它（减少层数）或增强生成器。不同数据集可能需要不同的滤波器比例。","https:\u002F\u002Fgithub.com\u002Frobbiebarrat\u002Fart-DCGAN\u002Fissues\u002F4",{"id":137,"question_zh":138,"answer_zh":139,"source_url":140},26577,"运行示例时遇到 'Not a JPEG file' 或数据加载错误，如何修复？","这通常是因为数据集中混入了损坏的图像文件或非 JPEG 格式的文件（如爬虫下载失败产生的空文件或错误文件）。\n解决方案：\n1. Linux 用户可运行命令查找并删除损坏文件：`find . -iname '*.jpg' -print0 | xargs -0 jpeginfo -c`，然后删除报告错误的文件。\n2. Windows 用户可以按文件大小排序，删除最小和最大的约 10 个文件（通常是爬虫出错的极端值）。\n3. 检查是否有文件头不是 JPEG 标志的文件（如报错 'starts with 0x47 0x49' 表示是 GIF 文件被误命名为 jpg），手动清理这些文件。","https:\u002F\u002Fgithub.com\u002Frobbiebarrat\u002Fart-DCGAN\u002Fissues\u002F2",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},26578,"WikiArt 图片爬虫无法抓取图片，有什么替代方案？","由于 WikiArt 网站已改为 Angular 单页应用（SPA），原有的 Python 爬虫无法再正常工作。替代方案包括：\n1. 使用 Kaggle 上提供的现成数据集（如 'Painter by Numbers'）。\n2. 手动在浏览器控制台运行 JavaScript 提取所有图片 URL 保存为文件，然后修改下载脚本从 URL 列表下载。\n3. 维护一个包含各类别图片 URL 的文本文件列表，改写脚本直接读取这些列表进行下载，而不是实时爬取网页。","https:\u002F\u002Fgithub.com\u002Frobbiebarrat\u002Fart-DCGAN\u002Fissues\u002F8",{"id":147,"question_zh":148,"answer_zh":149,"source_url":150},26579,"如何设置训练轮数（epochs）以及如何保存和恢复模型检查点？","1. 训练轮数通过参数 `niter` 设置（例如 `niter : 100` 表示 100 轮）。\n2. 模型检查点（.t7 文件）通常在训练过程中按设定的迭代次数自动保存（由 `saveIter` 参数控制，默认可能为每 100 次迭代保存）。\n3. 若要恢复训练，需在启动命令中指定 `netG` 和 `netD` 参数指向已有的检查点文件路径（例如 `netG=checkpoints\u002Fmodel_net_G.t7`）。\n4. 暂停或退出训练时，确保程序已完成当前的保存步骤，生成的文件即位于 checkpoints 目录中。注意：`loadSize` 和 `fineSize` 参数仅在训练时有效，且受限于硬编码的网络架构，随意更改可能导致错误。","https:\u002F\u002Fgithub.com\u002Frobbiebarrat\u002Fart-DCGAN\u002Fissues\u002F10",{"id":152,"question_zh":153,"answer_zh":154,"source_url":155},26580,"使用自定义小数据集训练时报错，可能是什么原因？","使用自定义数据集时报错通常与图片文件的命名、格式或内容有关。确保所有图片均为有效的 JPEG 格式（无 Alpha 通道，RGB 模式），文件名规范（如 001.jpg）。如果数据集过小，也可能导致训练不稳定或报错。建议先使用 `jpeginfo` 等工具验证所有图片文件的完整性，并尝试增加数据集规模或检查数据加载脚本是否适配了您的文件路径结构。","https:\u002F\u002Fgithub.com\u002Frobbiebarrat\u002Fart-DCGAN\u002Fissues\u002F7",[]]