[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-carpedm20--ENAS-pytorch":3,"tool-carpedm20--ENAS-pytorch":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",142651,2,"2026-04-06T23:34:12",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":77,"owner_location":78,"owner_email":77,"owner_twitter":77,"owner_website":77,"owner_url":79,"languages":80,"stars":89,"forks":90,"last_commit_at":91,"license":92,"difficulty_score":10,"env_os":93,"env_gpu":94,"env_ram":93,"env_deps":95,"category_tags":105,"github_topics":106,"view_count":32,"oss_zip_url":77,"oss_zip_packed_at":77,"status":17,"created_at":110,"updated_at":111,"faqs":112,"releases":141},4709,"carpedm20\u002FENAS-pytorch","ENAS-pytorch","PyTorch implementation of \"Efficient Neural Architecture Search via Parameters Sharing\"","ENAS-pytorch 是经典论文《通过参数共享实现高效神经架构搜索》的 PyTorch 复现版本，旨在帮助开发者和研究人员快速探索自动化的神经网络设计。传统神经架构搜索（NAS）技术虽然能自动发现高性能模型，但往往需要消耗巨大的计算资源（成千上万的 GPU 小时），门槛极高。ENAS-pytorch 的核心突破在于引入了“参数共享”机制：它构建一个包含所有可能子图的大型计算图，让不同候选模型共享其中的权重参数。这一创新将搜索过程的计算成本降低了约 1000 倍，使得在普通科研设备上运行成为可能。\n\n该工具特别适合人工智能领域的研究者、算法工程师以及对自动化机器学习（AutoML）感兴趣的高级开发者。利用它，用户可以轻松训练控制器来发现适用于循环神经网络（RNN）的高效单元结构，或在卷积神经网络（CNN）领域探索新的架构拓扑。项目不仅提供了在 Penn Treebank 等数据集上达到业界领先水平的预置方案，还集成了 TensorBoard 可视化支持，方便用户实时监控奖励、熵值和损失等关键指标。如果你希望深入理解神经架构搜索原理，或想在有限算力下尝试自动设计深度学习模型，ENAS-","ENAS-pytorch 是经典论文《通过参数共享实现高效神经架构搜索》的 PyTorch 复现版本，旨在帮助开发者和研究人员快速探索自动化的神经网络设计。传统神经架构搜索（NAS）技术虽然能自动发现高性能模型，但往往需要消耗巨大的计算资源（成千上万的 GPU 小时），门槛极高。ENAS-pytorch 的核心突破在于引入了“参数共享”机制：它构建一个包含所有可能子图的大型计算图，让不同候选模型共享其中的权重参数。这一创新将搜索过程的计算成本降低了约 1000 倍，使得在普通科研设备上运行成为可能。\n\n该工具特别适合人工智能领域的研究者、算法工程师以及对自动化机器学习（AutoML）感兴趣的高级开发者。利用它，用户可以轻松训练控制器来发现适用于循环神经网络（RNN）的高效单元结构，或在卷积神经网络（CNN）领域探索新的架构拓扑。项目不仅提供了在 Penn Treebank 等数据集上达到业界领先水平的预置方案，还集成了 TensorBoard 可视化支持，方便用户实时监控奖励、熵值和损失等关键指标。如果你希望深入理解神经架构搜索原理，或想在有限算力下尝试自动设计深度学习模型，ENAS-pytorch 是一个极具价值的开源起点。","# Efficient Neural Architecture Search (ENAS) in PyTorch\n\nPyTorch implementation of [Efficient Neural Architecture Search via Parameters Sharing](https:\u002F\u002Farxiv.org\u002Fabs\u002F1802.03268).\n\n\u003Cp align=\"center\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_16116e3fce46.png\" alt=\"ENAS_rnn\" width=\"60%\">\u003C\u002Fp>\n\n**ENAS** reduce the computational requirement (GPU-hours) of [Neural Architecture Search](https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.01578) (**NAS**) by 1000x via parameter sharing between models that are subgraphs within a large computational graph. SOTA on `Penn Treebank` language modeling.\n\n**\\*\\*[Caveat] Use official code from the authors: [link](https:\u002F\u002Fgithub.com\u002Fmelodyguan\u002Fenas)\\*\\***\n\n\n## Prerequisites\n\n- Python 3.6+\n- [PyTorch==0.3.1](https:\u002F\u002Fpytorch.org\u002Fget-started\u002Fprevious-versions\u002F)\n- tqdm, scipy, imageio, graphviz, tensorboardX\n\n## Usage\n\nInstall prerequisites with:\n\n    conda install graphviz\n    pip install -r requirements.txt\n\nTo train **ENAS** to discover a recurrent cell for RNN:\n\n    python main.py --network_type rnn --dataset ptb --controller_optim adam --controller_lr 0.00035 \\\n                   --shared_optim sgd --shared_lr 20.0 --entropy_coeff 0.0001\n\n    python main.py --network_type rnn --dataset wikitext\n\nTo train **ENAS** to discover CNN architecture (in progress):\n\n    python main.py --network_type cnn --dataset cifar --controller_optim momentum --controller_lr_cosine=True \\\n                   --controller_lr_max 0.05 --controller_lr_min 0.0001 --entropy_coeff 0.1\n\nor you can use your own dataset by placing images like:\n\n    data\n    ├── YOUR_TEXT_DATASET\n    │   ├── test.txt\n    │   ├── train.txt\n    │   └── valid.txt\n    ├── YOUR_IMAGE_DATASET\n    │   ├── test\n    │   │   ├── xxx.jpg (name doesn't matter)\n    │   │   ├── yyy.jpg (name doesn't matter)\n    │   │   └── ...\n    │   ├── train\n    │   │   ├── xxx.jpg\n    │   │   └── ...\n    │   └── valid\n    │       ├── xxx.jpg\n    │       └── ...\n    ├── image.py\n    └── text.py\n\nTo generate `gif` image of generated samples:\n\n    python generate_gif.py --model_name=ptb_2018-02-15_11-20-02 --output=sample.gif\n\nMore configurations can be found [here](config.py).\n\n\n## Results\n\nEfficient Neural Architecture Search (**ENAS**) is composed of two sets of learnable parameters, controller LSTM *θ* and the shared parameters *ω*. These two parameters are alternatively trained and only trained controller is used to derive novel architectures.\n\n### 1. Discovering Recurrent Cells\n\n![rnn](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_ed54f6f0fffd.png)\n\nController LSTM decide 1) what activation function to use and 2) which previous node to connect.\n\nThe RNN cell **ENAS** discovered for `Penn Treebank` and `WikiText-2` dataset:\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_fb3a30acd46f.gif\" alt=\"ptb\" width=\"45%\"> \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_0e38cc2eef23.gif\" alt=\"wikitext\" width=\"45%\">\n\nBest discovered ENAS cell for `Penn Treebank` at epoch 27:\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_88e65dc34c79.png\" alt=\"ptb\" width=\"30%\">\n\nYou can see the details of training (e.g. `reward`, `entropy`, `loss`) with:\n\n    tensorboard --logdir=logs --port=6006\n\n\n### 2. Discovering Convolutional Neural Networks\n\n![cnn](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_bc98d497f978.png)\n\nController LSTM samples 1) what computation operation to use and 2) which previous node to connect.\n\nThe CNN network **ENAS** discovered for `CIFAR-10` dataset:\n\n(in progress)\n\n\n### 3. Designing Convolutional Cells\n\n(in progress)\n\n\n## Reference\n\n- [Neural Architecture Search with Reinforcement Learning](https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.01578)\n- [Neural Optimizer Search with Reinforcement Learning](https:\u002F\u002Farxiv.org\u002Fabs\u002F1709.07417)\n\n\n## Author\n\nTaehoon Kim \u002F [@carpedm20](http:\u002F\u002Fcarpedm20.github.io\u002F)\n","# PyTorch 中的高效神经架构搜索 (ENAS)\n\n基于 [通过参数共享进行高效神经架构搜索](https:\u002F\u002Farxiv.org\u002Fabs\u002F1802.03268) 的 PyTorch 实现。\n\n\u003Cp align=\"center\">\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_16116e3fce46.png\" alt=\"ENAS_rnn\" width=\"60%\">\u003C\u002Fp>\n\n**ENAS** 通过在大型计算图中的子图模型之间共享参数，将 [神经架构搜索](https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.01578)（**NAS**）的计算需求（GPU 小时数）降低了 1000 倍。在 `Penn Treebank` 语言建模任务上达到 SOTA 水平。\n\n**\\*\\*[注意] 请使用作者提供的官方代码：[链接](https:\u002F\u002Fgithub.com\u002Fmelodyguan\u002Fenas)\\*\\***\n\n\n## 先决条件\n\n- Python 3.6+\n- [PyTorch==0.3.1](https:\u002F\u002Fpytorch.org\u002Fget-started\u002Fprevious-versions\u002F)\n- tqdm、scipy、imageio、graphviz、tensorboardX\n\n## 使用方法\n\n安装先决条件：\n\n    conda install graphviz\n    pip install -r requirements.txt\n\n训练 **ENAS** 以发现用于 RNN 的循环单元：\n\n    python main.py --network_type rnn --dataset ptb --controller_optim adam --controller_lr 0.00035 \\\n                   --shared_optim sgd --shared_lr 20.0 --entropy_coeff 0.0001\n\n    python main.py --network_type rnn --dataset wikitext\n\n训练 **ENAS** 以发现 CNN 架构（正在进行中）：\n\n    python main.py --network_type cnn --dataset cifar --controller_optim momentum --controller_lr_cosine=True \\\n                   --controller_lr_max 0.05 --controller_lr_min 0.0001 --entropy_coeff 0.1\n\n或者，您也可以使用自己的数据集，将图像放置如下：\n\n    data\n    ├── YOUR_TEXT_DATASET\n    │   ├── test.txt\n    │   ├── train.txt\n    │   └── valid.txt\n    ├── YOUR_IMAGE_DATASET\n    │   ├── test\n    │   │   ├── xxx.jpg（文件名无关紧要）\n    │   │   ├── yyy.jpg（文件名无关紧要）\n    │   │   └── ...\n    │   ├── train\n    │   │   ├── xxx.jpg\n    │   │   └── ...\n    │   └── valid\n    │       ├── xxx.jpg\n    │       └── ...\n    ├── image.py\n    └── text.py\n\n生成生成样本的 `gif` 图像：\n\n    python generate_gif.py --model_name=ptb_2018-02-15_11-20-02 --output=sample.gif\n\n更多配置可在 [config.py](config.py) 中找到。\n\n\n## 结果\n\n高效神经架构搜索（**ENAS**）由两组可学习参数组成：控制器 LSTM *θ* 和共享参数 *ω*。这两组参数交替训练，最终仅使用训练好的控制器来推导出新的架构。\n\n### 1. 发现循环单元\n\n![rnn](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_ed54f6f0fffd.png)\n\n控制器 LSTM 决定：1) 使用何种激活函数；2) 连接到哪个前序节点。\n\n**ENAS** 为 `Penn Treebank` 和 `WikiText-2` 数据集发现的 RNN 单元：\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_fb3a30acd46f.gif\" alt=\"ptb\" width=\"45%\"> \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_0e38cc2eef23.gif\" alt=\"wikitext\" width=\"45%\">\n\n在第 27 轮 epoch 时为 `Penn Treebank` 发现的最佳 ENAS 单元：\n\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_88e65dc34c79.png\" alt=\"ptb\" width=\"30%\">\n\n您可以通过以下命令查看训练细节（如 `reward`、`entropy`、`loss`）：\n\n    tensorboard --logdir=logs --port=6006\n\n\n### 2. 发现卷积神经网络\n\n![cnn](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_readme_bc98d497f978.png)\n\n控制器 LSTM 采样决定：1) 使用何种计算操作；2) 连接到哪个前序节点。\n\n**ENAS** 为 `CIFAR-10` 数据集发现的 CNN 网络：\n\n（正在进行中）\n\n\n### 3. 设计卷积单元\n\n（正在进行中）\n\n\n## 参考文献\n\n- [使用强化学习进行神经架构搜索](https:\u002F\u002Farxiv.org\u002Fabs\u002F1611.01578)\n- [使用强化学习进行神经优化器搜索](https:\u002F\u002Farxiv.org\u002Fabs\u002F1709.07417)\n\n\n## 作者\n\nTaehoon Kim \u002F [@carpedm20](http:\u002F\u002Fcarpedm20.github.io\u002F)","# ENAS-pytorch 快速上手指南\n\n本指南基于 PyTorch 实现的 **Efficient Neural Architecture Search (ENAS)**，旨在通过参数共享技术，将神经架构搜索（NAS）的计算成本降低 1000 倍，快速发现高效的 RNN 或 CNN 结构。\n\n> **注意**：本项目为社区实现版本。如需生产环境使用，建议优先参考作者官方代码库：[melodyguan\u002Fenas](https:\u002F\u002Fgithub.com\u002Fmelodyguan\u002Fenas)。\n\n## 1. 环境准备\n\n在开始之前，请确保您的系统满足以下要求：\n\n*   **操作系统**：Linux \u002F macOS \u002F Windows\n*   **Python 版本**：3.6 及以上\n*   **PyTorch 版本**：**必须为 0.3.1** (版本不匹配可能导致运行失败)\n*   **其他依赖**：tqdm, scipy, imageio, graphviz, tensorboardX\n\n**国内加速建议**：\n安装 Python 包时，推荐使用清华或阿里镜像源以提升下载速度。\n\n## 2. 安装步骤\n\n### 第一步：安装系统级依赖\nENAS 需要 `graphviz` 来可视化生成的网络结构。\n\n*   **Conda 用户（推荐）**：\n    ```bash\n    conda install graphviz\n    ```\n*   **Ubuntu\u002FDebian 用户**：\n    ```bash\n    sudo apt-get install graphviz graphviz-dev\n    ```\n*   **macOS 用户**：\n    ```bash\n    brew install graphviz\n    ```\n\n### 第二步：安装 Python 依赖\n克隆项目后，进入目录并安装所需的 Python 包。建议使用国内镜像源加速安装：\n\n```bash\npip install -r requirements.txt -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n> **重要提示**：请手动检查并确保安装的 `torch` 版本严格等于 `0.3.1`。如果当前环境版本过高，请使用以下命令降级：\n> ```bash\n> pip install torch==0.3.1 -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n## 3. 基本使用\n\nENAS 主要用于自动搜索循环神经网络（RNN）单元或卷积神经网络（CNN）架构。以下是两种最常用场景的启动命令。\n\n### 场景一：搜索 RNN 循环单元（推荐入门）\n此命令将在 `Penn Treebank (PTB)` 数据集上训练控制器，以发现最优的 RNN 细胞结构。\n\n```bash\npython main.py --network_type rnn --dataset ptb --controller_optim adam --controller_lr 0.00035 \\\n               --shared_optim sgd --shared_lr 20.0 --entropy_coeff 0.0001\n```\n\n若需使用 `WikiText` 数据集，可运行：\n```bash\npython main.py --network_type rnn --dataset wikitext\n```\n\n### 场景二：搜索 CNN 架构（实验阶段）\n此命令将在 `CIFAR-10` 数据集上搜索卷积神经网络架构。\n\n```bash\npython main.py --network_type cnn --dataset cifar --controller_optim momentum --controller_lr_cosine=True \\\n               --controller_lr_max 0.05 --controller_lr_min 0.0001 --entropy_coeff 0.1\n```\n\n### 自定义数据集\n如果您想使用自己的数据，请按以下结构组织文件：\n\n```text\ndata\n├── YOUR_TEXT_DATASET\n│   ├── test.txt\n│   ├── train.txt\n│   └── valid.txt\n├── YOUR_IMAGE_DATASET\n│   ├── test\n│   │   ├── xxx.jpg\n│   │   └── ...\n│   ├── train\n│   │   ├── xxx.jpg\n│   │   └── ...\n│   └── valid\n│       ├── xxx.jpg\n│       └── ...\n├── image.py\n└── text.py\n```\n\n### 查看训练进度与结果\n训练过程中产生的奖励（reward）、熵（entropy）和损失（loss）等指标可通过 TensorBoard 查看：\n\n```bash\ntensorboard --logdir=logs --port=6006\n```\n\n训练完成后，可生成搜索到的网络结构 GIF 动图：\n\n```bash\npython generate_gif.py --model_name=ptb_2018-02-15_11-20-02 --output=sample.gif\n```\n\n更多高级配置参数请参考 `config.py` 文件。","某金融科技公司的算法团队正致力于优化高频交易中的时间序列预测模型，急需在有限的算力预算下找到超越传统 LSTM 的循环神经网络结构。\n\n### 没有 ENAS-pytorch 时\n- **算力成本高昂**：采用传统的神经架构搜索（NAS）方法，需要独立训练成千上万个候选模型，消耗数千 GPU 小时，远超部门预算。\n- **研发周期漫长**：人工设计并验证不同的 RNN 细胞结构耗时数周，难以快速响应市场数据分布的变化。\n- **依赖专家经验**：网络拓扑和激活函数的选择高度依赖资深算法工程师的直觉，容易陷入局部最优，错过创新结构。\n- **资源闲置浪费**：大量计算资源耗费在训练表现平庸的中间模型上，无法实现参数复用，效率极低。\n\n### 使用 ENAS-pytorch 后\n- **效率提升千倍**：利用参数共享机制，所有候选子图共享权重，将搜索所需的 GPU 时间减少了 1000 倍，单卡即可完成实验。\n- **自动发现最优结构**：控制器 LSTM 自动探索连接方式与激活函数，在 Penn Treebank 等数据集上挖掘出人类未曾设想的高效 RNN 细胞。\n- **迭代速度质变**：从提出需求到获得最优架构仅需数天，团队能快速将新模型部署至生产环境进行实盘测试。\n- **降低试错门槛**：无需预先假设网络形态，ENAS-pytorch 通过强化学习自动权衡模型复杂度与预测精度，让初级工程师也能产出 SOTA 结果。\n\nENAS-pytorch 通过参数共享技术彻底打破了神经架构搜索的算力壁垒，让中小企业也能以极低成本自动定制顶尖的深度学习模型。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fcarpedm20_ENAS-pytorch_72a057b1.png","carpedm20","Taehoon","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fcarpedm20_c71eb65e.jpg","ex @openai. a machine like human",null,"Seoul","https:\u002F\u002Fgithub.com\u002Fcarpedm20",[81,85],{"name":82,"color":83,"percentage":84},"Python","#3572A5",98.6,{"name":86,"color":87,"percentage":88},"Shell","#89e051",1.4,2726,488,"2026-04-06T15:34:19","Apache-2.0","未说明","需要 GPU（文中提及大幅减少 GPU 小时数），具体型号、显存大小及 CUDA 版本未说明",{"notes":96,"python":97,"dependencies":98},"该工具基于非常古老的 PyTorch 0.3.1 版本，与现代环境兼容性差。README 明确建议优先使用作者官方的 TensorFlow 实现代码。安装 graphviz 需同时安装系统级包（如通过 conda）和 Python 包。训练任务涉及控制器 LSTM 和共享参数的交替训练。","3.6+",[99,100,101,102,103,104],"torch==0.3.1","tqdm","scipy","imageio","graphviz","tensorboardX",[14],[107,108,109],"pytorch","neural-architecture-search","google-brain","2026-03-27T02:49:30.150509","2026-04-07T08:26:22.402609",[113,118,123,128,133,137],{"id":114,"question_zh":115,"answer_zh":116,"source_url":117},21419,"运行代码时出现 'SyntaxError: invalid syntax' 错误，特别是在包含 f-string 的行，如何解决？","该错误通常是因为 Python 版本过低。f-string（格式化字符串字面值）需要 Python 3.6 或更高版本。请检查您的 Python 版本，并升级到 Python 3.6+。此外，该项目可能需要特定版本的 PyTorch（如 0.3.1），如果使用 PyTorch 0.4.0 可能会遇到其他兼容性问题，建议尝试降级 PyTorch 或根据报错调整环境。","https:\u002F\u002Fgithub.com\u002Fcarpedm20\u002FENAS-pytorch\u002Fissues\u002F17",{"id":119,"question_zh":120,"answer_zh":121,"source_url":122},21420,"训练过程中出现 'RuntimeError: cuda runtime error (59) : device-side assert triggered' 或损失变为 'nan' 是什么原因？","这通常是因为控制器（Controller）学习到了无效的网络结构。具体来说，对于 RNN 单元，控制器可能在通往输出节点的路径中放置了压缩非线性激活函数（如 tanh），或者在某些情况下移除了必要的非线性，导致梯度爆炸或数值不稳定，最终产生 NaN 损失并触发 CUDA 断言错误。这属于算法收敛过程中的已知现象，可能需要调整控制器的探索策略、熵系数（entropy_coeff）或检查网络构建逻辑。","https:\u002F\u002Fgithub.com\u002Fcarpedm20\u002FENAS-pytorch\u002Fissues\u002F6",{"id":124,"question_zh":125,"answer_zh":126,"source_url":127},21421,"为什么 Controller 中的 encoder 嵌入层大小（num_total_tokens）看起来过大，似乎是所有 token 数量的总和？","这是设计意图而非 Bug。虽然理论上索引范围可能较小，但代码假设在不同位置出现的相同激活函数具有不同的语义（即不同的嵌入表示）。维护者认为，位于不同位置的激活函数可能扮演不同的角色，因此为每个位置的每个可能选项分配独立的嵌入向量是合理的，即使这增加了参数量。","https:\u002F\u002Fgithub.com\u002Fcarpedm20\u002FENAS-pytorch\u002Fissues\u002F33",{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},21422,"运行默认脚本或 CNN 任务时遇到 'CUDA out of memory' 错误，即使有多张 GPU 且显存充足，该如何解决？","这是一个常见的显存溢出问题。即便拥有多张 GPU（如 3 张 10GB 显存），默认配置下的模型大小或批量大小（batch size）仍可能超出单卡限制。解决方法包括：1. 减小批量大小；2. 使用 --network_type cnn 时尝试调整控制器学习率调度（如使用 cosine annealing）；3. 确保代码正确利用了多 GPU 设置（如果支持），或者手动限制可见 GPU 数量。如果问题依旧，可能需要检查 trainer.py 中的模型构建部分是否意外将所有参数加载到了单张卡上。","https:\u002F\u002Fgithub.com\u002Fcarpedm20\u002FENAS-pytorch\u002Fissues\u002F18",{"id":134,"question_zh":135,"answer_zh":136,"source_url":117},21423,"项目对 PyTorch 版本有什么具体要求？使用新版本会怎样？","该项目最初是基于 PyTorch 0.3.1 开发的。升级到 PyTorch 0.4.0 可能会导致代码崩溃，因为 0.4.0 引入了 0 维张量等破坏性更新，改变了原有的行为。如果遇到奇怪的运行时错误或维度不匹配，建议尝试回退到 PyTorch 0.3.1 版本，或者根据新版 API 修改源代码以适配。",{"id":138,"question_zh":139,"answer_zh":140,"source_url":117},21424,"训练共享权重时出现 'AttributeError' 或关于 'utils.detach' 的错误怎么办？","这通常是由于 PyTorch 版本不兼容导致的 API 变更。在较新的 PyTorch 版本中，tensor.detach() 的用法或位置可能发生了变化。如果在 trainer.py 的 train_shared 方法中遇到此类错误，请检查 utils.py 中的 detach 实现，并确保其符合当前安装的 PyTorch 版本规范。通常升级到正确的 Python 版本（3.6+）并匹配对应的 PyTorch 版本可解决此类问题。",[]]