[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-jonbarron--robust_loss_pytorch":3,"tool-jonbarron--robust_loss_pytorch":61},[4,18,26,36,44,52],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",141543,2,"2026-04-06T11:32:54",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":10,"last_commit_at":50,"category_tags":51,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":53,"name":54,"github_repo":55,"description_zh":56,"stars":57,"difficulty_score":10,"last_commit_at":58,"category_tags":59,"status":17},4292,"Deep-Live-Cam","hacksider\u002FDeep-Live-Cam","Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。\n\n这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。\n\n其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。",88924,"2026-04-06T03:28:53",[14,15,13,60],"视频",{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":74,"owner_company":74,"owner_location":74,"owner_email":74,"owner_twitter":74,"owner_website":74,"owner_url":76,"languages":77,"stars":86,"forks":87,"last_commit_at":88,"license":89,"difficulty_score":90,"env_os":91,"env_gpu":92,"env_ram":92,"env_deps":93,"category_tags":98,"github_topics":74,"view_count":32,"oss_zip_url":74,"oss_zip_packed_at":74,"status":17,"created_at":100,"updated_at":101,"faqs":102,"releases":131},4515,"jonbarron\u002Frobust_loss_pytorch","robust_loss_pytorch","A pytorch port of google-research\u002Fgoogle-research\u002Frobust_loss\u002F","robust_loss_pytorch 是谷歌研究论文《A General and Adaptive Robust Loss Function》的 PyTorch 版本实现，旨在为深度学习任务提供更强大、灵活的损失函数方案。在模型训练中，异常值或噪声数据往往会导致传统损失函数（如均方误差）表现不佳，进而影响模型收敛与精度。robust_loss_pytorch 通过引入“通用”与“自适应”两种形式的鲁棒损失函数，有效缓解了这一痛点：通用形式允许研究者手动调节超参数以适配特定场景，而自适应形式则能自动调整参数，甚至支持在不同图像表示空间中施加约束，大幅降低了调参门槛。\n\n该工具特别适合从事计算机视觉、图像重建或需要处理含噪数据的 AI 研究人员与开发者使用。其核心亮点在于将复杂的数学分布理论封装为简洁的 API，用户只需导入 `lossfun` 或 `AdaptiveLossFunction` 即可轻松集成到现有项目中。此外，代码库还包含了完整的测试用例与示例笔记本，方便用户快速上手验证效果。如果你正在寻找一种既能提升模型抗干扰能力，又无需深陷复杂公式推导的解决方案，robust_los","robust_loss_pytorch 是谷歌研究论文《A General and Adaptive Robust Loss Function》的 PyTorch 版本实现，旨在为深度学习任务提供更强大、灵活的损失函数方案。在模型训练中，异常值或噪声数据往往会导致传统损失函数（如均方误差）表现不佳，进而影响模型收敛与精度。robust_loss_pytorch 通过引入“通用”与“自适应”两种形式的鲁棒损失函数，有效缓解了这一痛点：通用形式允许研究者手动调节超参数以适配特定场景，而自适应形式则能自动调整参数，甚至支持在不同图像表示空间中施加约束，大幅降低了调参门槛。\n\n该工具特别适合从事计算机视觉、图像重建或需要处理含噪数据的 AI 研究人员与开发者使用。其核心亮点在于将复杂的数学分布理论封装为简洁的 API，用户只需导入 `lossfun` 或 `AdaptiveLossFunction` 即可轻松集成到现有项目中。此外，代码库还包含了完整的测试用例与示例笔记本，方便用户快速上手验证效果。如果你正在寻找一种既能提升模型抗干扰能力，又无需深陷复杂公式推导的解决方案，robust_loss_pytorch 是一个值得尝试的专业选择。","# A General and Adaptive Robust Loss Function\n\nThis directory contains reference code for the paper\n[A General and Adaptive Robust Loss Function](https:\u002F\u002Farxiv.org\u002Fabs\u002F1701.03077),\nJonathan T. Barron CVPR, 2019\n\nThe code is implemented in Pytorch, and is a port of the TensorFlow\nimplementation at:\nhttps:\u002F\u002Fgithub.com\u002Fgoogle-research\u002Fgoogle-research\u002Ftree\u002Fmaster\u002Frobust_loss.\n\n## Installation\n\n### Typical Install\n```\npip install git+https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\n```\n\n### Development\n```\ngit clone https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\ncd robust_loss_pytorch\u002F\npip install -e .[dev]\n```\n\nTests can then be run from the root of the project using:\n```\nnosetests\n```\n\n## Usage\n\nTo use this code import `lossfun`, or `AdaptiveLossFunction` and call the loss\nfunction. `general.py` implements the \"general\" form of the loss, which assumes\nyou are prepared to set and tune hyperparameters yourself, and `adaptive.py`\nimplements the \"adaptive\" form of the loss, which tries to adapt the\nhyperparameters automatically and also includes support for imposing losses in\ndifferent image representations. The probability distribution underneath the\nadaptive loss is implemented in `distribution.py`.\n\n```\nfrom robust_loss_pytorch import lossfun\n```\n\nor\n\n```\nfrom robust_loss_pytorch import AdaptiveLossFunction\n```\n\nA toy example of how this code can be used is in `example.ipynb`.\n\n## Citation\n\nIf you use this code, please cite it:\n```\n@article{BarronCVPR2019,\n  Author = {Jonathan T. Barron},\n  Title = {A General and Adaptive Robust Loss Function},\n  Journal = {CVPR},\n  Year = {2019}\n}\n```\n","# 一种通用且自适应的鲁棒损失函数\n\n该目录包含论文\n[一种通用且自适应的鲁棒损失函数](https:\u002F\u002Farxiv.org\u002Fabs\u002F1701.03077)\nJonathan T. Barron CVPR, 2019 的参考代码。\n\n代码使用 PyTorch 实现，是对 TensorFlow 实现的移植，原 TensorFlow 实现位于：\nhttps:\u002F\u002Fgithub.com\u002Fgoogle-research\u002Fgoogle-research\u002Ftree\u002Fmaster\u002Frobust_loss。\n\n## 安装\n\n### 常规安装\n```\npip install git+https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\n```\n\n### 开发模式\n```\ngit clone https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\ncd robust_loss_pytorch\u002F\npip install -e .[dev]\n```\n\n之后可以在项目根目录下运行测试：\n```\nnosetests\n```\n\n## 使用\n\n要使用此代码，请导入 `lossfun` 或 `AdaptiveLossFunction` 并调用相应的损失函数。`general.py` 实现了“通用”形式的损失函数，假设用户已准备好自行设置和调整超参数；而 `adaptive.py` 实现了“自适应”形式的损失函数，它会尝试自动调整超参数，并支持在不同的图像表示中施加损失。自适应损失背后的概率分布实现在 `distribution.py` 中。\n\n```\nfrom robust_loss_pytorch import lossfun\n```\n\n或者\n\n```\nfrom robust_loss_pytorch import AdaptiveLossFunction\n```\n\n一个关于如何使用此代码的示例可在 `example.ipynb` 中找到。\n\n## 引用\n\n如果您使用此代码，请引用以下文献：\n```\n@article{BarronCVPR2019,\n  Author = {Jonathan T. Barron},\n  Title = {A General and Adaptive Robust Loss Function},\n  Journal = {CVPR},\n  Year = {2019}\n}\n```","# robust_loss_pytorch 快速上手指南\n\n## 环境准备\n\n- **操作系统**：Linux \u002F macOS \u002F Windows\n- **Python 版本**：建议 Python 3.6+\n- **核心依赖**：\n  - PyTorch (已安装)\n  - NumPy\n  - SciPy\n- **开发可选依赖**（如需运行测试）：`nose`\n\n## 安装步骤\n\n### 方式一：标准安装（推荐）\n直接通过 pip 从 GitHub 安装最新稳定版：\n\n```bash\npip install git+https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\n```\n\n> **提示**：国内用户若下载缓慢，可配置 pip 使用国内镜像源（如清华源）加速：\n> ```bash\n> pip install git+https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n### 方式二：开发模式安装\n如需修改源码或运行测试，请克隆仓库并安装：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\ncd robust_loss_pytorch\u002F\npip install -e .[dev]\n```\n\n安装完成后，可在项目根目录运行测试：\n\n```bash\nnosetests\n```\n\n## 基本使用\n\n该库提供两种主要用法：手动调节超参数的通用形式 (`lossfun`) 和自动适应超参数的自适应形式 (`AdaptiveLossFunction`)。\n\n### 1. 导入模块\n\n```python\n# 使用通用损失函数（需手动设置超参数）\nfrom robust_loss_pytorch import lossfun\n\n# 或使用自适应损失函数（自动调整超参数）\nfrom robust_loss_pytorch import AdaptiveLossFunction\n```\n\n### 2. 简单示例\n\n以下是使用 `lossfun` 计算损失的最小化示例：\n\n```python\nimport torch\nfrom robust_loss_pytorch import lossfun\n\n# 模拟残差数据 (batch_size, channels, height, width)\nresiduals = torch.randn(4, 3, 64, 64)\n\n# 定义超参数\nalpha = torch.tensor(1.5)  # 形状参数\nscale = torch.tensor(1.0)  # 尺度参数\n\n# 计算鲁棒损失\nloss = lossfun(residuals, alpha, scale)\n\nprint(loss.mean())\n```\n\n如需更复杂的自适应用法或多图像表示支持，请参考项目中的 `example.ipynb` 笔记本或 `adaptive.py` 源码。","某计算机视觉团队正在训练一个用于自动驾驶的语义分割模型，但训练数据中混入了大量因传感器故障产生的标注错误和异常噪声。\n\n### 没有 robust_loss_pytorch 时\n- 模型对异常值极度敏感，少数错误的标注像素导致损失函数剧烈波动，训练过程难以收敛。\n- 工程师需要手动反复调整损失函数的形状参数（如 $\\alpha$ 和 $c$），试图在保留有效梯度与抑制噪声之间寻找平衡，耗时且依赖经验。\n- 为了应对噪声，团队被迫花费数周时间进行昂贵的人工数据清洗，甚至不得不剔除部分包含复杂场景的宝贵数据。\n- 使用标准的 L2 或交叉熵损失时，模型倾向于“死记硬背”噪声点，导致在干净测试集上的泛化性能显著下降。\n\n### 使用 robust_loss_pytorch 后\n- 引入 `AdaptiveLossFunction` 后，模型自动根据误差大小动态调整损失曲线，天然抑制了异常标注带来的梯度干扰，训练迅速稳定。\n- 无需人工干预超参数，robust_loss_pytorch 自适应地学习每个样本的最佳鲁棒性强度，大幅减少了调参实验的次数。\n- 团队可以直接利用包含噪声的原始数据进行训练，省去了繁琐的数据清洗环节，显著缩短了项目迭代周期。\n- 模型学会了忽略不可靠的噪声信号而聚焦于真实结构，最终在标准评测集上的分割精度（mIoU）提升了 4.5%。\n\nrobust_loss_pytorch 通过自适应的数学机制，将原本棘手的噪声干扰问题转化为模型自动优化的过程，极大提升了深度学习在低质量数据下的鲁棒性与开发效率。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fjonbarron_robust_loss_pytorch_33eaaf93.png","jonbarron",null,"https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fjonbarron_7f42aca1.jpg","https:\u002F\u002Fgithub.com\u002Fjonbarron",[78,82],{"name":79,"color":80,"percentage":81},"Python","#3572A5",82,{"name":83,"color":84,"percentage":85},"Jupyter Notebook","#DA5B0B",18,698,88,"2026-03-19T08:19:46","Apache-2.0",1,"","未说明",{"notes":94,"python":92,"dependencies":95},"该工具是论文《A General and Adaptive Robust Loss Function》的 PyTorch 参考实现。安装时可通过 pip 直接安装或克隆仓库进行开发模式安装（需安装额外开发依赖）。主要功能模块包括 general.py（通用形式，需手动调节超参数）和 adaptive.py（自适应形式，自动调节超参数并支持不同图像表示）。测试使用 nosetests 运行。",[96,97],"torch","nose",[14,99],"其他","2026-03-27T02:49:30.150509","2026-04-07T00:49:39.883823",[103,108,113,117,122,127],{"id":104,"question_zh":105,"answer_zh":106,"source_url":107},20540,"为什么在训练过程中 AdaptiveLossFunction 的 alpha 和 scale 参数值没有变化？","这是因为损失函数的参数没有被包含在优化器中。默认情况下，如果你只将模型参数传入优化器（如 `model.parameters()`），损失函数的可学习参数不会被更新。\n\n解决方法是将模型参数和损失函数参数一起传入优化器。代码示例如下：\n\n```python\nfrom itertools import chain\n\ntrainable_params = filter(\n    lambda p: p.requires_grad, \n    chain(model.parameters(), criterion.parameters())\n)\noptimizer = torch.optim.Adam(trainable_params, ... )\n```\n\nPyTorch 支持这种每参数（per-parameter）的学习率设置方式。维护者表示，在他的实验中，将所有参数放入同一个优化器中效果良好。","https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\u002Fissues\u002F7",{"id":109,"question_zh":110,"answer_zh":111,"source_url":112},20541,"使用 wavelet 表示时遇到 \"Kernel size can't be greater than actual input size\" 错误怎么办？","这个错误通常是因为图像分辨率太小，而小波分解的层级数（num_levels）设置得太大，导致卷积核尺寸超过了输入尺寸。\n\n解决方案有以下几种：\n1. 减少 `wavelet_num_levels` 的值（例如尝试设置为 4 或 3）。\n2. 如果必须处理非常小的尺度，可以将 `representation` 参数设置为 'DCT'，这可以避免小波代码带来的问题且结果相当。\n3. 检查是否对图像进行了错误的 reshape 或 transpose 操作导致维度不匹配。\n\n注意：不要将层级数减少到 0 或 1，除非是为了调试，否则说明配置有严重问题。","https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\u002Fissues\u002F12",{"id":114,"question_zh":115,"answer_zh":116,"source_url":112},20542,"在使用 SfMLearner 复现时，如何更好地结合自适应损失函数？","维护者建议不要使用 SfMLearner 原有的多尺度损失构建方式，因为这容易在小尺度上引发维度错误。\n\n更好的做法是：直接在完整分辨率的图像上使用 adaptive + wavelet 损失。你可以通过修改 `wavelet_scale_base` 参数来控制损失在不同尺度的影响权重。这种方法需要使用 wavelet 版本的损失函数（因为 DCT 版本无法提供这种细粒度的尺度控制）。这在论文的附录 H 中有更详细的讨论。",{"id":118,"question_zh":119,"answer_zh":120,"source_url":121},20543,"AdaptiveImageLossFunction 在处理图像张量形状时有什么注意事项？","该函数期望的输入张量形状可能与 PyTorch 的常规习惯不同，或者在某些版本中存在形状解析的混淆（特别是在通道维度的位置）。\n\n如果遇到形状相关的错误，请检查是否需要手动 permute（置换）图像张量的维度以符合函数要求（例如从 NHWC 转为 NCHW，或者确认通道维度的位置）。虽然维护者提到这是一个已知的设计决策或潜在的改进点，但用户目前可能需要根据报错信息调整输入张量的维度顺序（如确保是 `N, C, H, W` 格式）。","https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\u002Fissues\u002F14",{"id":123,"question_zh":124,"answer_zh":125,"source_url":126},20544,"训练自适应损失函数时，推荐使用什么优化器、学习率或调度策略？","维护者建议：\n1. **优化器**：始终使用 Adam 优化器。\n2. **学习率**：自适应损失的参数通常比模型权重训练得慢得多，因此可以直接使用与模型权重相同的学习率和调度策略（learning rate schedule），无需为损失函数参数单独设置更低的学习率。\n3. **配置**：将所有参数（模型 + 损失函数）放入同一个优化器中即可正常工作。","https:\u002F\u002Fgithub.com\u002Fjonbarron\u002Frobust_loss_pytorch\u002Fissues\u002F6",{"id":128,"question_zh":129,"answer_zh":130,"source_url":126},20545,"如何将 robust_loss_pytorch 安装为 Python 包或在项目中使用？","虽然官方仓库主要提供源代码，但社区已经提供了打包安装的方案。你可以参考社区 Fork 的版本（如 khornlund 的分支）来获取 `setup.py` 或通过 pip 安装的流程。\n\n如果不想安装包，也可以直接将 `robust_loss_pytorch` 文件夹复制到你的项目目录中，然后像导入普通模块一样使用：\n```python\nfrom robust_loss_pytorch import adaptive\n# 或者\nimport robust_loss_pytorch.adaptive as adaptive\n```\n确保你的环境中已安装 PyTorch 和必要的依赖（如 numpy）。",[]]