[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-lambdaji--tf_repos":3,"tool-lambdaji--tf_repos":61},[4,18,26,36,44,52],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",141543,2,"2026-04-06T11:32:54",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":10,"last_commit_at":50,"category_tags":51,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":53,"name":54,"github_repo":55,"description_zh":56,"stars":57,"difficulty_score":10,"last_commit_at":58,"category_tags":59,"status":17},4292,"Deep-Live-Cam","hacksider\u002FDeep-Live-Cam","Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。\n\n这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。\n\n其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。",88924,"2026-04-06T03:28:53",[14,15,13,60],"视频",{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":69,"owner_location":69,"owner_email":69,"owner_twitter":69,"owner_website":76,"owner_url":77,"languages":78,"stars":91,"forks":92,"last_commit_at":93,"license":69,"difficulty_score":32,"env_os":94,"env_gpu":95,"env_ram":95,"env_deps":96,"category_tags":100,"github_topics":101,"view_count":32,"oss_zip_url":69,"oss_zip_packed_at":69,"status":109,"created_at":110,"updated_at":111,"faqs":112,"releases":143},4380,"lambdaji\u002Ftf_repos","tf_repos","TensorFlow Script","tf_repos 是一个基于 TensorFlow 构建的实用型开源代码库，旨在为深度学习算法的快速落地提供一站式解决方案。它主要解决了研究人员和开发者在复现经典模型时面临的代码分散、实现标准不一以及从零搭建耗时费力等痛点。\n\n该工具包涵盖了四大核心领域：在点击率（CTR）预估方面，集成了 DeepFM、Wide & Deep、NFM、AFM 及 Deep & Cross Network 等主流算法；在强化学习领域，提供了完整的 DeepRL 实现方案；同时支持多任务学习（DeepMTL）以及以 DSSM 为代表的文本深度学习算法（DeepTXT）。通过将复杂的理论模型转化为结构清晰、可直接运行的 TensorFlow 脚本，tf_repos 极大地降低了算法验证与工程应用的门槛。\n\n这款工具特别适合人工智能领域的算法工程师、数据科学家及高校研究人员使用。无论是需要快速搭建基线模型进行对比实验，还是希望深入理解特定网络结构的内部机制，用户都能从中获得高质量的参考代码。其模块化设计和对多种前沿架构的支持，使其成为探索推荐系统、自然语言处理及决策智能等领域的得力助手，帮助使用者将更多精力聚","tf_repos 是一个基于 TensorFlow 构建的实用型开源代码库，旨在为深度学习算法的快速落地提供一站式解决方案。它主要解决了研究人员和开发者在复现经典模型时面临的代码分散、实现标准不一以及从零搭建耗时费力等痛点。\n\n该工具包涵盖了四大核心领域：在点击率（CTR）预估方面，集成了 DeepFM、Wide & Deep、NFM、AFM 及 Deep & Cross Network 等主流算法；在强化学习领域，提供了完整的 DeepRL 实现方案；同时支持多任务学习（DeepMTL）以及以 DSSM 为代表的文本深度学习算法（DeepTXT）。通过将复杂的理论模型转化为结构清晰、可直接运行的 TensorFlow 脚本，tf_repos 极大地降低了算法验证与工程应用的门槛。\n\n这款工具特别适合人工智能领域的算法工程师、数据科学家及高校研究人员使用。无论是需要快速搭建基线模型进行对比实验，还是希望深入理解特定网络结构的内部机制，用户都能从中获得高质量的参考代码。其模块化设计和对多种前沿架构的支持，使其成为探索推荐系统、自然语言处理及决策智能等领域的得力助手，帮助使用者将更多精力聚焦于业务逻辑创新而非底层代码重复建设。","# Practical TensorFlow Repository\n\n- deep_ctr： DeepFM\u002Fwide_n_deep\u002FFNN\u002FPNN\u002FNFM\u002FAFM\u002FDeep & Cross Network等CTR预估相关深度学习算法\n- DeepRL：   Deep-Reinforcement Learing\n- DeepMTL：  Multi-task Learning\n- DeepTXT：  DSSM等文本相关深度学习算法\n\nWelcome to pull requests!\n",null,"# tf_repos 快速上手指南\n\n`tf_repos` 是一个实用的 TensorFlow 算法仓库，涵盖了 CTR 预估（如 DeepFM、Wide&Deep）、深度强化学习（DeepRL）、多任务学习（DeepMTL）以及文本深度学习（如 DSSM）等主流模型。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Linux (推荐 Ubuntu 18.04+)、macOS 或 Windows (需配置 WSL2)\n*   **Python 版本**：Python 3.6 - 3.9\n*   **核心依赖**：\n    *   TensorFlow 2.x (建议 2.4+)\n    *   NumPy\n    *   Pandas\n    *   Scikit-learn\n\n> **国内加速建议**：\n> 推荐使用清华或阿里镜像源安装 Python 依赖，以提升下载速度：\n> ```bash\n> pip install -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple \u003Cpackage_name>\n> ```\n\n## 安装步骤\n\n1.  **克隆项目代码**\n    使用 Git 将仓库克隆到本地：\n    ```bash\n    git clone https:\u002F\u002Fgithub.com\u002Fshenweichen\u002Ftf_repos.git\n    cd tf_repos\n    ```\n    *(注：如果访问 GitHub 较慢，可使用国内镜像源如 Gitee 同步后的地址)*\n\n2.  **安装依赖包**\n    进入项目目录并安装所需库：\n    ```bash\n    pip install -r requirements.txt\n    ```\n    若项目中未提供 `requirements.txt`，请手动安装核心依赖：\n    ```bash\n    pip install -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple tensorflow numpy pandas scikit-learn\n    ```\n\n## 基本使用\n\n本项目按功能模块划分目录，以下以 `deep_ctr` 模块中的 **DeepFM** 模型为例，展示最简调用流程。\n\n1.  **准备数据**\n    确保你有一份包含特征列和标签列的 CSV 数据文件（例如 `data.csv`）。\n\n2.  **运行示例代码**\n    进入对应模块目录，编写或运行以下 Python 脚本：\n\n    ```python\n    import pandas as pd\n    from deepctr.models import DeepFM\n    from deepctr.feature_column import SparseFeat, DenseFeat, get_feature_names\n\n    # 1. 加载简单示例数据\n    data = pd.read_csv('your_data.csv') \n    sparse_features = ['feat_1', 'feat_2']\n    dense_features = ['feat_3']\n    target = ['label']\n\n    # 2. 定义特征列\n    feature_columns = [SparseFeat(feat, vocabulary_size=1000, embedding_dim=4) for feat in sparse_features] + \\\n                      [DenseFeat(feat, 1,) for feat in dense_features]\n\n    # 3. 构建模型\n    model = DeepFM(feature_columns, feature_columns, task='binary')\n\n    # 4. 编译与训练\n    model.compile(\"adam\", \"binary_crossentropy\", metrics=['binary_accuracy'])\n    history = model.fit(data[get_feature_names(feature_columns)], data[target], batch_size=256, epochs=5)\n    ```\n\n3.  **探索其他模块**\n    *   **DeepRL**: 进入 `DeepRL\u002F` 目录查看强化学习示例。\n    *   **DeepMTL**: 进入 `DeepMTL\u002F` 目录查看多任务学习实现。\n    *   **DeepTXT**: 进入 `DeepTXT\u002F` 目录查看 DSSM 等文本匹配算法。\n\n直接参考各子目录下的具体脚本即可快速复现相应论文算法。","某电商公司的算法团队正急需构建一个高精度的商品点击率（CTR）预估模型，以优化首页推荐流的转化率。\n\n### 没有 tf_repos 时\n- **重复造轮子耗时久**：团队成员需从零手写 DeepFM、Wide&Deep 等经典模型的底层 TensorFlow 代码，仅搭建基础架构就耗费了两周时间。\n- **算法验证门槛高**：想要对比 NFM 或 AFM 等新锐算法的效果，需要查阅大量论文并自行复现，极易因细节偏差导致实验失败。\n- **业务场景割裂**：处理多任务学习（如同时预估点击与购买）时，缺乏现成的 DeepMTL 框架参考，导致多目标损失函数难以调优。\n- **文本特征利用难**：面对商品标题和用户评论等非结构化数据，缺少 DSSM 等成熟的文本深度学习模块，只能被迫放弃这部分高价值特征。\n\n### 使用 tf_repos 后\n- **开箱即用提效率**：直接调用 deep_ctr 模块中预置的 DeepFM 和 PNN 等算法模板，将模型搭建周期从两周压缩至两天。\n- **快速迭代试错**：通过切换配置文件即可在 FNN、Deep & Cross Network 等多种架构间自由对比，一天内完成了以往一周的算法筛选工作。\n- **多任务无缝集成**：利用 DeepMTL 模块轻松构建共享底层的多元预估模型，显著提升了点击率与转化率的双重指标。\n- **图文融合更深层**：引入 DeepTXT 中的 DSSM 算法，成功将商品文本语义转化为向量特征，使长尾商品的推荐准确度大幅提升。\n\ntf_repos 将原本需要数月研发的算法基建工作转化为简单的配置调用，让团队能专注于业务逻辑创新而非底层代码实现。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Flambdaji_tf_repos_a2e33906.png","lambdaji","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Flambdaji_f8fdf28a.png","ML Designer\r\nhttps:\u002F\u002Fwww.zhihu.com\u002Fpeople\u002Flambdaji","https:\u002F\u002Fwww.zhihu.com\u002Fpeople\u002Flambdaji","https:\u002F\u002Fgithub.com\u002Flambdaji",[79,83,87],{"name":80,"color":81,"percentage":82},"Python","#3572A5",90.7,{"name":84,"color":85,"percentage":86},"C++","#f34b7d",4.7,{"name":88,"color":89,"percentage":90},"Shell","#89e051",4.6,687,311,"2026-03-22T10:04:57","","未说明",{"notes":97,"python":95,"dependencies":98},"README 仅列出了包含的算法模块（如 deep_ctr, DeepRL 等），未提供具体的运行环境配置、依赖版本或硬件需求。鉴于项目名称为 tf_repos 且涉及 TensorFlow 算法，推测主要依赖 TensorFlow 框架，但具体版本需参考代码库中的 requirements 文件。",[99],"tensorflow",[14],[102,103,99,104,105,106,107,108],"deep-learning","ctr-prediction","multi-task-learning","pnn","deepfm","wide-and-deep","din","ready_partial","2026-03-27T02:49:30.150509","2026-04-06T20:03:43.019597",[113,118,123,128,133,138],{"id":114,"question_zh":115,"answer_zh":116,"source_url":117},19917,"为什么增加 Batch Size 后 GPU 内存没有增加？","Batch Size 的大小主要影响梯度方向的稳定性，而非直接线性决定显存占用（具体显存占用还取决于模型结构和中间变量缓存）。关于参数调整：Batch Size 越大，梯度方向越稳定，可以使用更大的学习率（LR）；反之，Batch Size 较小时梯度不稳定，若 LR 过大将无法收敛，需相应减小 LR。例如在小数据集上，Batch=10000 时 LR=0.01 效果较好，而 Batch=100 时 LR=0.01 可能导致不收敛。","https:\u002F\u002Fgithub.com\u002Flambdaji\u002Ftf_repos\u002Fissues\u002F11",{"id":119,"question_zh":120,"answer_zh":121,"source_url":122},19918,"运行 DCN 或 DeepFM 模型时报错 'Reshape cannot infer' 或维度不匹配怎么办？","这通常是因为 `field_size` 或 `feature_size` 参数未正确传递，导致代码使用了默认值 0。解决方法是在运行脚本（如 run.sh 或提交命令）中显式指定这两个参数。例如在分布式提交命令中：`--field_size=39 --feature_size=117581`。如果修改参数后仍报错，请尝试删除历史保存的模型文件（checkpoint），然后重新运行即可。","https:\u002F\u002Fgithub.com\u002Flambdaji\u002Ftf_repos\u002Fissues\u002F35",{"id":124,"question_zh":125,"answer_zh":126,"source_url":127},19919,"分布式执行时出现 'InvalidArgumentError: Reshape cannot infer the missing input size' 错误如何解决？","该错误是因为提交任务时 `field_size` 参数没有正确赋值，程序使用了默认值 0。请在 `tf_submit` 命令中显式添加 `--field_size` 和 `--feature_size` 参数。参考命令格式：`tf_submit --data_dir=xx --train_dir=xx --command=\"Python\u002Fbin\u002Fpython DeepFM.py ... --field_size=39 --feature_size=117581 ...\"`。确保这些参数与你的数据预处理结果一致。","https:\u002F\u002Fgithub.com\u002Flambdaji\u002Ftf_repos\u002Fissues\u002F2",{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},19920,"PNN.py 文件中是否存在代码错误？","是的，PNN.py 中的 outer product 计算部分存在索引错误。原代码 `tf.einsum('aik,ajk->aijk', p, q)` 应修正为 `tf.einsum('api,apj->apij', p, q)`。维护者确认该部分（outer PNN）未经过充分测试，建议在使用时注意此修正或直接注释掉相关未测试代码。","https:\u002F\u002Fgithub.com\u002Flambdaji\u002Ftf_repos\u002Fissues\u002F1",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},19921,"导出模型 serving 文件时报错 'Key ... not found in checkpoint' 是什么原因？","该错误通常是由于恢复检查点（checkpoint）时，当前定义的模型结构与保存的检查点不一致导致的（例如变量名称改变或网络层结构变化）。常见场景是修改了代码中的网络层（如 deep_layers 结构）后试图加载旧模型。解决方法是确保代码结构与训练时的配置完全一致，或者删除旧的 checkpoint 文件从头开始训练。","https:\u002F\u002Fgithub.com\u002Flambdaji\u002Ftf_repos\u002Fissues\u002F42",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},19922,"计算 Loss 时为什么直接使用 logits (y) 而不是经过 Sigmoid 激活后的值？","这是 TensorFlow 的标准用法。`tf.nn.sigmoid_cross_entropy_with_logits` 函数内部已经包含了 Sigmoid 激活计算，它接收的参数 `logits` 必须是未经过激活函数的原始输出。如果在传入该函数前先对 y 进行了 Sigmoid 激活，会导致重复计算从而使结果错误且网络难以优化。因此，请直接使用网络最后一层的线性输出作为 logits 传入。","https:\u002F\u002Fgithub.com\u002Flambdaji\u002Ftf_repos\u002Fissues\u002F20",[]]