[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-sjsdfg--dl4j-tutorials":3,"tool-sjsdfg--dl4j-tutorials":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":78,"owner_location":79,"owner_email":78,"owner_twitter":78,"owner_website":78,"owner_url":80,"languages":81,"stars":90,"forks":91,"last_commit_at":92,"license":93,"difficulty_score":94,"env_os":95,"env_gpu":96,"env_ram":97,"env_deps":98,"category_tags":107,"github_topics":108,"view_count":23,"oss_zip_url":78,"oss_zip_packed_at":78,"status":16,"created_at":114,"updated_at":115,"faqs":116,"releases":146},3240,"sjsdfg\u002Fdl4j-tutorials","dl4j-tutorials","dl4j 基础教程   配套视频：https:\u002F\u002Fspace.bilibili.com\u002F327018681\u002F#\u002F","dl4j-tutorials 是一套专为 Java 开发者打造的深度学习入门教程，旨在帮助用户快速掌握 Deeplearning4j（DL4J）框架的核心用法。它通过系统的视频课程与代码示例，解决了 Java 生态中缺乏高质量、本土化深度学习学习资源的痛点，让开发者无需切换至 Python 环境即可在熟悉的 JVM 平台上构建、训练和部署神经网络。\n\n这套教程特别适合具备 Java 基础的后端工程师、企业级应用开发者以及希望将 AI 能力集成到现有大数据架构中的技术人员。内容涵盖从 Maven 环境配置、ND4J 基础运算，到线性回归、图像分类（如 MNIST）、CNN 模型优化及模型持久化等实战场景。\n\n其独特亮点在于深度结合了 Hadoop 与 Spark 分布式计算生态，支持 CPU\u002FGPU 加速，专为商业生产环境设计而非仅限学术研究。教程不仅提供了详细的步骤指引，还分享了针对国内网络环境的 Maven 配置优化方案及调参避坑指南，配合活跃的社群支持，极大地降低了 Java 开发者进入深度学习领域的门槛，助力快速实现从原型验证到规模化落地的全过程。","# dl4j-tutorials\n\ndeeplearning4j 教程\n\n视频教程列表：[Deeplearning4j - 入门视频](https:\u002F\u002Fwww.jianshu.com\u002Fp\u002F566fc3db676b)\n\n哔哩哔哩直达地址：https:\u002F\u002Fspace.bilibili.com\u002F327018681\u002F#\u002F\n\n - **交流群： 289058486**\n - **入群问题： Deeplearning4j 源码在 github的地址（mac 系统QQ看不到群问题，入群记得添加答案）**\n\nDeepLearning4J（DL4J）是一套基于Java语言的神经网络工具包，可以构建、定型和部署神经网络。DL4J与Hadoop和Spark集成，支持分布式CPU和GPU，为商业环境（而非研究工具目的）所设计。Skymind是DL4J的商业支持机构。\n\nDeeplearning4j拥有先进的技术，以即插即用为目标，通过更多预设的使用，避免多余的配置，让非企业也能够进行快速的原型制作。DL4J同时可以规模化定制。DL4J遵循Apache 2.0许可协议，一切以其为基础的衍生作品均属于衍生作品的作者。\n\n# Give Me a Favor\n\n\u003Ccenter>\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsjsdfg_dl4j-tutorials_readme_ae1e2f5ffe3d.jpg\" \u002F>\n\u003C\u002Fcenter>\n\n---\n\n## 注意\n因为使用的maven管理项目，所以第一次使用的时候更改maven配置。更改仓库地址为国内的阿里云\n\n- [Deeplearning4j入门（零）- maven环境配置 - 寒沧](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav25768162)\n- [settings.xml 文件下载](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Fblob\u002Fmaster\u002Fsrc\u002Fmain\u002Fresources\u002Fsetting\u002Fsettings.xml)\n\n```xml\n\u003Cmirror>\n\t\u003Cid>nexus-aliyun\u003C\u002Fid>\n\t\u003CmirrorOf>central\u003C\u002FmirrorOf>\n\t\u003Cname>Nexus aliyun\u003C\u002Fname>\n\t\u003Curl>http:\u002F\u002Fmaven.aliyun.com\u002Fnexus\u002Fcontent\u002Fgroups\u002Fpublic\u003C\u002Furl>\n\u003C\u002Fmirror> \n```\n\n### 使用maven把jar包导出为外部\n```bash\nmvn dependency:copy-dependencies -DoutputDirectory=target\u002Flib\n```\n\n- [deeplearning4j-1.0.0beta离线jar包---百度云](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1pxuEmzypSvlguCftsMaZ3g)\n\n\n## dl4j概览\n\n1. [dl4j快速索引：网络层，功能和类](https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdeeplearning4j-docs\u002Fblob\u002Fgh-pages\u002Fquickref.md)\n2. [dl4j-example 概览](https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdeeplearning4j-docs\u002Fblob\u002Fgh-pages\u002Fexamples-tour.md)\n3. [dl4j 神经网络评估](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-nn-evaluation)\n4. [dl4j 版本发布日志](https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdeeplearning4j-docs\u002Fblob\u002Freleasenotes_100a\u002Freleasenotes.md)\n5. [Java api文档](https:\u002F\u002Fdeeplearning4j.org\u002Fapi\u002Fv1.0.0-beta2\u002F)\n6. [skymind 官方博客](https:\u002F\u002Fblog.skymind.ai\u002F)\n7. [Quickstart with Deeplearning4J](http:\u002F\u002Fwww.dubs.tech\u002Fguides\u002Fquickstart-with-dl4j\u002F)\n8. [旧版本官网github](https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdeeplearning4j-docs\u002Ftree\u002Fgh-pages)\n9. [skymind ai wiki](https:\u002F\u002Fskymind.ai\u002Fwiki\u002F)\n10. [skymind开源数据集集合](https:\u002F\u002Fskymind.ai\u002Fwiki\u002Fopen-datasets)\n11. [Java Deep Learning Projects: Implement 10 real-world deep learning using Deeplearning4j and opensource APIs](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1Y2VoO6kLd6RIHCVqpVKzlQ)\n\n## 调参\n\n1. [我搭的神经网络不work该怎么办！看看这11条新手最容易犯的错误](https:\u002F\u002Fmp.weixin.qq.com\u002Fs?__biz=MzIxMjAzNDY5Mg==&mid=2650791830&idx=1&sn=da81a253d4753e78d0ad5040ecf3ca29&chksm=8f474a7db830c36bf083c8e22414b2b2ee0fd38dd60175921952ae01c669ce4a3d105f972b09&mpshare=1&scene=1&srcid=0913NEV8u5Rz7fdaIDjAPnvs#rd)\n2. [nd4j 和 DeepLearning4j 性能调优 debug](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-config-performance-debugging)\n3. [神经网络训练问题排查](https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Ftroubleshootingneuralnets)\n\n## lesson1 nd4j基础操作\n\n参考资料：\n\n 1. [一天搞懂深度学习](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1FW8zqzE4rK7pCOsC46dhIQ) \n 1. [Deep Learning A Practitioner’s Approach](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1C1s2xMuDYJBd3kCB8bxlxA)\n 2. https:\u002F\u002Fnd4j.org\u002Fuserguide\n 3. [nd4j方法快速索引](https:\u002F\u002Fwww.jianshu.com\u002Fp\u002Fc4f6284946bf)\n\n## lesson2 简易线性回归\n\n参考资料：\n\n 1. [深度神经网络简介][2]\n 2. [译-第四章 可视化证明神经网络可以计算任何函数](http:\u002F\u002Fwww.jianshu.com\u002Fp\u002F1d80023119cc)\n 3. [A visual proof that neural nets can compute any function](http:\u002F\u002Fneuralnetworksanddeeplearning.com\u002Fchap4.html)\n 4. [神经网络中Epoch、Iteration、Batchsize相关理解和说明](https:\u002F\u002Fblog.csdn.net\u002Fprogram_developer\u002Farticle\u002Fdetails\u002F78597738)\n\n## lesson3 简易数据分类\n参考资料：\n\n 1. [ETL用户指南][3]\n 2. [MNIST基础教程，包含一些分类知识][4]\n 3. [Deeplearning4j Smote 样本均衡实现](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F52258279)\n\n## lesson4 Minst手写数字分类\n\n参考资料：\n\n 1. [MINST数据集](http:\u002F\u002Fyann.lecun.com\u002Fexdb\u002Fmnist\u002F)\n 2. [神经网络学习的可视化、监测及调试方法](https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fvisualization)\n\n\n## lesson5 模型保存与读取\n\n参考资料：\n\n 1. [HDFS模型保存][5]\n 2. [SparkDl4jMultiLayer模型存储](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdeeplearning4j-issues\u002Fblob\u002Fmaster\u002Fmarkdown\u002Fdeeplearning4j%E7%9B%B8%E5%85%B3\u002FSparkNetwork%E6%A8%A1%E5%9E%8B%E5%AD%98%E5%82%A8.md)\n\n## lesson6 Minst手写数字模型改进-CNN\n\n参考资料：\n 1. [关于深度学习之CNN经典论文原文(1950~2018)简介][9]\n 2. [Visualizing and Understanding CNNs.pdf](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdeeplearning4j-issues\u002Fblob\u002Fmaster\u002FVisualizing%20and%20Understanding%20CNNs.pdf)\n 3. [deep learning for computer vision with python(3 本)](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F17UMo76p75piTcArqu0wXJQ) 密码：vr0r\n 4. [对ResNet本质的一些思考](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F60668529)\n 5. [DL4J之CNN对今日头条文本分类](https:\u002F\u002Fmy.oschina.net\u002Fu\u002F1778239\u002Fblog\u002F3089890)\n\n在使用 GPU 加速之前请务必确认一下几点：\n 1. 电脑是否为 **英伟达** GPU，即 GTX 系列，使用 AMD 显卡无法使用 GPU 加速\n 2. 电脑是否安装了 cuda ，如果安装了 cuda 请确认安装的 cuda 版本和你 pom 中引入的 `nd4j.backend` 版本是否对应\n 3. 电脑安装 cuda 之后请确保你的 IDE 已经感知到环境变量的变化，在 IDE 中的 `terminal` 使用 `nvcc -V` 命令查看。如不确定直接重启电脑即可\n \n以下为 GPU 安装和使用教程：\n 1. [Deeplearning4j-使用Cuda 9.1和 Cudnn7.1 加速模型训练](https:\u002F\u002Fwww.jianshu.com\u002Fp\u002F8a7533c2c79a)\n 2. [在Deeplearning4j中使用cuDNN](https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F79028821)\n 3. [【视频】Deeplearning4j入门 - （十）GPU加速训练 - 寒沧](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav24603590)\n \n如想确定 DeepLearning4j 已经支持的 cuda 和 cudnn 的配套版本，请打开如下链接：\n 1. [Using Deeplearning4j with cuDNN](https:\u002F\u002Fdeeplearning4j.org\u002Fcudnn) ：搜索 `CUDA Version` 字眼\n\n## lesson7 RNN循环神经网络\n\n参考资料\n 1. 理解LSTM网络：https:\u002F\u002Fwww.jianshu.com\u002Fp\u002F9dc9f41f0b29\n 2. 循环网络和LSTM教程：https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Frecurrentnetwork\n 3. DL4J中的循环网络：https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fusingrnns\n 4. [DeepLearning4j: LSTM Network Example](https:\u002F\u002Fdeeplearning4j.org\u002Fprogrammingguide\u002F05_lstm)\n \n\n## ObjectDetection 目标检测\n\n参考资料：\n 1. [DeepLearning4j-使用Java训练YOLO模型](https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F79886619)\n 2. [Java构建汽车无人驾驶：汽车目标检测](https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F79432195)\n 3. [基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD](https:\u002F\u002Fwww.julyedu.com\u002Fquestion\u002Fbig\u002Fkp_id\u002F26\u002Fques_id\u002F2103)\n 4. [【中文】Yolo v1全面深度解读 目标检测论文](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav23354360)\n 5. [【中文】Mask R-CNN 深度解读与源码解析 目标检测 物体检测 RCNN object detection 语义分割](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav24795835)\n 6. 目标检测自定义数据集：https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1u5yYv5SmK_vgd1zq1PsteQ\n \u003Cdiv align=\"center\"> \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsjsdfg_dl4j-tutorials_readme_9403c5b73559.jpg\" \u002F> \u003C\u002Fdiv>\n \n\n\n## tensorflow 导入tf模型\n\n参考资料：\n 1. https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F80025161\n \n ****\n\n## JStarCraft,一个涵盖核心编程,人工智能,推荐与搜索领域的轻量级框架\n\n群友 [@HongZhaoHua](https:\u002F\u002Fgithub.com\u002FHongZhaoHua) 实现\n\n1. JStarCraft Core：提供了缓存，ORM，编解码，资源管理，脚本，监控，通讯，事务8个方面的核心特性，是整个框架的核心。\n[https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-core](https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-core)\n2. JStarCraft AI：包含了多种矩阵和向量计算的实现，支持硬件加速和并行计算，是目前最快最全的Java矩阵\u002F向量计算库。 \n[https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-ai](https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-ai)\n3. JStarCraft RNS：包含了70多种排序预测与评分预测算法，支持多种脚本语言，是覆盖范围最全的Java推荐与搜索引擎。\n[https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-rns](https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-rns)\n4. JStarCraft Example：一个基于JStarCraft RNS引擎,Spring Boot框架和MovieLens 100K数据集搭建的电影演示项目，包括个性化推荐与个性化搜索两个部分。系统会根据用户的行为记录，自动调整用户的推荐内容和搜索内容。[https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-example](https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-example)\n\n| 作者 | 洪钊桦 |\n| --- | --- |\n| E-mail | 110399057@qq.com, jstarcraft@gmail.com |\n\n\n ## baidudianshi 百度点石比赛 baseline demo\n\n 参考资料：\n  1. 比赛地址：http:\u002F\u002Fdianshi.baidu.com\u002Fdianshi\u002Fpc\u002Fcompetition\u002F22\u002Frule\n  2. 防止比赛结束，数据寻回链接：https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1_M0yPejFTvxDFOn4780OPA\n  3. Baseline 0.83 得分模型：https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1i-v02HnMPQwjtm32fPp67A （已经保存 Updater 信息，可用于增量训练）\n  4. 内存管理官方文档：https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-config-memory\n  5. 迁移学习官方文档：https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-nn-transfer-learning\n  6. 迁移学习推荐阅读博客：https:\u002F\u002Fblog.csdn.net\u002Fwangongxi\u002Farticle\u002Fdetails\u002F75127131\n  7. 早停法训练模型官方文档：https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-nn-early-stopping\n  8. [百度点石-“探寻地球密码”天宫数据利用大赛.md](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdeeplearning4j-issues\u002Fblob\u002Fmaster\u002Fmarkdown\u002F%E7%99%BE%E5%BA%A6%E7%82%B9%E7%9F%B3-%E2%80%9C%E6%8E%A2%E5%AF%BB%E5%9C%B0%E7%90%83%E5%AF%86%E7%A0%81%E2%80%9D%E5%A4%A9%E5%AE%AB%E6%95%B0%E6%8D%AE%E5%88%A9%E7%94%A8%E5%A4%A7%E8%B5%9B.md)\n  9. [百度点石-“探寻地球密码”天宫数据利用大赛.pdf](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdeeplearning4j-issues\u002Fblob\u002Fmaster\u002F%E7%99%BE%E5%BA%A6%E7%82%B9%E7%9F%B3-%E2%80%9C%E6%8E%A2%E5%AF%BB%E5%9C%B0%E7%90%83%E5%AF%86%E7%A0%81%E2%80%9D%E5%A4%A9%E5%AE%AB%E6%95%B0%E6%8D%AE%E5%88%A9%E7%94%A8%E5%A4%A7%E8%B5%9B.pdf)\n\n ## 模型训练早停法\n\n ### 1. 创建 ModelSaver\n\n 用于在模型训练过程中，指定最好模型保存的位置：\n\n 1. InMemoryModelSaver：用于保存到内存中\n 2. LocalFileModelSaver：用于保存到本地目录中，只能保存 `MultiLayerNetwork` 类型的网络结果\n 3. LocalFileGraphSaver：用于保存到本地目录中，只能保存 `ComputationGraph` 类型的网络结果\n\n ### 2. 配置早停法训练配置项\n\n 1. epochTerminationConditions：训练结束条件\n 2. evaluateEveryNEpochs：训练多少个epoch 来进行一次模型评估\n 3. scoreCalculator：模型评估分数的计算者\n     - org.deeplearning4j.earlystopping.scorecalc.RegressionScoreCalculator 用于回归的分数计算\n     - ClassificationScoreCalculator 用于分类任务的分数计算\n 4. modelSaver：模型的存储位置\n 5. iterationTerminationConditions：在每一次迭代的时候用于控制\n\n ### 3. 获取早停法信息\n ```Java\n \u002F\u002FConduct early stopping training:\n EarlyStoppingResult result = trainer.fit();\n System.out.println(\"Termination reason: \" + result.getTerminationReason());\n System.out.println(\"Termination details: \" + result.getTerminationDetails());\n System.out.println(\"Total epochs: \" + result.getTotalEpochs());\n System.out.println(\"Best epoch number: \" + result.getBestModelEpoch());\n System.out.println(\"Score at best epoch: \" + result.getBestModelScore());\n \n \u002F\u002FPrint score vs. epoch\n Map\u003CInteger,Double> scoreVsEpoch = result.getScoreVsEpoch();\n List\u003CInteger> list = new ArrayList\u003C>(scoreVsEpoch.keySet());\n Collections.sort(list);\n System.out.println(\"Score vs. Epoch:\");\n for( Integer i : list){\n     System.out.println(i + \"\\t\" + scoreVsEpoch.get(i));\n }\n ```\n\n ## 迁移学习\n\n ### 1. 获取原有的网络结构\n\n ```Java\n  \u002F\u002F 构造数据模型\n ZooModel zooModel = VGG16.builder().build();\n ComputationGraph vgg16 = (ComputationGraph) zooModel.initPretrained();\n ```\n\n\n ### 2. 修改模型的训练部分超参数\n\n  1. updater\n  2. 学习率\n  3. 随机数种子：用于模型的复现\n\n ```java\n  FineTuneConfiguration fineTuneConf = new FineTuneConfiguration.Builder()\n                 .updater(new Nesterovs(0.1, 0.9))\n                 .seed(123)\n                 .build();\n ```\n\n ### 3. 修改网络架构\n\n #### 3.1 setFeatureExtractor\n\n 用于指定那个层以下为非 frozen 层，非冻结层。\n\n\n #### 3.2 结构更改\n\n 1. 一般只有不同网络层之间才会出现 shape 异常：需要根据异常信息调整我们的网络层结构和参数\n 2. `removeVertexKeepConnections` 和 `addLayer` 或者是 `addVertex` 进行网络结构的更改\n\n## 自定义网络层实现GRU\n\n参考资料：\n 1. https:\u002F\u002Fgithub.com\u002FGerry-Pan\u002Fpan-dl4j\n\n根据GRU前向公式推导反向公式，并在dl4j中实现。\n\n## 整合DL4J训练模型与Web工程\n参考资料：\n 1. 博文地址：https:\u002F\u002Fmy.oschina.net\u002Fu\u002F1778239\u002Fblog\u002F1648854\n 2. 源码地址：https:\u002F\u002Fgitee.com\u002Flxkm\u002Fdl4j-demo\u002Ftree\u002Fmaster\u002Fdigitalrecognition\n\n## 【深度学习】图像矫正、dl4j yolo和tesseract ocr\n\n参考资料：\n 1. 视频地址：https:\u002F\u002Ftianchi.aliyun.com\u002Fforum\u002FvideoStream.html#postsId=5312\n 2. 视频代码所在github：https:\u002F\u002Fgithub.com\u002Fawaymeet\u002Ftesseract\n\n## 人脸识别 - FaceRecognition\n\n参考资料：\n  1. https:\u002F\u002Fgithub.com\u002Ffradino\u002FFaceRecognition\n  2. https:\u002F\u002Fgitee.com\u002Fxshuai\u002FFaceRecognition\n  \n\n## 参数共享\n\n感谢群友 [@冷血狂魔]() [@Gerry]()\n\n- StackVertex，用它就能实现参数共享\n\n数学方法参数证明：\n\n- [DeepLearning4j 的 StackVertex 实现参数共享 ](https:\u002F\u002Fblog.csdn.net\u002Fpangerry\u002Farticle\u002Fdetails\u002F90814970)\n\n与其类似的类为 `MergeVertex`，与其的主要区别在于：\n\n- Merge 的合并方式是沿着 dimension=1 合并，Stack 是沿着 dimension=0 合并\n- 沿着 dimension=0 合并的好处是无论第 0 维的长度为多少，权重 w 的 shape 都不会变，而且在反向计算梯度恰好等于 n 个 input 的产生的梯度的和\n- 所以只要使用 StackVertex 对 n 个输入进行合并，后面随意拼接神经网络层，诸如 DenseLayer, LSTM, ConvLayer 都能达到目的，最后用 UnstackVertex 拆分输出\n\n数学推导 [@Gerry]() 提供。其从矩阵运算角度说明 StackVertex 只做合并就能实现参数共享的原因\n  \n## 天池比赛-工业蒸汽量预测\n\n群友 [@冷血狂魔]()提供\n\n- [参赛地址](https:\u002F\u002Ftianchi.aliyun.com\u002Fcompetition\u002Fentrance\u002F231693\u002Fintroduction?spm=5176.12281949.1003.9.493e4c2apzwdri)\n\n### 背景\n  火力发电的基本原理是：燃料在燃烧时加热水生成蒸汽，蒸汽压力推动汽轮机旋转，然后汽轮机带动发电机旋转，产生电能。在这一系列的能量转化中，影响发电效率的核心是锅炉的燃烧效率，即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多，包括锅炉的可调参数，如燃烧给量，一二次风，引风，返料风，给水水量；以及锅炉的工况，比如锅炉床温、床压，炉膛温度、压力，过热器的温度等。\n  \n### 目标\n\n经脱敏后的锅炉传感器采集的数据（采集频率是分钟级别），根据锅炉的工况，预测产生的蒸汽量。\n\n- [deeplearning4j解蒸汽比赛的思路（0.1136）](https:\u002F\u002Ftianchi.aliyun.com\u002Fnotebook-ai\u002Fdetail?spm=5176.12281897.0.0.a0792658MVZabi&postId=58269)\n\n## 推荐系统 - Recommend\n\n参考资料：\n  1. [lib-rec](https:\u002F\u002Fgithub.com\u002Fguoguibing\u002Flibrec)：https:\u002F\u002Fgithub.com\u002Fguoguibing\u002Flibrec\u002Ftree\u002F3.0.0\u002Fcore\u002Fsrc\u002Fmain\u002Fjava\u002Fnet\u002Flibrec\u002Frecommender\u002Fnn\n  2. [inception](https:\u002F\u002Fgithub.com\u002Finception-project\u002Finception)：https:\u002F\u002Fgithub.com\u002Finception-project\u002Finception\u002Ftree\u002Fmaster\u002Finception-imls-dl4j\u002Fsrc\u002Fmain\u002Fjava\u002Fde\u002Ftudarmstadt\u002Fukp\u002Finception\u002Frecommendation\u002Fimls\u002Fdl4j\u002Fpos\n\n## Deeplearning4j 实现 Attention\n\n参考资料：\n1. [直播实现视频 youtube(自备梯子)](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=XrZ_Y4koV5A)\n2. [Implementing NLP Attention Mechanisms with DeepLearning4j(搬运到国内bilibili)](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav37100054\u002F)\n3. [attention 实现源码](https:\u002F\u002Fgithub.com\u002Ftreo\u002Fdl4j_attention)\n4. [Attention Mechanisms (Enterprise AI Virtual Meetup).pdf](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1BzrteMiqlvm_l7Cv54Yc4g)\n\n## GAN\n\n- [GAN 使用 MNIST 实例](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Ftree\u002Fmaster\u002Fsrc\u002Fmain\u002Fjava\u002Fgan)。群友 @城枫林 和 [@liweigu](https:\u002F\u002Fgithub.com\u002Fliweigu) 提供\n- [gan_deeplearning4j](https:\u002F\u002Fgithub.com\u002Fhamaadshah\u002Fgan_deeplearning4j)\n- [如何用Deeplearning4j实现GAN](https:\u002F\u002Fmy.oschina.net\u002Fu\u002F1778239\u002Fblog\u002F3090072)\n\n## 自制AI图像搜索引擎\n\n  群友 @射水鱼 攥写了一本使用 DeepLearning4j 实现的《自制AI图像搜索引擎》\n\n按章节详细讲述了图像搜索引擎各主要组成部分的原理和实现，并在最后一章带领大家使用DL4J从零开始逐步构建了一个基于深度学习的Web图像搜索引擎，使读者能够更透彻地理解图像检索的理论并具有独立地实现一个在线图像搜索引擎的实际能力。每章都在对相关理论和方法进行阐述的同时，使用基于Java语言的实现代码和详实的代码注释来对相关理论和方法进行复述。\n\n- 书籍地址：[https:\u002F\u002Fwww.epubit.com\u002Fbook\u002Fdetail\u002F30316](qq:\u002F\u002Ftxfile\u002F#)\n- 源码地址：[https:\u002F\u002Fbox.lenovo.com\u002Fl\u002FLHh2vR](qq:\u002F\u002Ftxfile\u002F#) 密码: 1aaa  \n\n```xml\n\u003Cdependency>\n    \u003CgroupId>be.tarsos\u003C\u002FgroupId>\n    \u003CartifactId>TarsosLSH\u003C\u002FartifactId>\n    \u003Cversion>${tarsosLSH.version}\u003C\u002Fversion>\n\u003C\u002Fdependency>\n```\n\n如果导入项目中有依赖缺失，下载以下 jar 包：\n\n- [TarsosLSH-0.9 下载地址](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1sbmvbkab6K5tRF92U-ItHw) 提取码：88qv\n- [TarsosLSH github地址，也可以自行编译](https:\u002F\u002Fgithub.com\u002FJorenSix\u002FTarsosLSH)\n\n使用 `\u003Cscope> system \u003C\u002Fscope>`进行本地的 jar 包导入，或者使用以下命令安装在本地的 maven 仓库中：\n\n```bash\nmvn install:install-file -Dfile=\u002Fpath\u002Fto\u002Fjar -DgroupId=be.tarsos -DartifactId=TarsosLSH -Dversion=0.9 -Dpackaging=jar\n```\n\n## 强化学习 RL4j\n\n参考资料：\n 1. 简书文章：https:\u002F\u002Fwww.jianshu.com\u002Fp\u002F4d7f23395e92\n 2. gitee代码：https:\u002F\u002Fgitee.com\u002Fre6g3y\u002FDL4J-with-LIBGDX\n\n \u003Cdiv align=\"center\"> \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsjsdfg_dl4j-tutorials_readme_621dcfb1d327.gif\"\u002F> \u003C\u002Fdiv>\n\n## Deeplearning4j 经典开源项目\n\n 1. [ScalphaGoZero](https:\u002F\u002Fgithub.com\u002Fmaxpumperla\u002FScalphaGoZero):An independent implementation of DeepMind's AlphaGoZero in Scala, using Deeplearning4J (DL4J 实现阿尔法狗)\n 2. https:\u002F\u002Fgithub.com\u002Ftahaemara\u002Fyolo-custom-object-detector : 使用 YOLO 检测实时检测自定义数据集 - 魔方\n 3. https:\u002F\u002Fgithub.com\u002Fmccorby\u002FPhotoLabeller : 安卓客户端实现分布式训练。 使用 Kotlin 实现\n 4. https:\u002F\u002Fgithub.com\u002Ftahaemara\u002Freal-time-sudoku-solver : 使用 dl4j 解决数独\n 5. https:\u002F\u002Fgithub.com\u002Fkaiwaehner\u002Fkafka-streams-machine-learning-examples : kafka 流训练\n 6. https:\u002F\u002Fgithub.com\u002Ffra82\u002Ftextdigester : dl4j 实现文档总结\n\n## 获取最新的Deeplearning4j(Snapshots And Daily Builds)\n\n参考资料：\n  1. https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-config-snapshots\n\n配置 `pom.xml` 文件\n```XML\n\u003Crepositories>\n    \u003Crepository>\n        \u003Cid>snapshots-repo\u003C\u002Fid>\n        \u003Curl>https:\u002F\u002Foss.sonatype.org\u002Fcontent\u002Frepositories\u002Fsnapshots\u003C\u002Furl>\n        \u003Creleases>\n            \u003Cenabled>false\u003C\u002Fenabled>\n        \u003C\u002Freleases>\n        \u003Csnapshots>\n            \u003Cenabled>true\u003C\u002Fenabled>\n            \u003CupdatePolicy>daily\u003C\u002FupdatePolicy>  \u003C!-- Optional, update daily -->\n        \u003C\u002Fsnapshots>\n    \u003C\u002Frepository>\n\u003C\u002Frepositories>\n```\n自动获取 skymind 所提供的 jar 包编译更新\n\n# Spark 读取数据\n\n1. https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdl4j-examples\u002Fissues\u002F689\n2. [Spark Data Pipelines Guide](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-scaleout-data-howto)\n3. [Spark 训练指南](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-scaleout-howto)\n\n```java\nok, so there's 2 ways\n(a) use SparkContext.parallelize (that's a standard spark op) - easy but bad performance (all preprocessing happens on master)\n(b) write a better data pipeline that does the proper reading + conversion in parallel\n```\n\n# 群友项目分享\n\n1. 基于dl4j的快三爬取和训练以及预测:https:\u002F\u002Fgithub.com\u002Fawaymeet\u002Flottery_kuai_san\u002Ftree\u002Fmaster\n2. 开源的学习SpringCloud和Deeplaring4j和IBMWaston知识的项目: https:\u002F\u002Fgithub.com\u002FJamesZow\u002FSpring-Cloud-Project\n3. DL4J的CNN+RNN+CTC的文字识别的demo：https:\u002F\u002Fgithub.com\u002FWuWei1986\u002Fdl4j-ocr-demo\n4. 全连接层的神经网络框架的雏形：https:\u002F\u002Fgithub.com\u002Fwoshiyigebing\u002Fmy_dl4j  （只用了INDarray。给新手研究入门一些启发）\n\n# 额外资源\n\n 1. [机器学习高质量数据集大合辑](https:\u002F\u002Fmp.weixin.qq.com\u002Fs?__biz=MjM5MTQzNzU2NA==&mid=2651663921&idx=2&sn=300429e518d159bb7654e1771672429e&chksm=bd4c09a28a3b80b4aa961577a7f59229d23bbd5f88b50bec6de21b0f94bd2fd2b348d1d4eb04&mpshare=1&scene=23&srcid=1023m8ifSIuylq6VcBQKRkt7#rd)\n 2. [中文开放聊天语料整理](https:\u002F\u002Fgithub.com\u002Fcodemayq\u002Fchaotbot_corpus_Chinese)\n 3. [gitxiv:只提供有复现开源代码的论文](http:\u002F\u002Fwww.gitxiv.com\u002F)\n 4. [papers with code](https:\u002F\u002Fpaperswithcode.com\u002F)\n 4. [hadoop-winutils](https:\u002F\u002Fgithub.com\u002Fsteveloughran\u002Fwinutils)：提供 hadoop 工具在 windows 平台下的 hadoop.dll和winutils.exe。便于 windows 下运行 spark-local 模式\n 5. [hadoop-winutils for 3.+](https:\u002F\u002Fgithub.com\u002Fcdarlint\u002Fwinutils)\n 5. [深度学习理论与实战：提高篇](http:\u002F\u002Ffancyerii.github.io\u002F2019\u002F03\u002F14\u002Fdl-book\u002F)\n 6. [tablesaw](https:\u002F\u002Fgithub.com\u002Fjtablesaw\u002Ftablesaw)：Java dataframe and visualization library https:\u002F\u002Fjtablesaw.github.io\u002Ftablesaw\u002F  提供类似于 Python 中的 Pandas 和 Matplot 的功能\n 7. 让机器学习更具有可解释性：https:\u002F\u002Fchristophm.github.io\u002Finterpretable-ml-book\u002F\n\n\n\n \n\n[2]: https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fneuralnet-overview\n[3]: https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fetl-userguide\n[4]: https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fmnist-for-beginners\n[5]: http:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F79113789\n[6]: https:\u002F\u002Fdeeplearning4j.org\u002Fquickref\n[7]: https:\u002F\u002Fdeeplearning4j.org\u002Fexamples-tour\n[8]: https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F80139619\n[9]: https:\u002F\u002Fblog.csdn.net\u002Fqq_41185868\u002Farticle\u002Fdetails\u002F79995732\n","# dl4j-tutorials\n\ndeeplearning4j 教程\n\n视频教程列表：[Deeplearning4j - 入门视频](https:\u002F\u002Fwww.jianshu.com\u002Fp\u002F566fc3db676b)\n\n哔哩哔哩直达地址：https:\u002F\u002Fspace.bilibili.com\u002F327018681\u002F#\u002F\n\n - **交流群： 289058486**\n - **入群问题： Deeplearning4j 源码在 github的地址（mac 系统QQ看不到群问题，入群记得添加答案）**\n\nDeepLearning4J（DL4J）是一套基于Java语言的神经网络工具包，可以构建、定型和部署神经网络。DL4J与Hadoop和Spark集成，支持分布式CPU和GPU，为商业环境（而非研究工具目的）所设计。Skymind是DL4J的商业支持机构。\n\nDeeplearning4j拥有先进的技术，以即插即用为目标，通过更多预设的使用，避免多余的配置，让非企业也能够进行快速的原型制作。DL4J同时可以规模化定制。DL4J遵循Apache 2.0许可协议，一切以其为基础的衍生作品均属于衍生作品的作者。\n\n# 给我个忙\n\n\u003Ccenter>\n\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsjsdfg_dl4j-tutorials_readme_ae1e2f5ffe3d.jpg\" \u002F>\n\u003C\u002Fcenter>\n\n---\n\n## 注意\n因为使用的maven管理项目，所以第一次使用的时候更改maven配置。更改仓库地址为国内的阿里云\n\n- [Deeplearning4j入门（零）- maven环境配置 - 寒沧](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav25768162)\n- [settings.xml 文件下载](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Fblob\u002Fmaster\u002Fsrc\u002Fmain\u002Fresources\u002Fsetting\u002Fsettings.xml)\n\n```xml\n\u003Cmirror>\n\t\u003Cid>nexus-aliyun\u003C\u002Fid>\n\t\u003CmirrorOf>central\u003C\u002FmirrorOf>\n\t\u003Cname>Nexus aliyun\u003C\u002Fname>\n\t\u003Curl>http:\u002F\u002Fmaven.aliyun.com\u002Fnexus\u002Fcontent\u002Fgroups\u002Fpublic\u003C\u002Furl>\n\u003C\u002Fmirror> \n```\n\n### 使用maven把jar包导出为外部\n```bash\nmvn dependency:copy-dependencies -DoutputDirectory=target\u002Flib\n```\n\n- [deeplearning4j-1.0.0beta离线jar包---百度云](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1pxuEmzypSvlguCftsMaZ3g)\n\n\n## dl4j概览\n\n1. [dl4j快速索引：网络层，功能和类](https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdeeplearning4j-docs\u002Fblob\u002Fgh-pages\u002Fquickref.md)\n2. [dl4j-example 概览](https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdeeplearning4j-docs\u002Fblob\u002Fgh-pages\u002Fexamples-tour.md)\n3. [dl4j 神经网络评估](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-nn-evaluation)\n4. [dl4j 版本发布日志](https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdeeplearning4j-docs\u002Fblob\u002Freleasenotes_100a\u002Freleasenotes.md)\n5. [Java api文档](https:\u002F\u002Fdeeplearning4j.org\u002Fapi\u002Fv1.0.0-beta2\u002F)\n6. [skymind 官方博客](https:\u002F\u002Fblog.skymind.ai\u002F)\n7. [Quickstart with Deeplearning4J](http:\u002F\u002Fwww.dubs.tech\u002Fguides\u002Fquickstart-with-dl4j\u002F)\n8. [旧版本官网github](https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdeeplearning4j-docs\u002Ftree\u002Fgh-pages)\n9. [skymind ai wiki](https:\u002F\u002Fskymind.ai\u002Fwiki\u002F)\n10. [skymind开源数据集集合](https:\u002F\u002Fskymind.ai\u002Fwiki\u002Fopen-datasets)\n11. [Java Deep Learning Projects: Implement 10 real-world deep learning using Deeplearning4j and opensource APIs](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1Y2VoO6kLd6RIHCVqpVKzlQ)\n\n## 调参\n\n1. [我搭的神经网络不work该怎么办！看看这11条新手最容易犯的错误](https:\u002F\u002Fmp.weixin.qq.com\u002Fs?__biz=MzIxMjAzNDY5Mg==&mid=2650791830&idx=1&sn=da81a253d4753e78d0ad5040ecf3ca29&chksm=8f474a7db830c36bf083c8e22414b2b2ee0fd38dd60175921952ae01c669ce4a3d105f972b09&mpshare=1&scene=1&srcid=0913NEV8u5Rz7fdaIDjAPnvs#rd)\n2. [nd4j 和 DeepLearning4j 性能调优 debug](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-config-performance-debugging)\n3. [神经网络训练问题排查](https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Ftroubleshootingneuralnets)\n\n## lesson1 nd4j基础操作\n\n参考资料：\n\n 1. [一天搞懂深度学习](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1FW8zqzE4rK7pCOsC46dhIQ) \n 1. [Deep Learning A Practitioner’s Approach](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1C1s2xMuDYJBd3kCB8bxlxA)\n 2. https:\u002F\u002Fnd4j.org\u002Fuserguide\n 3. [nd4j方法快速索引](https:\u002F\u002Fwww.jianshu.com\u002Fp\u002Fc4f6284946bf)\n\n## lesson2 简易线性回归\n\n参考资料：\n\n 1. [深度神经网络简介][2]\n 2. [译-第四章 可视化证明神经网络可以计算任何函数](http:\u002F\u002Fwww.jianshu.com\u002Fp\u002F1d80023119cc)\n 3. [A visual proof that neural nets can compute any function](http:\u002F\u002Fneuralnetworksanddeeplearning.com\u002Fchap4.html)\n 4. [神经网络中Epoch、Iteration、Batchsize相关理解和说明](https:\u002F\u002Fblog.csdn.net\u002Fprogram_developer\u002Farticle\u002Fdetails\u002F78597738)\n\n## lesson3 简易数据分类\n参考资料：\n\n 1. [ETL用户指南][3]\n 2. [MNIST基础教程，包含一些分类知识][4]\n 3. [Deeplearning4j Smote 样本均衡实现](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F52258279)\n\n## lesson4 Minst手写数字分类\n\n参考资料：\n\n 1. [MINST数据集](http:\u002F\u002Fyann.lecun.com\u002Fexdb\u002Fmnist\u002F)\n 2. [神经网络学习的可视化、监测及调试方法](https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fvisualization)\n\n\n## lesson5 模型保存与读取\n\n参考资料：\n\n 1. [HDFS模型保存][5]\n 2. [SparkDl4jMultiLayer模型存储](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdeeplearning4j-issues\u002Fblob\u002Fmaster\u002Fmarkdown\u002Fdeeplearning4j%E7%9B%B8%E5%85%B3\u002FSparkNetwork%E6%A8%A1%E5%9E%83%E5%AD%98%E5%82%A8.md)\n\n## lesson6 Minst手写数字模型改进-CNN\n\n参考资料：\n 1. [关于深度学习之CNN经典论文原文(1950~2018)简介][9]\n 2. [Visualizing and Understanding CNNs.pdf](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdeeplearning4j-issues\u002Fblob\u002Fmaster\u002FVisualizing%20and%20Understanding%20CNNs.pdf)\n 3. [deep learning for computer vision with python(3 本)](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F17UMo76p75piTcArqu0wXJQ) 密码：vr0r\n 4. [对ResNet本质的一些思考](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F60668529)\n 5. [DL4J之CNN对今日头条文本分类](https:\u002F\u002Fmy.oschina.net\u002Fu\u002F1778239\u002Fblog\u002F3089890)\n\n在使用 GPU 加速之前请务必确认一下几点：\n 1. 电脑是否为 **英伟达** GPU，即 GTX 系列，使用 AMD 显卡无法使用 GPU 加速\n 2. 电脑是否安装了 cuda ，如果安装了 cuda 请确认安装的 cuda 版本和你 pom 中引入的 `nd4j.backend` 版本是否对应\n 3. 电脑安装 cuda 之后请确保你的 IDE 已经感知到环境变量的变化，在 IDE 中的 `terminal` 使用 `nvcc -V` 命令查看。如不确定直接重启电脑即可\n \n以下为 GPU 安装和使用教程：\n 1. [Deeplearning4j-使用Cuda 9.1和 Cudnn7.1 加速模型训练](https:\u002F\u002Fwww.jianshu.com\u002Fp\u002F8a7533c2c79a)\n 2. [在Deeplearning4j中使用cuDNN](https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F79028821)\n 3. [【视频】Deeplearning4j入门 - （十）GPU加速训练 - 寒沧](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav24603590)\n \n如想确定 DeepLearning4j 已经支持的 cuda 和 cudnn 的配套版本，请打开如下链接：\n 1. [Using Deeplearning4j with cuDNN](https:\u002F\u002Fdeeplearning4j.org\u002Fcudnn) ：搜索 `CUDA Version` 字眼\n\n## lesson7 RNN循环神经网络\n\n参考资料\n 1. 理解LSTM网络：https:\u002F\u002Fwww.jianshu.com\u002Fp\u002F9dc9f41f0b29\n 2. 循环网络和LSTM教程：https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Frecurrentnetwork\n 3. DL4J中的循环网络：https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fusingrnns\n 4. [DeepLearning4j: LSTM Network Example](https:\u002F\u002Fdeeplearning4j.org\u002Fprogrammingguide\u002F05_lstm)\n \n\n## ObjectDetection 目标检测\n\n参考资料：\n 1. [DeepLearning4j-使用Java训练YOLO模型](https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F79886619)\n 2. [Java构建汽车无人驾驶：汽车目标检测](https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F79432195)\n 3. [基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD](https:\u002F\u002Fwww.julyedu.com\u002Fquestion\u002Fbig\u002Fkp_id\u002F26\u002Fques_id\u002F2103)\n 4. [【中文】Yolo v1全面深度解读 目标检测论文](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav23354360)\n 5. [【中文】Mask R-CNN 深度解读与源码解析 目标检测 物体检测 RCNN object detection 语义分割](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav24795835)\n 6. 目标检测自定义数据集：https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1u5yYv5SmK_vgd1zq1PsteQ\n \u003Cdiv align=\"center\"> \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsjsdfg_dl4j-tutorials_readme_9403c5b73559.jpg\" \u002F> \u003C\u002Fdiv>\n \n\n\n## tensorflow 导入tf模型\n\n参考资料：\n 1. https:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F80025161\n \n ****\n\n## JStarCraft，一个涵盖核心编程,人工智能,推荐与搜索领域的轻量级框架\n\n群友 [@HongZhaoHua](https:\u002F\u002Fgithub.com\u002FHongZhaoHua) 实现\n\n1. JStarCraft Core：提供了缓存，ORM，编解码，资源管理，脚本，监控，通讯，事务8个方面的核心特性，是整个框架的核心。\n[https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-core](https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-core)\n2. JStarCraft AI：包含了多种矩阵和向量计算的实现，支持硬件加速和并行计算，是目前最快最全的Java矩阵\u002F向量计算库。 \n[https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-ai](https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-ai)\n3. JStarCraft RNS：包含了70多种排序预测与评分预测算法，支持多种脚本语言，是覆盖范围最全的Java推荐与搜索引擎。\n[https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-rns](https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-rns)\n4. JStarCraft Example：一个基于JStarCraft RNS引擎,Spring Boot框架和MovieLens 100K数据集搭建的电影演示项目，包括个性化推荐与个性化搜索两个部分。系统会根据用户的行为记录，自动调整用户的推荐内容和搜索内容。[https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-example](https:\u002F\u002Fgithub.com\u002FHongZhaoHua\u002Fjstarcraft-example)\n\n| 作者 | 洪钊桦 |\n| --- | --- |\n| E-mail | 110399057@qq.com, jstarcraft@gmail.com |\n\n\n ## baidudianshi 百度点石比赛 baseline demo\n\n 参考资料：\n  1. 比赛地址：http:\u002F\u002Fdianshi.baidu.com\u002Fdianshi\u002Fpc\u002Fcompetition\u002F22\u002Frule\n  2. 防止比赛结束，数据寻回链接：https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1_M0yPejFTvxDFOn4780OPA\n  3. Baseline 0.83 得分模型：https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1i-v02HnMPQwjtm32fPp67A （已经保存 Updater 信息，可用于增量训练）\n  4. 内存管理官方文档：https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-config-memory\n  5. 迁移学习官方文档：https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-nn-transfer-learning\n  6. 迁移学习推荐阅读博客：https:\u002F\u002Fblog.csdn.net\u002Fwangongxi\u002Farticle\u002Fdetails\u002F75127131\n  7. 早停法训练模型官方文档：https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-nn-early-stopping\n  8. [百度点石-“探寻地球密码”天宫数据利用大赛.md](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdeeplearning4j-issues\u002Fblob\u002Fmaster\u002Fmarkdown\u002F%E7%99%BE%E5%BA%A6%E7%82%B9%E7%9F%B3-%E2%80%9C%E6%8E%A2%E5%AF%BB%E5%9C%B0%E7%90%83%E5%AF%86%E7%A0%81%E2%80%9D%E5%A4%A9%E5%AE%AB%E6%95%B0%E6%8D%AE%E5%88%A9%E7%94%A8%E5%A4%A7%E8%B5%9B.md)\n  9. [百度点石-“探寻地球密码”天宫数据利用大赛.pdf](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdeeplearning4j-issues\u002Fblob\u002Fmaster\u002F%E7%99%BE%E5%BA%A6%E7%82%B9%E7%9F%B3-%E2%80%9C%E6%8E%A2%E5%AF%BB%E5%9C%B0%E7%90%83%E5%AF%86%E7%A0%81%E2%80%9D%E5%A4%A9%E5%AE%AB%E6%95%B0%E6%8D%AE%E5%88%A9%E7%94%A8%E5%A4%A7%E8%B5%9B.pdf)\n\n ## 模型训练早停法\n\n ### 1. 创建 ModelSaver\n\n 用于在模型训练过程中，指定最好模型保存的位置：\n\n 1. InMemoryModelSaver：用于保存到内存中\n 2. LocalFileModelSaver：用于保存到本地目录中，只能保存 `MultiLayerNetwork` 类型的网络结果\n 3. LocalFileGraphSaver：用于保存到本地目录中，只能保存 `ComputationGraph` 类型的网络结果\n\n ### 2. 配置早停法训练配置项\n\n 1. epochTerminationConditions：训练结束条件\n 2. evaluateEveryNEpochs：训练多少个epoch 来进行一次模型评估\n 3. scoreCalculator：模型评估分数的计算者\n     - org.deeplearning4j.earlystopping.scorecalc.RegressionScoreCalculator 用于回归的分数计算\n     - ClassificationScoreCalculator 用于分类任务的分数计算\n 4. modelSaver：模型的存储位置\n 5. iterationTerminationConditions：在每一次迭代的时候用于控制\n\n ### 3. 获取早停法信息\n ```Java\n \u002F\u002FConduct early stopping training:\n EarlyStoppingResult result = trainer.fit();\n System.out.println(\"Termination reason: \" + result.getTerminationReason());\n System.out.println(\"Termination details: \" + result.getTerminationDetails());\n System.out.println(\"Total epochs: \" + result.getTotalEpochs());\n System.out.println(\"Best epoch number: \" + result.getBestModelEpoch());\n System.out.println(\"Score at best epoch: \" + result.getBestModelScore());\n \n \u002F\u002FPrint score vs. epoch\n Map\u003CInteger,Double> scoreVsEpoch = result.getScoreVsEpoch();\n List\u003CInteger> list = new ArrayList\u003C>(scoreVsEpoch.keySet());\n Collections.sort(list);\n System.out.println(\"Score vs. Epoch:\");\n for( Integer i : list){\n     System.out.println(i + \"\\t\" + scoreVsEpoch.get(i));\n }\n ```\n\n ## 迁移学习\n\n ### 1. 获取原有的网络结构\n\n ```Java\n  \u002F\u002F 构造数据模型\n ZooModel zooModel = VGG16.builder().build();\n ComputationGraph vgg16 = (ComputationGraph) zooModel.initPretrained();\n ```\n\n\n ### 2. 修改模型的训练部分超参数\n\n  1. updater\n  2. 学习率\n  3. 随机数种子：用于模型的复现\n\n ```java\n  FineTuneConfiguration fineTuneConf = new FineTuneConfiguration.Builder()\n                 .updater(new Nesterovs(0.1, 0.9))\n                 .seed(123)\n                 .build();\n ```\n\n ### 3. 修改网络架构\n\n #### 3.1 setFeatureExtractor\n\n 用于指定那个层以下为非 frozen 层，非冻结层。\n\n\n #### 3.2 结构更改\n\n 1. 一般只有不同网络层之间才会出现 shape 异常：需要根据异常信息调整我们的网络层结构和参数\n 2. `removeVertexKeepConnections` 和 `addLayer` 或者是 `addVertex` 进行网络结构的更改\n\n## 自定义网络层实现GRU\n\n参考资料：\n 1. https:\u002F\u002Fgithub.com\u002FGerry-Pan\u002Fpan-dl4j\n\n根据GRU前向公式推导反向公式，并在dl4j中实现。\n\n## 整合DL4J训练模型与Web工程\n参考资料：\n 1. 博文地址：https:\u002F\u002Fmy.oschina.net\u002Fu\u002F1778239\u002Fblog\u002F1648854\n 2. 源码地址：https:\u002F\u002Fgitee.com\u002Flxkm\u002Fdl4j-demo\u002Ftree\u002Fmaster\u002Fdigitalrecognition\n\n## 【深度学习】图像矫正、dl4j yolo和tesseract ocr\n\n参考资料：\n 1. 视频地址：https:\u002F\u002Ftianchi.aliyun.com\u002Fforum\u002FvideoStream.html#postsId=5312\n 2. 视频代码所在github：https:\u002F\u002Fgithub.com\u002Fawaymeet\u002Ftesseract\n\n## 人脸识别 - FaceRecognition\n\n参考资料：\n  1. https:\u002F\u002Fgithub.com\u002Ffradino\u002FFaceRecognition\n  2. https:\u002F\u002Fgitee.com\u002Fxshuai\u002FFaceRecognition\n  \n\n## 参数共享\n\n感谢群友 [@冷血狂魔]() [@Gerry]()\n\n- StackVertex，用它就能实现参数共享\n\n数学方法参数证明：\n\n- [DeepLearning4j 的 StackVertex 实现参数共享 ](https:\u002F\u002Fblog.csdn.net\u002Fpangerry\u002Farticle\u002Fdetails\u002F90814970)\n\n与其类似的类为 `MergeVertex`，与其的主要区别在于：\n\n- Merge 的合并方式是沿着 dimension=1 合并，Stack 是沿着 dimension=0 合并\n- 沿着 dimension=0 合并的好处是无论第 0 维的长度为多少，权重 w 的 shape 都不会变，而且在反向计算梯度恰好等于 n 个 input 的产生的梯度的和\n- 所以只要使用 StackVertex 对 n 个输入进行合并，后面随意拼接神经网络层，诸如 DenseLayer, LSTM, ConvLayer 都能达到目的，最后用 UnstackVertex 拆分输出\n\n数学推导 [@Gerry]() 提供。其从矩阵运算角度说明 StackVertex 只做合并就能实现参数共享的原因\n  \n## 天池比赛-工业蒸汽量预测\n\n群友 [@冷血狂魔]()提供\n\n- [参赛地址](https:\u002F\u002Ftianchi.aliyun.com\u002Fcompetition\u002Fentrance\u002F231693\u002Fintroduction?spm=5176.12281949.1003.9.493e4c2apzwdri)\n\n### 背景\n  火力发电的基本原理是：燃料在燃烧时加热水生成蒸汽，蒸汽压力推动汽轮机旋转，然后汽轮机带动发电机旋转，产生电能。在这一系列的能量转化中，影响发电效率的核心是锅炉的燃烧效率，即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多，包括锅炉的可调参数，如燃烧给量，一二次风，引风，返料风，给水水量；以及锅炉的工况，比如锅炉床温、床压，炉膛温度、压力，过热器的温度等。\n  \n### 目标\n\n经脱敏后的锅炉传感器采集的数据（采集频率是分钟级别），根据锅炉的工况，预测产生的蒸汽量。\n\n- [deeplearning4j解蒸汽比赛的思路（0.1136）](https:\u002F\u002Ftianchi.aliyun.com\u002Fnotebook-ai\u002Fdetail?spm=5176.12281897.0.0.a0792658MVZabi&postId=58269)\n\n## 推荐系统 - Recommend\n\n参考资料：\n  1. [lib-rec](https:\u002F\u002Fgithub.com\u002Fguoguibing\u002Flibrec)：https:\u002F\u002Fgithub.com\u002Fguoguibing\u002Flibrec\u002Ftree\u002F3.0.0\u002Fcore\u002Fsrc\u002Fmain\u002Fjava\u002Fnet\u002Flibrec\u002Frecommender\u002Fnn\n  2. [inception](https:\u002F\u002Fgithub.com\u002Finception-project\u002Finception)：https:\u002F\u002Fgithub.com\u002Finception-project\u002Finception\u002Ftree\u002Fmaster\u002Finception-imls-dl4j\u002Fsrc\u002Fmain\u002Fjava\u002Fde\u002Ftudarmstadt\u002Fukp\u002Finception\u002Frecommendation\u002Fimls\u002Fdl4j\u002Fpos\n\n## Deeplearning4j 实现 Attention\n\n参考资料：\n1. [直播实现视频 youtube(自备梯子)](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=XrZ_Y4koV5A)\n2. [Implementing NLP Attention Mechanisms with DeepLearning4j(搬运到国内bilibili)](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002Fav37100054\u002F)\n3. [attention 实现源码](https:\u002F\u002Fgithub.com\u002Ftreo\u002Fdl4j_attention)\n4. [Attention Mechanisms (Enterprise AI Virtual Meetup).pdf](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1BzrteMiqlvm_l7Cv54Yc4g)\n\n## GAN\n\n- [GAN 使用 MNIST 实例](https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Ftree\u002Fmaster\u002Fsrc\u002Fmain\u002Fjava\u002Fgan)。群友 @城枫林 和 [@liweigu](https:\u002F\u002Fgithub.com\u002Fliweigu) 提供\n- [gan_deeplearning4j](https:\u002F\u002Fgithub.com\u002Fhamaadshah\u002Fgan_deeplearning4j)\n- [如何用Deeplearning4j实现GAN](https:\u002F\u002Fmy.oschina.net\u002Fu\u002F1778239\u002Fblog\u002F3090072)\n\n## 自制AI图像搜索引擎\n\n群友 @射水鱼 撰写了一本使用 DeepLearning4j 实现的《自制AI图像搜索引擎》。\n\n该书按章节详细讲述了图像搜索引擎各主要组成部分的原理和实现，并在最后一章带领大家使用DL4J从零开始逐步构建了一个基于深度学习的Web图像搜索引擎，使读者能够更透彻地理解图像检索的理论并具有独立地实现一个在线图像搜索引擎的实际能力。每章都在对相关理论和方法进行阐述的同时，使用基于Java语言的实现代码和详实的代码注释来对相关理论和方法进行复述。\n\n- 书籍地址：[https:\u002F\u002Fwww.epubit.com\u002Fbook\u002Fdetail\u002F30316](qq:\u002F\u002Ftxfile\u002F#)\n- 源码地址：[https:\u002F\u002Fbox.lenovo.com\u002Fl\u002FLHh2vR](qq:\u002F\u002Ftxfile\u002F#) 密码: 1aaa  \n\n```xml\n\u003Cdependency>\n    \u003CgroupId>be.tarsos\u003C\u002FgroupId>\n    \u003CartifactId>TarsosLSH\u003C\u002FartifactId>\n    \u003Cversion>${tarsosLSH.version}\u003C\u002Fversion>\n\u003C\u002Fdependency>\n```\n\n如果导入项目中有依赖缺失，下载以下 jar 包：\n\n- [TarsosLSH-0.9 下载地址](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1sbmvbkab6K5tRF92U-ItHw) 提取码：88qv\n- [TarsosLSH github地址，也可以自行编译](https:\u002F\u002Fgithub.com\u002FJorenSix\u002FTarsosLSH)\n\n使用 `\u003Cscope> system \u003C\u002Fscope>`进行本地的 jar 包导入，或者使用以下命令安装在本地的 maven 仓库中：\n\n```bash\nmvn install:install-file -Dfile=\u002Fpath\u002Fto\u002Fjar -DgroupId=be.tarsos -DartifactId=TarsosLSH -Dversion=0.9 -Dpackaging=jar\n```\n\n## 强化学习 RL4j\n\n参考资料：\n 1. 简书文章：https:\u002F\u002Fwww.jianshu.com\u002Fp\u002F4d7f23395e92\n 2. gitee代码：https:\u002F\u002Fgitee.com\u002Fre6g3y\u002FDL4J-with-LIBGDX\n\n \u003Cdiv align=\"center\"> \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsjsdfg_dl4j-tutorials_readme_621dcfb1d327.gif\"\u002F> \u003C\u002Fdiv>\n\n## Deeplearning4j 经典开源项目\n\n 1. [ScalphaGoZero](https:\u002F\u002Fgithub.com\u002Fmaxpumperla\u002FScalphaGoZero):An independent implementation of DeepMind's AlphaGoZero in Scala, using Deeplearning4J (DL4J 实现阿尔法狗)\n 2. https:\u002F\u002Fgithub.com\u002Ftahaemara\u002Fyolo-custom-object-detector : 使用 YOLO 检测实时检测自定义数据集 - 魔方\n 3. https:\u002F\u002Fgithub.com\u002Fmccorby\u002FPhotoLabeller : 安卓客户端实现分布式训练。 使用 Kotlin 实现\n 4. https:\u002F\u002Fgithub.com\u002Ftahaemara\u002Freal-time-sudoku-solver : 使用 dl4j 解决数独\n 5. https:\u002F\u002Fgithub.com\u002Fkaiwaehner\u002Fkafka-streams-machine-learning-examples : kafka 流训练\n 6. https:\u002F\u002Fgithub.com\u002Ffra82\u002Ftextdigester : dl4j 实现文档总结\n\n## 获取最新的Deeplearning4j(Snapshots And Daily Builds)\n\n参考资料：\n  1. https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-config-snapshots\n\n配置 `pom.xml` 文件\n```XML\n\u003Crepositories>\n    \u003Crepository>\n        \u003Cid>snapshots-repo\u003C\u002Fid>\n        \u003Curl>https:\u002F\u002Foss.sonatype.org\u002Fcontent\u002Frepositories\u002Fsnapshots\u003C\u002Furl>\n        \u003Creleases>\n            \u003Cenabled>false\u003C\u002Fenabled>\n        \u003C\u002Freleases>\n        \u003Csnapshots>\n            \u003Cenabled>true\u003C\u002Fenabled>\n            \u003CupdatePolicy>daily\u003C\u002FupdatePolicy>  \u003C!-- Optional, update daily -->\n        \u003C\u002Fsnapshots>\n    \u003C\u002Frepository>\n\u003C\u002Frepositories>\n```\n自动获取 skymind 所提供的 jar 包编译更新\n\n# Spark 读取数据\n\n1. https:\u002F\u002Fgithub.com\u002Fdeeplearning4j\u002Fdl4j-examples\u002Fissues\u002F689\n2. [Spark Data Pipelines Guide](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-scaleout-data-howto)\n3. [Spark 训练指南](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002Fdeeplearning4j-scaleout-howto)\n\n```java\nok, so there's 2 ways\n(a) use SparkContext.parallelize (that's a standard spark op) - easy but bad performance (all preprocessing happens on master)\n(b) write a better data pipeline that does the proper reading + conversion in parallel\n```\n\n# 群友项目分享\n\n1. 基于dl4j的快三爬取和训练以及预测:https:\u002F\u002Fgithub.com\u002Fawaymeet\u002Flottery_kuai_san\u002Ftree\u002Fmaster\n2. 开源的学习SpringCloud和Deeplaring4j和IBMWaston知识的项目: https:\u002F\u002Fgithub.com\u002FJamesZow\u002FSpring-Cloud-Project\n3. DL4J的CNN+RNN+CTC的文字识别的demo：https:\u002F\u002Fgithub.com\u002FWuWei1986\u002Fdl4j-ocr-demo\n4. 全连接层的神经网络框架的雏形：https:\u002F\u002Fgithub.com\u002Fwoshiyigebing\u002Fmy_dl4j  （只用了INDarray。给新手研究入门一些启发）\n\n# 额外资源\n\n 1. [机器学习高质量数据集大合辑](https:\u002F\u002Fmp.weixin.qq.com\u002Fs?__biz=MjM5MTQzNzU2NA==&mid=2651663921&idx=2&sn=300429e518d159bb7654e1771672429e&chksm=bd4c09a28a3b80b4aa961577a7f59229d23bbd5f88b50bec6de21b0f94bd2fd2b348d1d4eb04&mpshare=1&scene=23&srcid=1023m8ifSIuylq6VcBQKRkt7#rd)\n 2. [中文开放聊天语料整理](https:\u002F\u002Fgithub.com\u002Fcodemayq\u002Fchaotbot_corpus_Chinese)\n 3. [gitxiv:只提供有复现开源代码的论文](http:\u002F\u002Fwww.gitxiv.com\u002F)\n 4. [papers with code](https:\u002F\u002Fpaperswithcode.com\u002F)\n 4. [hadoop-winutils](https:\u002F\u002Fgithub.com\u002Fsteveloughran\u002Fwinutils)：提供 hadoop 工具在 windows 平台下的 hadoop.dll和winutils.exe。便于 windows 下运行 spark-local 模式\n 5. [hadoop-winutils for 3.+](https:\u002F\u002Fgithub.com\u002Fcdarlint\u002Fwinutils)\n 5. [深度学习理论与实战：提高篇](http:\u002F\u002Ffancyerii.github.io\u002F2019\u002F03\u002F14\u002Fdl-book\u002F)\n 6. [tablesaw](https:\u002F\u002Fgithub.com\u002Fjtablesaw\u002Ftablesaw)：Java dataframe and visualization library https:\u002F\u002Fjtablesaw.github.io\u002Ftablesaw\u002F  提供类似于 Python 中的 Pandas 和 Matplot 的功能\n 7. 让机器学习更具有可解释性：https:\u002F\u002Fchristophm.github.io\u002Finterpretable-ml-book\u002F\n\n\n\n \n\n[2]: https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fneuralnet-overview\n[3]: https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fetl-userguide\n[4]: https:\u002F\u002Fdeeplearning4j.org\u002Fcn\u002Fmnist-for-beginners\n[5]: http:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F79113789\n[6]: https:\u002F\u002Fdeeplearning4j.org\u002Fquickref\n[7]: https:\u002F\u002Fdeeplearning4j.org\u002Fexamples-tour\n[8]: http:\u002F\u002Fblog.csdn.net\u002Fu011669700\u002Farticle\u002Fdetails\u002F80139619\n[9]: http:\u002F\u002Fblog.csdn.net\u002Fqq_41185868\u002Farticle\u002Fdetails\u002F79995732","# dl4j-tutorials 快速上手指南\n\nDeepLearning4J (DL4J) 是一套基于 Java 的分布式深度学习库，专为商业环境设计，支持 CPU\u002FGPU 加速，并能与 Hadoop\u002FSpark 无缝集成。本指南将帮助你快速搭建环境并运行第一个示例。\n\n## 1. 环境准备\n\n### 系统要求\n- **操作系统**: Windows, macOS, Linux\n- **JDK**: Java 8 或更高版本\n- **构建工具**: Maven 3.6+\n- **IDE**: IntelliJ IDEA 或 Eclipse (推荐 IntelliJ)\n- **GPU 加速 (可选)**:\n  - 必须使用 **NVIDIA** 显卡 (GTX\u002FRTX 系列)，AMD 显卡不支持。\n  - 需安装对应版本的 CUDA 和 cuDNN。\n  - 安装后请在终端运行 `nvcc -V` 确认环境变量生效。\n\n### 前置依赖配置 (关键)\n由于 DL4J 依赖较多，首次使用强烈建议配置 **阿里云 Maven 镜像** 以加速下载。\n\n修改 Maven 配置文件 `settings.xml` (通常位于 `~\u002F.m2\u002Fsettings.xml` 或 Maven 安装目录 `conf\u002Fsettings.xml`)，在 `\u003Cmirrors>` 标签内添加：\n\n```xml\n\u003Cmirror>\n    \u003Cid>nexus-aliyun\u003C\u002Fid>\n    \u003CmirrorOf>central\u003C\u002FmirrorOf>\n    \u003Cname>Nexus aliyun\u003C\u002Fname>\n    \u003Curl>http:\u002F\u002Fmaven.aliyun.com\u002Fnexus\u002Fcontent\u002Fgroups\u002Fpublic\u003C\u002Furl>\n\u003C\u002Fmirror>\n```\n\n## 2. 安装步骤\n\n### 步骤一：获取项目代码\n克隆教程仓库到本地：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials.git\ncd dl4j-tutorials\n```\n\n### 步骤二：导入项目\n使用 IntelliJ IDEA 打开项目根目录，选择 \"Open as Maven Project\"。IDEA 会自动根据 `pom.xml` 下载依赖。\n\n*注意：若需离线使用，可运行以下命令将 jar 包导出到 `target\u002Flib` 目录：*\n```bash\nmvn dependency:copy-dependencies -DoutputDirectory=target\u002Flib\n```\n\n### 步骤三：验证 GPU 环境 (仅限需要 GPU 加速的用户)\n如果你计划使用 GPU 训练，请检查 `pom.xml` 中引入的 `nd4j.backend` 是否与你安装的 CUDA 版本匹配。\n- 例如：CUDA 9.1 对应 `nd4j-cuda-9.1-platform`。\n- 详细版本对照表请参考官方文档：[Using Deeplearning4j with cuDNN](https:\u002F\u002Fdeeplearning4j.org\u002Fcudnn)。\n\n## 3. 基本使用\n\n本仓库包含多个由浅入深的教程案例（Lesson 1 - Lesson 7）。以下是运行最基础的 **ND4J 操作** 或 **线性回归** 示例的方法。\n\n### 运行示例代码\n在 IDE 中找到对应的 Main 类直接运行，或通过 Maven 命令行执行。\n\n**示例：运行 Lesson 2 (简易线性回归)**\n假设主类路径为 `org.dl4j.tutorials.lesson2.LinearRegressionExample` (具体类名请以源码为准)：\n\n```bash\n# 在项目根目录下运行\nmvn exec:java -Dexec.mainClass=\"org.dl4j.tutorials.lesson2.LinearRegressionExample\"\n```\n\n### 核心功能速览\n根据教程结构，你可以按以下顺序学习：\n\n1.  **ND4J 基础 (Lesson 1)**: 学习多维数组操作，类似 Python 的 NumPy。\n2.  **构建网络 (Lesson 2-3)**: 使用 `MultiLayerNetwork` 构建简单的全连接网络进行回归和分类。\n3.  **图像处理 (Lesson 4 & 6)**: 加载 MNIST 数据集，构建 CNN (卷积神经网络) 进行手写数字识别。\n4.  **序列数据 (Lesson 7)**: 使用 RNN\u002FLSTM 处理时间序列或文本数据。\n5.  **模型持久化**: 使用 `ModelSerializer` 保存和加载训练好的模型。\n    ```java\n    \u002F\u002F 保存模型\n    ModelSerializer.writeModel(model, \"myModel.zip\", true);\n    \u002F\u002F 加载模型\n    MultiLayerNetwork restored = ModelSerializer.restoreMultiLayerNetwork(\"myModel.zip\");\n    ```\n\n### 进阶技巧：早停法 (Early Stopping)\n防止过拟合的标准配置示例：\n\n```java\n\u002F\u002F 配置早停法\nEarlyStoppingConfiguration\u003CMultiLayerNetwork> esConfig = new EarlyStoppingConfiguration.Builder\u003CMultiLayerNetwork>()\n        .epochTerminationConditions(new MaxEpochsTerminationCondition(10)) \u002F\u002F 最大训练轮数\n        .evaluateEveryNEpochs(1)\n        .iterationTerminationConditions(new MaxScoreIterationTerminationCondition(10)) \n        .scoreCalculator(new RegressionScoreCalculator()) \u002F\u002F 或 ClassificationScoreCalculator\n        .modelSaver(new LocalFileModelSaver(\"models\"))\n        .build();\n\nEarlyStoppingTrainer trainer = new EarlyStoppingTrainer(esConfig, conf, trainData);\nEarlyStoppingResult result = trainer.fit(testData);\n```\n\n---\n**更多资源**:\n- 视频教程：[Bilibili 主页](https:\u002F\u002Fspace.bilibili.com\u002F327018681)\n- 官方文档：[Deeplearning4J Docs](https:\u002F\u002Fdeeplearning4j.org\u002Fdocs\u002Flatest\u002F)\n- 社区交流：QQ 群 289058486 (入群答案：GitHub 源码地址)","某金融科技公司后端团队需在现有 Java 系统中集成手写票据识别功能，但团队成员普遍缺乏深度学习框架经验。\n\n### 没有 dl4j-tutorials 时\n- **环境配置受阻**：面对复杂的 Maven 依赖和海外源下载缓慢问题，团队耗费数天仍无法成功导入 DL4J 核心包，项目启动停滞。\n- **概念理解断层**：开发人员熟悉 Java 语法但不懂神经网络术语（如 Epoch、Batchsize），在编写线性回归代码时因逻辑错误导致模型无法收敛。\n- **调试无从下手**：遇到模型训练不工作或精度低时，缺乏系统的排查思路，只能盲目调整参数，效率极低且容易放弃。\n- **工程落地困难**：不知道如何将训练好的模型保存并加载到生产环境，更不清楚如何与 Spark 集群集成以实现分布式计算。\n\n### 使用 dl4j-tutorials 后\n- **快速搭建环境**：参照教程中提供的阿里云 Maven 镜像配置和 `settings.xml` 示例，半小时内即可完成本地开发环境搭建并运行首个 Demo。\n- **循序渐进学习**：通过\"ND4J 基础”到\"CNN 改进”的分阶视频与代码实战，团队迅速掌握了从数据分类到卷积神经网络的完整实现路径。\n- **高效定位问题**：利用教程中的“调参指南”和“常见错误排查”章节，快速解决了梯度消失和数据不平衡问题，显著提升了模型准确率。\n- **平滑生产部署**：依据“模型保存与读取”章节指导，顺利实现了模型在 HDFS 上的持久化及在 Spark 环境下的分布式部署，完成业务闭环。\n\ndl4j-tutorials 将晦涩的深度学习理论转化为可执行的 Java 代码路径，帮助传统后端团队零门槛跨越 AI 工程化鸿沟。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fsjsdfg_dl4j-tutorials_5e0ffbc2.png","sjsdfg","Joe","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fsjsdfg_6b0a161a.jpg",null,"Beijing","https:\u002F\u002Fgithub.com\u002Fsjsdfg",[82,86],{"name":83,"color":84,"percentage":85},"Java","#b07219",97.5,{"name":87,"color":88,"percentage":89},"Python","#3572A5",2.5,519,151,"2026-03-31T14:15:32","MIT",4,"Windows, macOS, Linux","非必需。若需加速，必须为 NVIDIA GPU (GTX 系列等)，不支持 AMD 显卡。需安装 CUDA 和 cuDNN，具体版本需与 pom.xml 中引入的 nd4j.backend 版本对应（文中示例提及 CUDA 9.1 + cuDNN 7.1）。","未说明",{"notes":99,"python":100,"dependencies":101},"1. 该项目基于 Java 语言，使用 Maven 管理依赖，无需 Python 环境。\n2. 首次使用前建议配置 Maven 镜像为阿里云以加速下载。\n3. 若使用 GPU 加速，安装 CUDA 后需重启电脑或确保 IDE 终端能识别 nvcc 命令。\n4. 支持分布式 CPU\u002FGPU 计算，可集成 Hadoop 和 Spark。","不需要 (基于 Java)",[102,103,104,105,106],"Java JDK","Maven","Deeplearning4j (DL4J)","ND4J","CUDA (可选)",[13],[109,110,67,111,112,113],"deeplearning4j","dl4j","nd4j","deep-learning","java-machine-learning","2026-03-27T02:49:30.150509","2026-04-06T05:17:46.007680",[117,122,127,132,137,141],{"id":118,"question_zh":119,"answer_zh":120,"source_url":121},14914,"运行时报错 'jnicudart.dll: Can't find dependent libraries' 怎么办？","这通常与显卡驱动或 CUDA 环境变量配置有关。请尝试以下步骤：\n1. 确认 CUDA 安装成功，并将所有 CUDA 相关路径添加到系统环境变量中。\n2. 重启电脑后再次尝试。\n3. 使用命令 `where jnicudart.dll` 查找文件路径，确认文件是否存在于预期目录（如 .javacpp\\cache 目录下）。\n4. 检查显卡型号是否支持所安装的 CUDA 版本。","https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Fissues\u002F7",{"id":123,"question_zh":124,"answer_zh":125,"source_url":126},14915,"使用 CUDA 测试时遇到 'Cannot add vertex: a vertex with name \"outputs\" already exists' 错误？","该问题通常由模型配置文件中的层命名冲突引起。虽然维护者表示无法复现且建议自行检查配置，但根据反馈，这特定于 'RedBloodCellDetection' 示例中名为 'outputs' 的层。解决方法是检查并修改模型构建代码（ComputationGraphConfiguration），确保添加的顶点（Vertex）或层名称唯一，避免重复添加名为 'outputs' 的节点。","https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Fissues\u002F4",{"id":128,"question_zh":129,"answer_zh":130,"source_url":131},14916,"训练完成后分数（Score）波动大且测试时检测不出目标（如红细胞）？","如果训练分数不稳定或测试结果不佳，可以尝试调整超参数。维护者建议调整 `batchSize`（批次大小）的大小。不同的数据集和硬件环境可能需要不同的批次大小才能达到收敛和最佳检测效果。","https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Fissues\u002F5",{"id":133,"question_zh":134,"answer_zh":135,"source_url":136},14917,"代码中涉及 Lombok 的类报错或无法识别怎么办？","该类严重依赖 `lombok` 库。解决方法取决于使用的 IDE：\n1. 如果使用 IntelliJ IDEA：请在 `Setting` -> `Plugins` 中搜索并安装 Lombok 插件，并确保启用了注解处理（Annotation Processing）。\n2. 如果使用 Eclipse：请前往 Lombok 官网下载对应的 jar 包，双击运行安装程序进行安装。","https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Fissues\u002F1",{"id":138,"question_zh":139,"answer_zh":140,"source_url":126},14918,"CPU 版本运行正常但切换到 CUDA 版本后出现各种配置错误或性能问题？","切换至 CUDA 版本时，请确保 Maven\u002FGradle 依赖中的版本号一致（例如 nd4j, dl4j, datavec 等均为同一 beta 版本）。同时检查日志输出确认后端是否正确加载（如看到 'Loaded [JCublasBackend] backend' 和 'Backend used: [CUDA]'）。如果报错，需核对显卡驱动、CUDA Toolkit 及 cuDNN 版本是否与 Deeplearning4j 要求的版本兼容。",{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},14919,"Git Clone 项目后运行示例代码（如 Nd4jCreate）报错，如何排查？","此类问题通常与环境配置或依赖缺失有关。虽然具体报错信息在部分案例中未完整提供，但通用排查步骤包括：\n1. 确认 JDK 版本兼容性（如 JDK 1.8）。\n2. 检查 Maven 依赖是否完整下载（查看 .m2 仓库）。\n3. 确保操作系统环境变量（如 JAVA_HOME）配置正确。\n4. 如果是 Windows 系统，注意路径中是否包含特殊字符或空格导致类路径解析失败。建议在提问时提供完整的堆栈跟踪信息以便定位。","https:\u002F\u002Fgithub.com\u002Fsjsdfg\u002Fdl4j-tutorials\u002Fissues\u002F3",[]]