d2l-vi

658 255 非常简单 1 次阅读昨天NOASSERTION图像开发框架

AI 解读由 AI 自动生成，仅供参考

d2l-vi 是国际知名深度学习教材《Dive into Deep Learning》的越南语开源翻译项目。这本书原本以英文编写，涵盖了深度学习的基础理论与实战代码，支持多种主流框架，已被全球 55 个国家的 300 多所顶尖高校（如 MIT、斯坦福、哈佛等）采用为教学资料。

由于高质量的技术资源多以英文呈现，许多越南语学习者面临语言障碍。d2l-vi 通过社区协作的方式，将这本权威教材完整本地化，让越南学生和研究者能更轻松地掌握深度学习知识。书中不仅讲解清晰，还配有可运行的代码示例，帮助读者边学边练，真正理解模型构建与训练过程。

该项目适合对人工智能感兴趣的学生、教师、研究人员以及希望系统学习深度学习的开发者使用。无论你是刚入门的新手，还是有一定基础想深入进阶，都能从中受益。其独特之处在于结合了理论讲解、代码实现与多框架适配，并依托活跃的开源社区持续更新术语表与维护内容质量。

目前，项目由多位资深维护者带领，遵循开放许可协议，鼓励更多人参与贡献。访问官方网站即可免费阅读全书内容，也可在 GitHub 上参与讨论或协助翻译，共同推动越南语 AI 教育的发展。

使用场景

一名越南大学生正在准备深度学习课程期末项目，需要快速掌握神经网络原理并复现经典模型代码。

没有 d2l-vi 时

面对英文原版《Dive into Deep Learning》，复杂的学术术语和长难句让非英语母语的学生阅读效率极低，常常卡在概念理解上。
寻找对应的越南语资料时，发现网络上的教程碎片化严重，且代码示例往往过时或与主流框架（如 PyTorch、TensorFlow）不兼容。
在尝试复现算法时，因缺乏统一的术语对照表，导致对“反向传播”、“注意力机制”等核心概念的理解出现偏差，调试代码无从下手。
遇到疑难问题时，本地社区缺乏系统性的讨论资源，只能去国外论坛发帖，语言障碍使得获取帮助的周期长达数天。

使用 d2l-vi 后

直接阅读由社区精心翻译的越南语版教材，语言通俗易懂，学生能迅速 grasp 核心数学原理与算法逻辑，阅读速度提升三倍。
获取与书本章节严格同步的最新可运行代码，支持多种主流框架，无需修改即可直接在本地环境跑通实验，验证理论猜想。
查阅项目提供的标准术语表，确保了学术概念理解的准确性，消除了因翻译歧义导致的代码实现错误。
通过项目链接的讨论区与译者及同行交流，用母语快速解决疑惑，将原本数天的问题解决时间缩短至几小时。

d2l-vi 通过提供高质量的本土化教材与配套代码，彻底打破了语言壁垒，让越南开发者能零门槛地享受世界顶级的深度学习教育资源。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该项目是《Dive into Deep Learning》书籍的越南语翻译版本（d2l-vi），主要包含文档和教程内容，而非独立的软件工具。README 中未提供具体的代码运行环境、依赖库或硬件需求。用户需参考原始英文版项目 (d2l-ai/d2l-en) 以获取相关的深度学习框架（如 PyTorch, TensorFlow 等）安装指南和环境配置要求。

python未说明

快速开始

书籍翻译项目“深入浅出深度学习”

GitHub 工作流状态（分支） GitHub 仓库大小 GitHub 贡献者 GitHub 提交活跃度 GitHub 最后一次提交

越南语版：https://d2l.aivivn.com/
英语版：https://www.d2l.ai/

与翻译小组讨论

您可以在**这里**发起新的讨论。

术语表

请在**这里**查阅本翻译小组使用的术语。

致谢

在项目实施过程中，我们得到了社区的诸多帮助、支持与指导；怀着深深的感激之情，我们谨向所有为本项目作出贡献的人士致以诚挚的谢意，无论其贡献大小。

社区的具体贡献已完整列出于**这里**。

维护者

段武维清 @duythanhvn
武友贴 @tiepvupsu

许可证

本书采用**知识共享署名-相同方式共享 4.0 国际许可协议授权。书中的示例代码及参考资料则采用MIT 许可证**授权，并已进行相应更新。

d2l-vi 快速上手指南

d2l-vi 是经典深度学习教材《Dive into Deep Learning》的越南语翻译项目。虽然其核心内容为越南语，但其代码实现与英文版（d2l-en）完全一致，基于 Apache MXNet、PyTorch、TensorFlow 或 JAX 框架。中国开发者可利用该项目获取多语言视角的代码实现参考。

环境准备

本项目主要依赖 Python 环境及对应的深度学习框架。推荐使用 Python 3.8+。

前置依赖：

Git
Python 3.8 或更高版本
pip 或 conda 包管理工具
推荐的深度学习框架（任选其一）：
- PyTorch (推荐)
- Apache MXNet
- TensorFlow 2.x
- JAX

国内加速建议：在安装 Python 依赖时，建议使用清华大学或阿里云镜像源以提升下载速度。

清华源：https://pypi.tuna.tsinghua.edu.cn/simple

阿里源：https://mirrors.aliyun.com/pypi/simple/

安装步骤

1. 克隆项目仓库

首先从 GitHub 拉取最新代码：

git clone https://github.com/mlbvn/d2l-vn.git
cd d2l-vn

2. 安装依赖库

根据你选择的深度学习框架安装相应依赖。以下以 PyTorch 为例（其他框架请参考项目根目录下的 requirements.txt 或对应文件夹）：

使用 pip 安装（推荐国内镜像）：

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

手动安装 PyTorch 及相关组件（若 requirements 未包含特定版本）：

pip install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install d2l -i https://pypi.tuna.tsinghua.edu.cn/simple

注意：d2l 包是本书通用的辅助库，包含了数据加载、可视化等函数，必须安装。

基本使用

本项目结构通常按章节组织，代码示例位于各章节文件夹内。以下演示如何运行一个简单的线性回归示例（假设位于 chapter_linear-networks 目录下）。

运行代码示例

进入对应章节目录并执行 Python 脚本：

cd chapter_linear-networks
python linear-regression-scratch.py

在 Jupyter Notebook 中交互学习

该书非常适合通过 Jupyter Notebook 进行交互式学习。启动服务如下：

jupyter notebook

浏览器打开后，导航至 chapter_linear-networks 或其他章节目录，点击 .ipynb 文件即可运行代码块并查看越南语注释与说明。

代码调用示例

你可以在自己的 Python 脚本中导入 d2l 库来复用书中的工具函数：

from d2l import torch as d2l  # 如果使用 PyTorch 版本
# from d2l import mxnet as d2l # 如果使用 MXNet 版本

# 示例：生成随机数据
X, y = d2l.synthetic_regression_data()
d2l.set_figsize()
d2l.plt.scatter(X[:, 1].detach().numpy(), y.detach().numpy(), 1);
d2l.plt.show()

通过以上步骤，你可以快速开始利用 d2l-vi 项目进行深度学习代码的学习与实践。

版本历史

v0.14.42020/11/14

常见问题

在翻译技术图表时，如何统一和确定专业术语的中文译法？

计算机性能章节中，'Disk seek'应该翻译成什么？考虑到 SSD 的普及，'寻道'是否还准确？

作为新贡献者，提交 Pull Request (PR) 后如果需要修改内容，正确的操作流程是什么？

领取翻译任务时，是否可以一次性多做几个部分（例如认领了第 10 部分，顺便把第 9 部分也做了）？

深度学习术语'Pre-trained'应该翻译为'预训练'还是'前训练'？两者有何区别？

在 RNN 相关章节中，'Memory'和'Memory Cell'应该如何翻译才既准确又符合中文习惯？

创建 Pull Request 时有哪些常见的检查项（Checklist）需要注意？

如何在多个讨论地点（Issue、PR、Slack）之间高效管理术语翻译的讨论？

相似工具推荐

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 154.3k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|3天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|4天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架

使用场景

没有 d2l-vi 时

使用 d2l-vi 后

运行环境要求

快速开始

书籍翻译项目“深入浅出深度学习”

与翻译小组讨论

术语表

致谢

维护者

许可证

d2l-vi 快速上手指南

环境准备

安装步骤

1. 克隆项目仓库

2. 安装依赖库

基本使用

运行代码示例

在 Jupyter Notebook 中交互学习

代码调用示例

版本历史

常见问题

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

gemini-cli

markitdown