blog

3.4k 994 非常简单 1 次阅读 4天前其他

AI 解读由 AI 自动生成，仅供参考

blog 是 Hugging Face 官方博客的开源仓库，旨在为社区提供一个集中发布和分享人工智能技术文章的平台。它解决了高质量 AI 技术内容分散、难以统一管理和展示的问题，让开发者、研究人员和技术写作者能够轻松贡献教程、研究解读或项目案例。

无论是想分享深度学习心得的研究者，还是希望推广开源项目的开发者，都可以在此提交文章。blog 支持标准的 Markdown 写作流程，并具备多项实用特性：自动将文件名转化为文章 URL，简化发布步骤；内置 LaTeX 公式渲染，方便数学表达；支持嵌入 Gradio 交互式应用，让读者直接在文中体验模型效果；还提供响应式缩略图模板和高亮框组件，提升阅读体验。所有文章在合并 Pull Request 后会自动上线，无需额外部署。

如果你熟悉 Git 工作流，乐于用文字传播知识，blog 就是你展示专业见解的理想场所。它不仅降低了技术博客的发布门槛，也促进了全球 AI 社区的交流与协作。

使用场景

某 AI 研究团队希望将最新的“决策 Transformer"训练成果转化为技术博客，向社区展示模型性能并分享复现代码。

没有 blog 时

发布流程繁琐：需手动配置服务器或等待编辑部排期，从投稿到上线往往耗时数周，严重滞后于研发进度。
内容格式受限：难以在文章中直接嵌入可交互的 Gradio 演示空间或渲染复杂的 LaTeX 数学公式，导致技术细节表达不清。
资产维护困难：图片压缩、缩略图尺寸规范及文件存储路径缺乏统一标准，容易因图片过大导致加载缓慢或链接失效。
作者归属模糊：缺乏自动化的作者头像与简介展示机制，团队成员的贡献度无法在页面上直观呈现。

使用 blog 后

发布即时自动化：研究员只需创建分支、编写 Markdown 并提交 Pull Request，合并后系统自动立即发布，实现“代码即文章”。
富媒体原生支持：直接通过简单代码块嵌入 Hugging Face Spaces 交互应用和 LaTeX 公式，让读者能边读边体验模型效果。
规范内置且高效：提供标准的缩略图模板与外部大文件存储方案，引导作者自动压缩图片，确保页面加载流畅且视觉统一。
元数据自动渲染：仅需在文件头部配置作者用户名，系统自动生成发布日期、更新按钮及作者头像列表，彰显团队专业度。

blog 将技术分享从沉重的运维负担转变为简单的 Git 工作流，让 AI 研究者能专注于内容本身，实现研究成果的秒级全球同步。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该工具是 Hugging Face 博客的静态内容仓库，并非需要安装运行的软件程序。用户只需创建 Markdown 文件、资源文件夹并修改配置文件，然后通过 GitHub Pull Request 提交即可。图片需压缩以保证加载速度，缩略图建议尺寸为 1300x650 像素。支持在文章中使用 LaTeX 公式、嵌入 Gradio Space 以及使用特定的 HTML/Markdown 格式进行排版。

python未说明

快速开始

Hugging Face 博客仓库 🤗

这是 Hugging Face 博客的官方仓库。

如果您是外部贡献者：如果您的博客文章不是与 Hugging Face 合作撰写的，请考虑创建一个社区博客。社区博客文章会像本仓库中的博客一样，显示在我们博客的首页上。

如何撰写一篇文章？📝

1️⃣ 创建一个分支 YourName/Title

2️⃣ 创建一个 md（Markdown）文件，请使用简短的文件名。例如，如果您的标题是“深度强化学习简介”，那么 md 文件名可以是 intro-rl.md。这一点很重要，因为 文件名将成为博客文章的 URL。

3️⃣ 在 assets 文件夹中创建一个新的子文件夹，名称与 md 文件名相同。您也可以选择在文件夹名前添加一个尚未使用的数字前缀，但现在已经不再强制要求了。也就是说，在这个例子中，资产文件夹可以是 123_intro-rl 或 intro-rl。该文件夹将仅包含 您的缩略图。文件夹编号主要是为了（大致）排序，因此即使两篇同时发布的文章使用了相同的编号，也无伤大雅。

对于其余文件，请在 HuggingFace 文档图片仓库中创建一个对应的镜像文件夹。这样做是为了减少克隆和拉取时 GitHub 主仓库的臃肿。

🖼️：关于图片，请尽量使用小文件，以避免加载速度过慢：

使用压缩后的图片，您可以使用以下网站：https://tinypng.com 或 https://www.iloveimg.com/compress-image

4️⃣ 将以下内容复制并粘贴到您的 md 文件中，并修改相应的内容：

标题
缩略图
作者

---
title: "在此处填写您的标题" 
thumbnail: /blog/assets/101_decision-transformers-train/thumbnail.gif
authors:
- user: your_hf_user
- user: your_coauthor
---

# 训练您的第一个决策 Transformer

您的内容在这里 [...]

文章发布后，Hub 会在博客正文的主标题之后（即以单个 # 开头的那一行，也就是 <h1> 标签）自动插入以下 UI 元素：

“发表于 [日期]”
“在 GitHub 上更新”按钮
列出的作者的头像。

5️⃣ 接下来，您可以添加文章内容。由于使用的是 Markdown 系统，如果您已经在 Notion 中编写了文本，只需按住 Ctrl+Shift+V 即可将其以 Markdown 格式粘贴过来。

6️⃣ 修改 _blog.yml 文件，以添加您的博客文章。

7️⃣ 当您的文章准备就绪时，请打开一个 Pull Request。

8️⃣ 您的文章将在 合并 Pull Request 后自动发布。

如何制作一个美观且响应式的缩略图？

1️⃣ 创建一张 1300x650 像素的图片

2️⃣ 使用此模板，并填充内容部分。

➡️ 或者选择您喜欢的背景，并按照此 Figma 模板中的说明操作。

使用 LaTeX

只需添加：

\\(your_latex_here\\)

例如：

\$ Q(S_t, A_t) \$ ➡️ $Q(S_t, A_t)$

如何为图表添加说明文字

有几种方法可供选择：

使用 Markdown 表格，就像这里。
使用 HTML，就像这里。

如何使用高亮框

请参阅此 PR 中的例子。建议谨慎使用 :)

嵌入 Space

只需添加：

<script
	type="module"
	src="https://gradio.s3-us-west-2.amazonaws.com/4.36.1/gradio.js"
></script>

<gradio-app theme_mode="light" space="derek-thomas/hugging-face-blog-assistant"></gradio-app>

代码：leaderboard-bigcodebench.md 博客示例

Hugging Face Blog 开源工具快速上手指南

本指南帮助开发者快速向 Hugging Face Blog 贡献技术文章。该仓库采用静态 Markdown 构建，合并 PR 后自动发布。

环境准备

系统要求：支持 Git 的任何操作系统（Windows, macOS, Linux）。
前置依赖：
- 已安装 Git。
- 拥有 Hugging Face 账号。
- 文本编辑器（推荐 VS Code）或支持 Markdown 的笔记工具（如 Notion）。
网络建议：由于仓库托管在 GitHub，国内用户建议配置代理或使用加速镜像克隆仓库，以确保拉取速度。

安装与分支设置

无需复杂的本地构建环境，只需克隆仓库并创建分支即可开始写作。

克隆仓库

git clone https://github.com/huggingface/blog.git
cd blog

创建开发分支 请遵循 你的名字/文章标题简写 的格式创建分支。
```
git checkout -b YourName/Title
```

基本使用流程

1. 创建文章文件

在根目录下新建一个 .md 文件。文件名必须简短且使用英文，因为它将直接作为文章的 URL 路径。

示例：若标题为 "Introduction to Deep Reinforcement Learning"，文件名为 intro-rl.md。

2. 配置文章元数据

复制以下模板到你的 .md 文件头部，并修改 title、thumbnail 和 authors 字段。

---
title: "在此填写你的文章标题" 
thumbnail: /blog/assets/101_decision-transformers-train/thumbnail.gif
authors:
- user: your_hf_user
- user: your_coauthor
---

# 在此填写文章主标题 (H1)

你的正文内容 [...]

注意：发布后，系统会自动在 H1 标题下方插入发布日期、GitHub 更新按钮及作者头像。

3. 管理图片资源

为了保持主仓库轻量，图片需分两处存放：

缩略图 (Thumbnail)：
1. 在 assets 文件夹下新建子文件夹，名称与你的 .md 文件名一致（可选加数字前缀排序，如 123_intro-rl）。
2. 仅将缩略图放入此文件夹。
3. 尺寸要求：推荐 1300x650 像素。可使用官方 SVG 模板或 Figma 模板制作。
4. 优化：务必压缩图片（推荐 TinyPNG），以提升加载速度。
正文图片：请将其他所有插图上传至独立的 HuggingFace Documentation Images 仓库，并在文章中使用绝对链接引用，避免主仓库体积膨胀。

4. 编写内容

格式：标准 Markdown。如果你使用 Notion 写作，可直接 Ctrl+Shift+V 粘贴为 Markdown。
LaTeX 公式：使用 \$ ... \$ 包裹公式。
```
\$ Q(S_t, A_t) \$
```

嵌入 Space：可嵌入 Gradio 应用。

<script
    type="module"
    src="https://gradio.s3-us-west-2.amazonaws.com/4.36.1/gradio.js"
></script>

<gradio-app theme_mode="light" space="derek-thomas/hugging-face-blog-assistant"></gradio-app>

5. 注册文章

打开根目录下的 _blog.yml 文件，添加你的新文章条目以使其出现在博客列表中。

6. 提交与发布

提交更改并推送到远程分支。

git add .
git commit -m "Add new blog post: [Your Title]"
git push origin YourName/Title

在 GitHub 上发起 Pull Request。
自动发布：当你的 PR 被合并（Merge）后，文章将自动发布到 Hugging Face Blog。

提示：如需预览效果或使用辅助工具生成复杂的表格/提示框，可使用 Community Blog Editor 或 Blog Assistant Space。

常见问题

如何在 TensorFlow 中从头开始训练语言模型？

博客或特定模型/数据集账号是否有 RSS 订阅源？

在语音识别管道中，Tokenizer、Feature Extractor、Processor 和 Decoder 之间有什么区别？

在哪里可以找到用于复现评估的配置文件或代码？

微调 Whisper 模型时，为什么需要在标签（labels）中添加 EOS token？

使用多语言 Whisper 微调时遇到关于语言检测和翻译默认行为的报错怎么办？

相似工具推荐

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85.1k|★★☆☆☆|3天前

图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。

★ 79.9k|★☆☆☆☆|4天前

语言模型数据工具其他

cs-video-courses

cs-video-courses 是一个精心整理的计算机科学视频课程清单，旨在为自学者提供系统化的学习路径。它汇集了全球知名高校（如加州大学伯克利分校、新南威尔士大学等）的完整课程录像，涵盖从编程基础、数据结构与算法，到操作系统、分布式系统、数据库等核心领域，并深入延伸至人工智能、机器学习、量子计算及区块链等前沿方向。面对网络上零散且质量参差不齐的教学资源，cs-video-courses 解决了学习者难以找到成体系、高难度大学级别课程的痛点。该项目严格筛选内容，仅收录真正的大学层级课程，排除了碎片化的简短教程或商业广告，确保用户能接触到严谨的学术内容。这份清单特别适合希望夯实计算机基础的开发者、需要补充特定领域知识的研究人员，以及渴望像在校生一样系统学习计算机科学的自学者。其独特的技术亮点在于分类极其详尽，不仅包含传统的软件工程与网络安全，还细分了生成式 AI、大语言模型、计算生物学等新兴学科，并直接链接至官方视频播放列表，让用户能一站式获取高质量的教育资源，免费享受世界顶尖大学的课堂体验。

★ 79.8k|★☆☆☆☆|4天前

其他图像数据工具

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|1周前

Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。

★ 75.4k|★★★☆☆|今天

语言模型图像开发框架

awesome-machine-learning

awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。

★ 72.1k|★☆☆☆☆|1周前

开发框架其他