awesome-video-anomaly-detection

664 104 困难 1 次阅读 4天前图像开发框架视频

AI 解读由 AI 自动生成，仅供参考

awesome-video-anomaly-detection 是一个专注于视频异常检测领域的开源资源合集，旨在为研究者和开发者提供一站式的学术导航。它系统性地整理了该方向的高质量学术论文、已公开的代码实现以及详细的性能对比数据，覆盖了从早期经典模型到 AAAI、CVPR 等顶级会议的最新研究成果。

在智能监控、交通管理等场景中，如何从海量视频里自动识别打架、车祸或违规闯入等罕见“异常”行为是一大技术难点。由于异常样本稀缺且形态多变，传统方法往往难以奏效。awesome-video-anomaly-detection 通过汇聚无监督学习、弱监督学习等多种技术路线的资源，帮助用户快速复现前沿算法，规避重复造轮子的困境，从而加速新模型的验证与迭代。

这份清单特别适合计算机视觉领域的研究人员、算法工程师以及相关专业的学生使用。其独特亮点在于不仅罗列了 UCF-Crime、ShanghaiTech 等主流数据集的下载链接，还细致地标注了基于骨骼点、开放集（Open-Set）等特定技术场景的细分资源，甚至涵盖了行车记录仪事故预测等垂直领域。无论是想要入门该领域的新手，还是寻求最新技术突破的资深专家，都能从中获得极具价值的参考指引。

使用场景

某智慧园区安防团队正试图升级监控系统，从传统的人脸识别转向自动检测打架、跌倒或非法闯入等视频异常行为。

没有 awesome-video-anomaly-detection 时

选型迷茫：面对海量的学术论文，团队难以快速筛选出适合园区场景（如拥挤人群中的突发冲突）的成熟算法，往往盲目尝试过时的模型。
数据适配困难：缺乏统一的数据集指引，团队花费数周时间清洗自有监控视频，却不知该参考 UCF-Crime 还是 ShanghaiTech 等标准数据集进行预训练。
复现成本高昂：找到的开源代码往往缺少依赖说明或无法运行，工程师需耗费大量精力调试环境，导致项目迟迟无法进入验证阶段。
性能评估缺失：由于缺乏权威的性能对比数据，团队无法判断当前模型的误报率是否达标，只能凭感觉调整参数。

使用 awesome-video-anomaly-detection 后

精准技术选型：团队直接查阅收录的最新 CVPR/AAAI 论文及代码，快速锁定了针对“弱监督学习”的先进模型，完美匹配园区标注数据少的痛点。
高效数据对接：利用列表中整理的 UCF-Crime 和 XD-Violence 等数据集链接，迅速构建了高质量的测试基准，大幅缩短了数据准备周期。
开箱即用验证：通过提供的官方代码仓库链接，团队在两天内成功复现了 SOTA（最先进）模型，并立即在园区实测视频中跑通了异常检测流程。
科学决策依据：参考清单中的性能对比数据，团队量化评估出模型在特定场景下的准确率提升空间，从而制定了合理的优化路线图。

awesome-video-anomaly-detection 将原本需要数月的调研与试错过程压缩至数天，让安防团队能专注于业务逻辑而非重复造轮子。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个视频异常检测（Video Anomaly Detection）的论文和代码合集列表，并非单一的独立软件工具。它列出了多个不同年份（2016-2022）的研究项目，每个项目都有独立的代码仓库链接和特定的环境依赖（部分基于 TensorFlow，部分基于 PyTorch）。因此，没有统一的操作系统、GPU、内存或 Python 版本要求。用户需根据具体想要运行的某篇论文对应的子项目代码库，查阅其各自的 README 以获取具体的运行环境需求。

python未说明

awesome-video-anomaly-detection hero image

快速开始

令人惊叹的视频异常检测

用于视频异常检测的论文及已发布的代码集合。

如有任何补充或错误，请提交 issue、pull request，或发送邮件至 fjchange@hotmail.com。

数据集

UMN 下载链接
UCSD 下载链接
地铁出入口 下载链接
CUHK 大道 下载链接
- HD-Avenue 基于骨架
上海理工 下载链接
- HD-ShanghaiTech 基于骨架
UCF-Crime（弱监督）
- UCFCrime2Local（UCF-Crime 的子集，但带有空间标注。）下载链接，Ano-Locality
- 空间时间标注 下载链接 背景偏置
交通-火车
Belleview
街景（WACV 2020）街景, 下载链接
IITB-走廊（WACV 2020）Rodrigurs.etl
XD-Violence（ECCV 2020）XD-Violence下载链接
ADOC（ACCV 2020）ADOC下载链接
UBnormal（CVPR 2022）[UBnormal] 项目链接 开放集

以下数据集涉及行车记录仪视频或监控视频中的交通事故预测

无监督

2022年

弱监督

2018年

[Sultani.etl] 监控视频中的真实世界异常检测, CVPR 2018 代码

2019年

[GCN-Anomaly] 图卷积标签噪声清理器：训练即插即用的动作分类器用于异常检测, CVPR 2019, 代码
[MLEP] 基于边缘学习嵌入预测的少样本视频异常检测, IJCAI 2019代码。
[IBL] 带有互补内部袋损失的时序卷积网络用于弱监督异常检测。ICIP 19。
[Motion-Aware] 运动感知特征用于改进视频异常检测。BMVC 19。

2020年

[Siamese] 使用孪生网络学习距离函数以定位视频中的异常, WACV 2020。
[AR-Net] 基于中心引导判别学习的弱监督视频异常检测, ICME 2020。代码
['XD-Violence'] 不仅要观察，还要倾听：在弱监督下学习多模态暴力检测 ECCV 2020
[CLAWS] CLAWS：利用正常性抑制的聚类辅助弱监督学习进行异常事件检测 ECCV 2020

2021年

[MIST] MIST：用于视频异常检测的多实例自训练框架 CVPR 2021 项目页面
[RTFM] 基于长短时程特征对比学习的弱监督视频异常检测 ICCV 2021代码
[STAD]监控视频中的弱监督时空异常检测 IJCAI 2021
[WSAL]从弱标签视频中定位异常TIP 2021 代码
[CRFD]学习因果时序关系和特征判别用于异常检测TIP 2021

2022年

[MSL]基于Transformer的自训练多序列学习用于弱监督视频异常检测AAAI 2022

监督学习

2019年

[Background-Bias]探索背景偏差用于监控视频中的异常检测, ACM MM 19。
[Ano-Locality]视频监控中的异常局部性。

其他

2020年

[Few-Shot]少样本场景自适应异常检测 ECCV 2020代码

综述 / 调查

基于深度学习的无监督和半监督视频异常检测方法综述，J. Image, 2018年。页面
异常检测中的深度学习：综述，论文
智能监控中的视频异常检测论文
单场景视频异常检测综述，TPAMI 2020 论文。

书籍

离群点分析。Charu C. Aggarwal

特定场景

一般来说，近年来的异常检测研究大多基于行人数据集（如UCSD、Avenue、ShanghaiTech等），或UCF-Crime（真实世界异常）。然而，也有一些研究专注于特定场景，如下所示。

交通

CVPR研讨会，AI City挑战赛系列。

第一人称交通

无监督的第一人称视频中的交通事故检测，IROS 2019。

驾驶

何时、何地、何事？用于驾驶视频异常检测的新数据集。github

老人跌倒

打斗/暴力

监控视频中基于定位引导的格斗动作检测。ICME 2019。

社会/群体异常

Social-BiGAT：使用自行车GAN和图注意力网络进行多模态轨迹预测，NeurIPS 2019。

性能评估方法

AUC
PR-AUC
分数差距
正常情况下的误报率，阈值为0.5（弱监督，由CVPR 18提出）

正如Issue #12中所讨论的，如果论文提供了“宏AUC”，则以下报告的结果将被标记为“微AUC”，并附上*。

UCF-Crime 数据集上的性能对比

模型	发表于会议/期刊	监督方式	特征	编码器类型	32段	AUC (%)	常规场景下FAR@0.5 (%)
Sultani.etl	CVPR 18	弱监督	C3D RGB	X	√	75.41	1.9
IBL	ICIP 19	弱监督	C3D RGB	X	√	78.66	-
Motion-Aware	BMVC 19	弱监督	PWC 流	X	√	79.0	-
GCN-Anomaly	CVPR 19	弱监督	TSN RGB	√	X	82.12	0.1
ST-Graph	ACM MM 20	无监督	-	√	X	72.7
Background-Bias	ACM MM 19	全监督	NLN RGB	√	X	82.0	-
CLAWS	ECCV 20	弱监督	C3D RGB	√	X	83.03	-
MIST	CVPR 21	弱监督	I3D RGB	√	X	82.30	0.13
RTFM	ICCV 21	弱监督	I3D RGB	X	√	84.03	-
WSAL	TIP 21	弱监督	I3D RGB	X	√	85.38	-
CRFD	TIP 21	弱监督	I3D RGB	X	√	84.89	-
MSL	AAAI 22	弱监督	C3D RGB	√	X	82.85	-
MSL	AAAI 22	弱监督	I3D RGB	√	X	85.30	-
MSL	AAAI 22	弱监督	VideoSwin-RGB	√	X	85.62	-
GCL	CVPR 22	弱监督	ResNext	√	X	79.84	-
GCL	CVPR 22	无监督	ResNext	√	X	71.04	-

上海科技大学数据集上的性能对比

模型	发表会议/期刊	监督方式	特征	基于编码器	AUC(%)	FAR@0.5 (%)
Conv-AE	CVPR 16	无	-	√	60.85	-
stacked-RNN	ICCV 17	无	-	√	68.0	-
FramePred	CVPR 18	无	-	√	72.8	-
FramePred*	IJCAI 19	无	-	√	73.4	-
Mem-AE	ICCV 19	无	-	√	71.2	-
MNAD	CVPR 20	无	-	√	70.5	-
VEC	ACM MM 20	无	-	√	74.8	-
ST-Graph	ACM MM 20	无	-	√	74.7	-
CAC	ACM MM 20	无	-	√	79.3
AMMC	AAAI 21	无	-	√	73.7	-
SSMT	CVPR 21	无	-	√	82.4	-
HF2-VAD	ICCV 21	无	-	√	76.2	-
ROADMAP	TNNLS 21	无	-	√	76.6	-
BDPN	AAAI 22	无	-	√	78.1	-
MLEP	IJCAI 19	10% 测试视频带有视频标注	-	√	75.6	-
MLEP	IJCAI 19	10% 测试视频带有帧级标注	-	√	76.8	-
Sultani.etl	ICME 2020	弱监督（重新组织的数据集）	C3D-RGB	X	86.3	0.15
IBL	ICME 2020	弱监督（重新组织的数据集）	I3D-RGB	X	82.5	0.10
GCN-Anomaly	CVPR 19	弱监督（重新组织的数据集）	C3D-RGB	√	76.44	-
GCN-Anomaly	CVPR 19	弱监督（重新组织的数据集）	TSN-Flow	√	84.13	-
GCN-Anomaly	CVPR 19	弱监督（重新组织的数据集）	TSN-RGB	√	84.44	-
AR-Net	ICME 20	弱监督（重新组织的数据集）	I3D-RGB & I3D Flow	X	91.24	0.10
CLAWS	ECCV 20	弱监督（重新组织的数据集）	C3D-RGB	√	89.67
MIST	CVPR 21	弱监督（重新组织的数据集）	I3D-RGB	√	94.83	0.05
RTFM	ICCV 21	弱监督（重新组织的数据集）	I3D-RGB	X	97.21	-
CRFD	TIP 21	弱监督（重新组织的数据集）	I3D-RGB	X	97.48	-
MSL	AAAI 22	弱监督（重新组织的数据集）	C3D-RGB	X	94.81	-
MSL	AAAI 22	弱监督（重新组织的数据集）	I3D-RGB	X	96.08	-
MSL	AAAI 22	弱监督（重新组织的数据集）	VideoSwin-RGB	X	97.32	-
GCL	CVPR 22	弱监督（重新组织的数据集）	ResNext	X	86.21	-
GCL	CVPR 22	无	ResNext	X	78.93	-

大道上的性能对比

模型	发表于会议/期刊	监督方式	特征	端到端	AUC(%)
Conv-AE	CVPR 16	无	-	√	70.2
Conv-AE*	CVPR 18	无	-	√	80.0
ConvLSTM-AE	ICME 17	无	-	√	77.0
DeepAppearance	ICAIP 17	无	-	√	84.6
Unmasking	ICCV 17	无	3D梯度+VGG conv5	X	80.6
stacked-RNN	ICCV 17	无	-	√	81.7
FramePred	CVPR 18	无	-	√	85.1
Mem-AE	ICCV 19	无	-	√	83.3
Appearance-Motion Correspondence	ICCV 19	无	-	√	86.9
FramePred*	IJCAI 19	无	-	√	89.2
MNAD	CVPR 20	无	-	√	88.5
VEC	ACM MM 20	无	-	√	90.2
ST-Graph	ACM MM 20	无	-	√	89.6
CAC	ACM MM 20	无	-	√	87.0
AMMC	AAAI 21	无	-	√	86.6
SSMT	CVPR 21	无	-	√	91.5
HF2-VAD	ICCV 21	无	-	√	91.1
ROADMAP	TNNLS 21	无	-	√	88.3
AEP	TNNLS 21	无	-	√	90.2
Causal	AAAI 22	无	I3D-RGB	X	90.3
BDPN	AAAI 22	无	-	√	90.3
MLEP	IJCAI 19	10%测试视频带视频标注	-	√	91.3
MLEP	IJCAI 19	10%测试视频带帧级标注	-	√	92.8

XD-Violence上的性能对比

模型	发表于会议/期刊	监督方式	特征	编码器为基础	32段	AP(%)
Sultani et al.	ECCV 2020（由Wu报道）	弱监督	I3D-RGB	X	√	73.20
Wu et al.	ECCV 2020	弱监督	C3D-RGB	X	X	67.19
Wu et al.	ECCV 2020	弱监督	I3D-RGB+音频	X	X	78.64
RTFM	ICCV 2021	弱监督	I3D-RGB	X	√	77.81
CRFD	TIP 2021	弱监督	I3D-RGB	X	√	75.90
MSL	AAAI 2022	弱监督	C3D-RGB	X	X	75.53
MSL	AAAI 2022	弱监督	I3D-RGB	X	X	78.28
MSL	AAAI 2022	弱监督	VideoSwin-RGB	X	X	78.59

awesome-video-anomaly-detection 快速上手指南

awesome-video-anomaly-detection 是一个视频异常检测（Video Anomaly Detection, VAD）领域的开源资源合集，收录了相关的学术论文、代码实现以及数据集。本指南将帮助你快速了解如何利用该仓库获取资源并运行经典模型。

环境准备

在开始之前，请确保你的开发环境满足以下基本要求。由于该仓库包含多个不同年份和架构的模型（如 Conv-AE, Mem-AE, Sultani.etl 等），具体依赖可能因模型而异，但通用环境如下：

操作系统: Linux (推荐 Ubuntu 18.04/20.04) 或 macOS。Windows 用户建议使用 WSL2。
Python: 3.6 - 3.9 (根据具体模型代码要求，较新的模型通常需要 3.8+)。
深度学习框架: PyTorch (1.7+) 或 TensorFlow (1.15/2.x)，视具体选择的模型代码库而定。
硬件: 推荐使用 NVIDIA GPU (显存建议 8GB 以上) 以加速训练和推理。
其他依赖:
- git: 用于克隆仓库。
- ffmpeg: 用于视频预处理。
- opencv-python: 用于图像读取和处理。

国内加速建议：

Git 克隆: 如果访问 GitHub 速度慢，可使用国内镜像源（如 Gitee 上的同步镜像，若有）或配置 Git 代理。

Python 包安装: 推荐使用清华源或阿里源安装依赖。

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

安装步骤

由于这是一个资源列表（Awesome List）而非单一的可执行软件，没有统一的安装命令。你需要根据需求选择具体的论文模型进行部署。以下是通用的操作流程：

1. 克隆资源列表仓库

首先获取该合集的索引信息：

git clone https://github.com/fjchange/awesome-video-anomaly-detection.git
cd awesome-video-anomaly-detection

2. 选择并克隆具体模型代码

浏览 README 中的 Unsupervised (无监督) 或 Weakly-Supervised (弱监督) 章节，找到你感兴趣的模型（例如 2019 年的经典模型 Mem-AE 或 2018 年的 Sultani.etl）。

点击对应条目中的 [Code] 链接跳转到具体代码仓库。以 Mem-AE 为例：

# 示例：克隆 Mem-AE 模型代码
git clone https://github.com/donggong1/memae-anomaly-detection.git
cd memae-anomaly-detection

3. 安装模型特定依赖

进入具体模型目录后，通常会有独立的 requirements.txt 或 setup.py。

# 创建虚拟环境 (推荐)
python -m venv venv
source venv/bin/activate  # Windows 使用: venv\Scripts\activate

# 安装依赖 (优先使用国内源)
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

4. 准备数据集

根据 README 中的 Datasets 部分下载所需数据（如 UCSD Ped2, ShanghaiTech, UCF-Crime 等）。

注意: 大部分数据集需要手动下载并解压到项目指定的目录（通常为 data/ 或 dataset/）。
示例: 对于 Mem-AE，通常需要下载 UCSD Ped2 数据集，并按照 README 指示转换为帧图像格式。

基本使用

以下以无监督学习经典模型 Mem-AE (ICCV 2019) 为例，展示最基础的训练与测试流程。其他模型的使用逻辑类似，请参考各自仓库的说明。

1. 数据预处理

大多数 VAD 模型需要将视频转换为图像帧序列。如果仓库未提供自动脚本，需手动处理：

# 示例：使用 ffmpeg 将视频拆分为帧 (假设输入视频为 test.avi)
mkdir frames
ffmpeg -i test.avi -qscale:v 2 frames/frame_%04d.jpg

2. 训练模型

在配置好数据集路径后，运行训练脚本。

# 示例命令 (具体参数请参照该模型 README)
python main.py --dataset ucfd_ped2 --mode train --gpu 0

训练完成后，模型权重通常会保存在 checkpoint/ 或 models/ 目录下。

3. 推理与异常检测

使用训练好的模型对测试视频进行检测，生成异常分数曲线或标记后的视频。

# 示例命令
python main.py --dataset ucfd_ped2 --mode test --weights checkpoint/best_model.pth --video_path data/test_videos/01.avi

4. 结果查看

输出文件: 通常会生成包含异常分数的 .txt 文件或带有可视化框的 .avi/.mp4 视频。
评估: 如果拥有标注数据，可计算 AUC (Area Under Curve) 指标来评估性能。

提示: 该仓库涵盖了从 2016 年到 2022+ 的众多算法。初学者建议从 Unsupervised -> 2019 -> Mem-AE 或 Weakly-Supervised -> 2018 -> Sultani.etl 入手，这两个模型代码成熟度较高，社区支持较好，适合快速复现和理解视频异常检测的基本原理。

常见问题

在视频异常检测中，表格中标记的“端到端（end-to-end）”具体定义是什么？

在使用 10-crop I3D 特征提取时，如何获取每个实例（instance）的标签？特别是在推理阶段没有实例级标签时如何计算 AUC？

性能对比表中的 AUC 指标是 Micro-AUC 还是 Macro-AUC？两者有何区别？

VAD 和 MIL VAD 分别代表什么？ShanghaiTech 数据集只有正常视频用于训练，MIL VAD 的结果是如何得出的？

Sultani 等方法在 ShanghaiTech 数据集上使用的特征提取器是 I3D 还是 C3D？

如何获取 Subway Entrance / Exit 数据集？官方链接似乎只提供了 Ground Truth。

该项目是否有 Colab 版本以便快速运行？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架

使用场景

没有 awesome-video-anomaly-detection 时

使用 awesome-video-anomaly-detection 后

运行环境要求

快速开始

令人惊叹的视频异常检测

最新更新

数据集

无监督

2016年

2017年

2018年

2019年

2020年

2021年

2022年

弱监督

2018年

2019年

2020年

2021年

2022年

监督学习

2019年

其他

2020年

综述 / 调查

书籍

特定场景

交通

第一人称交通

驾驶

老人跌倒

打斗/暴力

社会/群体异常

相关主题：

性能评估方法

UCF-Crime 数据集上的性能对比

上海科技大学数据集上的性能对比

大道上的性能对比

XD-Violence上的性能对比

awesome-video-anomaly-detection 快速上手指南

环境准备

安装步骤

1. 克隆资源列表仓库

2. 选择并克隆具体模型代码

3. 安装模型特定依赖

4. 准备数据集

基本使用

1. 数据预处理

2. 训练模型

3. 推理与异常检测

4. 结果查看

常见问题

相似工具推荐

stable-diffusion-webui

everything-claude-code

ComfyUI

NextChat

ML-For-Beginners

ragflow