EEG-DL

GitHub
1.2k 233 中等 1 次阅读 1周前MIT数据工具语言模型开发框架图像
AI 解读 由 AI 自动生成,仅供参考

EEG-DL 是一个基于 TensorFlow 构建的深度学习库,专为脑电图(EEG)信号分类任务而设计。它致力于解决科研人员在处理复杂脑电数据时,从零搭建和复现前沿深度学习模型耗时费力的痛点,提供了一套标准化、开箱即用的解决方案。

这款工具非常适合从事脑机接口研究的研究人员、神经科学领域的开发者以及希望快速验证算法效果的学生使用。用户无需深入纠结于底层代码实现,即可直接调用库中集成的多种先进网络架构进行实验。

EEG-DL 的核心亮点在于其丰富的模型支持。它不仅涵盖了基础的全连接神经网络(DNN)和卷积神经网络(CNN),还集成了残差网络(ResNet)、密集连接网络(DenseNet)、全卷积网络(FCN)以及用于小样本学习的孪生网络等主流深度学习架构。这些模型均针对 EEG 信号特性进行了适配,并附带相关论文引用,方便用户追踪学术前沿。通过 EEG-DL,用户可以更高效地探索不同算法在脑电解码任务中的表现,加速从理论构思到实验验证的研发进程。

使用场景

某神经工程实验室的研究团队正致力于开发一套基于脑电信号(EEG)的瘫痪患者意念控制轮椅系统,核心任务是从嘈杂的脑电数据中高精度分类出“左转”、“右转”和“前进”等运动想象指令。

没有 EEG-DL 时

  • 算法复现成本极高:研究人员需手动从零编写 CNN、ResNet 或 DenseNet 等复杂深度学习模型的 TensorFlow 代码,耗费数周时间调试网络层级与参数。
  • 特征提取依赖人工:缺乏针对脑电时序特性的专用预处理模块,团队需花费大量精力手工设计频带特征,且难以捕捉深层时空关联。
  • 模型对比困难:每尝试一种新架构(如从普通 CNN 切换到残差网络)都需重构整个训练流程,导致无法快速验证哪种模型最适合当前的脑电数据集。
  • 实验结果不稳定:由于缺乏统一的标准化接口,不同成员编写的代码在数据加载和评估指标上存在差异,导致实验结果难以复现和横向对比。

使用 EEG-DL 后

  • 即插即用主流模型:直接调用库中预置的 DNN、CNN、ResNet 及 Thin ResNet 等七种前沿模型接口,将算法部署时间从数周缩短至几小时。
  • 端到端自动特征学习:利用内置的深度卷积架构自动从原始脑电信号中提取高维时空特征,显著减少了对人工经验设计特征的依赖。
  • 高效架构筛选:通过统一的 API 快速切换并并行测试多种网络结构,迅速锁定针对该特定轮椅控制任务准确率最高的 Thin ResNet 模型。
  • 标准化实验流程:依托库内规范的数据处理与评估模块,确保了不同模型间的公平对比,大幅提升了科研数据的可信度与复现性。

EEG-DL 通过提供标准化的脑电深度学习工具箱,将研究人员从繁琐的代码工程中解放出来,使其能专注于脑机接口算法的核心创新与临床落地。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该库基于较旧的 TensorFlow 1.13.1 版本。注意:虽然主模型支持 Python 3.x,但将原始 .edf 文件转换为 Matlab .m 文件的预处理脚本必须在 Python 2.7 环境下运行,否则会导致标签错误。评估指标默认针对四分类任务,若需二分类或三分类需手动修改代码。
python3.x (数据预处理脚本 Extract-Raw-Data-Into-Matlab-Files.py 需在 Python 2.7 环境下运行)
TensorFlow==1.13.1
Matlab (用于数据预处理)
R language (用于配对 t 检验)
EEG-DL hero image

快速开始



Chat on Gitter Python Version TensorFlow Version MIT License


欢迎来到脑电深度学习库

EEG-DL 是一个基于 TensorFlow 的深度学习(DL)库,专门用于脑电信号分类任务。它提供了最新的深度学习算法,并会持续更新。

目录

文档

支持的模型包括

序号 模型 代码
1 深度神经网络 DNN
2 卷积神经网络 [论文] [教程] CNN
3 深度残差卷积神经网络 [论文] ResNet
4 瘦型残差卷积神经网络 [论文] Thin ResNet
5 密集连接卷积神经网络 [论文] DenseNet
6 全卷积神经网络 [论文] FCN
7 基于暹罗网络(以CNN为骨干)的单样本学习
[论文] [教程]
暹罗网络
8 图卷积神经网络
[论文] [演示文稿]
GCN / 图卷积神经网络
9 深度残差图卷积神经网络 [论文] ResGCN
10 密集连接图卷积神经网络 DenseGCN
11 基于变分推断的贝叶斯卷积神经网络 [论文] 贝叶斯CNN
12 循环神经网络 [论文] RNN
13 基于注意力机制的循环神经网络 [论文] 带注意力机制的RNN
14 双向循环神经网络 [论文] BiRNN
15 基于注意力机制的双向循环神经网络 [论文] 带注意力机制的BiRNN
16 长短期记忆网络 [论文] LSTM
17 基于注意力机制的长短期记忆网络 [论文] 带注意力机制的LSTM
18 双向长短期记忆网络 [论文] BiLSTM
19 基于注意力机制的双向长短期记忆网络 [论文] 带注意力机制的BiLSTM
20 门控循环单元 [论文] GRU
21 基于注意力机制的门控循环单元 [论文] 带注意力机制的GRU
22 双向门控循环单元 [论文] BiGRU
23 基于注意力机制的双向门控循环单元 [论文] 带注意力机制的BiGRU
24 基于注意力机制的BiLSTM + GCN [论文] 基于注意力机制的BiLSTM
GCN
25 Transformer [论文] [论文] Transformer
26 基于Transformer的迁移学习
(此代码仅作参考!)
(您可以根据自己的数据修改代码。)
第一阶段:预训练
第二阶段:微调

目前支持一个脑电波运动想象(MI)基准数据集。更多关于脑电或BCI领域的基准数据集,请参见这里

序号 数据集 教程
1 EEG运动/意念数据集 教程

评估标准包括:

评估指标 教程
混淆矩阵 教程
准确率 / 精确率 / 召回率 / F1分数 / 克帕系数 教程
接收者操作特征(ROC)曲线 / 曲线下面积(AUC) -
使用R语言进行配对t检验 教程

这些评估指标主要适用于*四分类问题。如果您希望切换到二分类或三分类问题,请修改此文件,以适应您个人数据集的类别数量。同时,有关评估指标的详细信息可在这篇论文中找到。*

使用演示

  1. (在任何Python环境中) 通过此脚本下载EEG运动/意念数据集

    $ python MIND_Get_EDF.py
    
  2. (在Python 2.7环境中) 使用此脚本读取.edf文件(一种原始EEG信号格式),并将其保存为Matlab .m文件。请注意,该脚本必须在**Python 2环境(推荐Python 2.7)**下运行,因为其中包含一些Python 2特有的语法。如果使用Python 3环境运行此文件,虽然可能不会报错,但EEG任务标签将会完全混乱。

    $ python Extract-Raw-Data-Into-Matlab-Files.py
    
  3. 使用Matlab对数据集进行预处理,并根据不同的模型将数据保存为Excel文件(training_set、training_label、test_set和test_label)。请注意,Excel文件中的每一行代表一个样本,而列则可视为特征,例如4096列意味着64个通道×64个时间点。后续模型会将这4096列重塑为形状为64通道×64时间点的矩阵。您可以根据自身需求调整列数,例如您的实际数据集维度。

  4. (前提条件) 在**Python 3.6环境(强烈推荐)**下训练和测试用于EEG信号/任务分类的深度学习模型,可通过EEG-DL库实现,该库提供了多种SOTA深度学习模型。

    Python版本:Python 3.6(推荐)
    TensorFlow版本:TensorFlow 1.13.1
    

    使用以下命令安装TensorFlow GPU版本1.13.1:

    $ pip install --upgrade --force-reinstall tensorflow-gpu==1.13.1 --user
    
  5. 通过TensorBoard读取评估指标(通过迭代)。您可以参考此教程。当您完成模型训练后,会在文件夹中找到“events.out.tfevents.***”文件,例如“/Users/shuyuej/Desktop/trained_model/”。您可以在终端中使用以下命令:

    $ tensorboard --logdir="/Users/shuyuej/Desktop/trained_model/" --host=127.0.0.1
    

    建议使用Google Chrome打开网页:

    http://127.0.0.1:6006/
    

    这样您就可以读取并把评估指标保存为Excel .csv文件。

  6. 最后,使用Matlab或Python绘制精美的论文图表。请参考这些脚本

注意事项

  1. 我已在macOS系统上测试了所有Python和Matlab文件。需要注意的是,某些Matlab函数在Windows操作系统和macOS之间存在差异。例如,在macOS中我使用“readmatrix”函数来读取CSV文件,而在Windows中则需要使用“csvread”函数,因为Windows系统中没有“readmatrix”函数。如果您遇到类似问题,建议通过Google或百度搜索解决,通常可以顺利找到解决方案。

  2. 对于GCNs-Net(GCN模型),图卷积层不会改变图的维度,而最大池化层会将图的维度减半。也就是说,如果初始图拉普拉斯矩阵是N×N的,经过最大池化层后,其维度将变为N/2×N/2。对于15通道的EEG系统,除非选择14→7、12→6→3、10→5、8→4→2→1等降维方式,否则无法应用最大池化操作。具体细节可参考这篇论文

  3. 损失函数可以从此文件中更改或修改。

  4. 数据加载器可以从此文件中更改或修改。

研究思路

  1. 动态图卷积神经网络 [论文综述]

  2. 神经架构搜索 / AutoML(自动机器学习)[清华 AutoGraph]

  3. 强化学习算法(如深度Q学习)[清华天授] [中文文档]

  4. 贝叶斯卷积神经网络 [论文] [学位论文] [代码]

  5. Transformer / 自注意力机制 / 非局部建模 [Transformer 代码] [非局部建模 PyTorch 代码]

    [为什么使用非局部建模?] [论文] [详细报告] [幻灯片] [海报]

常见问题

  1. ValueError: Cannot feed value of shape (1024, 1) for Tensor 'input/label:0', which has shape '(1024,)'

    解决此问题的方法是使用 np.squeeze 将标签的形状从 (1024, 1) 压缩为 (1024,)。请编辑 DataLoader.py 文件。 原始代码:

    train_labels = pd.read_csv(DIR + 'training_label.csv', header=None)
    train_labels = np.array(train_labels).astype('float32')
    
    test_labels = pd.read_csv(DIR + 'test_label.csv', header=None)
    test_labels = np.array(test_labels).astype('float32')
    

    修改后:

    train_labels = pd.read_csv(DIR + 'training_label.csv', header=None)
    train_labels = np.array(train_labels).astype('float32')
    train_labels = np.squeeze(train_labels)
    
    test_labels = pd.read_csv(DIR + 'test_label.csv', header=None)
    test_labels = np.array(test_labels).astype('float32')
    test_labels = np.squeeze(test_labels)
    
  2. InvalidArgumentError: Nan in summary histogram for training/logits/bias/gradients

    解决此问题的方法是注释掉所有的直方图摘要。请编辑 GCN_Model.py 文件

    # 注释掉 GCN_Model.py 文件中的上述 tf.summary.histogram
    
    # # 直方图。
    # for grad, var in grads:
    #     if grad is None:
    #         print('warning: {} has no gradient'.format(var.op.name))
    #     else:
    #         tf.summary.histogram(var.op.name + '/gradients', grad)
    
    def _weight_variable(self, shape, regularization=True):
        initial = tf.truncated_normal_initializer(0, 0.1)
        var = tf.get_variable('weights', shape, tf.float32, initializer=initial)
        if regularization:
            self.regularizers.append(tf.nn.l2_loss(var))
        # tf.summary.histogram(var.op.name, var)
        return var
    
    def _bias_variable(self, shape, regularization=True):
        initial = tf.constant_initializer(0.1)
        var = tf.get_variable('bias', shape, tf.float32, initializer=initial)
        if regularization:
            self.regularizers.append(tf.nn.l2_loss(var))
        # tf.summary.histogram(var.op.name, var)
        return var
    
  3. TypeError: len() of unsized object

    解决此问题的方法是根据自己的需求调整粗化级别,也可以尝试更改以观察效果。请编辑 main-GCN.py 文件。例如,如果要将 GCNs-Net 应用于 10 通道 EEG 系统,则需将“levels”设置为 1 或 0,因为最多只进行一次最大池化(10 --> 5)。可以通过将参数“level”改为 1 或 0 来观察差异。

    # 这是粗化级别,可以根据需要调整以观察不同效果
    graphs, perm = coarsening.coarsen(Adjacency_Matrix, levels=5, self_connections=False)
    

    修改为:

    # 这是粗化级别,可以根据需要调整以观察不同效果
    graphs, perm = coarsening.coarsen(Adjacency_Matrix, levels=1, self_connections=False)
    
  4. tensorflow.python.framework.errors_impl.InvalidArgumentError: Received a label value of 7 which is outside the valid range of [0, 7). Label values: 5 2 3 3 1 5 5 4 7 4 2 2 1 7 5 6 3 4 2 4

    解决此问题的方法是:对于 GCNs-Net,在制作数据集时,标签应从 0 开始,而不是从 1 开始。例如,如果有七类,标签应为 0(第一类)、1(第二类)、2(第三类)、3(第四类)、4(第五类)、5(第六类)、6(第七类),而不是 1、2、3、4、5、6、7。

  5. IndexError: list index out of range

    解决此问题的方法是首先仔细检查你的 Python 环境。必须使用 Python 2.7 环境。 此外,请安装 pyEDFlib0.1.11 版本。安装指令如下:

    $ pip install pyEDFlib==0.1.11
    

代码结构

在项目的根目录下,您会看到:

├── Download_Raw_EEG_Data
│   ├── Extract-Raw-Data-Into-Matlab-Files.py
│   ├── MIND_Get_EDF.py
│   ├── README.md
│   └── electrode_positions.txt
├── Draw_Photos
│   ├── Draw_Accuracy_Photo.m
│   ├── Draw_Box_Photo.m
│   ├── Draw_Confusion_Matrix.py
│   ├── Draw_Loss_Photo.m
│   ├── Draw_ROC_and_AUC.py
│   └── figure_boxplot.m
├── LICENSE
├── Logo.png
├── MANIFEST.in
├── Models
│   ├── DatasetAPI
│   │   └── DataLoader.py
│   ├── Evaluation_Metrics
│   │   └── Metrics.py
│   ├── Initialize_Variables
│   │   └── Initialize.py
│   ├── Loss_Function
│   │   └── Loss.py
│   ├── Network
│   │   ├── BiGRU.py
│   │   ├── BiGRU_with_Attention.py
│   │   ├── BiLSTM.py
│   │   ├── BiLSTM_with_Attention.py
│   │   ├── BiRNN.py
│   │   ├── BiRNN_with_Attention.py
│   │   ├── CNN.py
│   │   ├── DNN.py
│   │   ├── DenseCNN.py
│   │   ├── Fully_Conv_CNN.py
│   │   ├── GRU.py
│   │   ├── GRU_with_Attention.py
│   │   ├── LSTM.py
│   │   ├── LSTM_with_Attention.py
│   │   ├── RNN.py
│   │   ├── RNN_with_Attention.py
│   │   ├── ResCNN.py
│   │   ├── Siamese_Network.py
│   │   ├── Thin_ResNet.py
│   │   └── lib_for_GCN
│   │       ├── DenseGCN_Model.py
│   │       ├── GCN_Model.py
│   │       ├── ResGCN_Model.py
│   │       ├── coarsening.py
│   │       └── graph.py
│   ├── __init__.py
│   ├── main-BiGRU-with-Attention.py
│   ├── main-BiGRU.py
│   ├── main-BiLSTM-with-Attention.py
│   ├── main-BiLSTM.py
│   ├── main-BiRNN-with-Attention.py
│   ├── main-BiRNN.py
│   ├── main-CNN.py
│   ├── main-DNN.py
│   ├── main-DenseCNN.py
│   ├── main-DenseGCN.py
│   ├── main-FullyConvCNN.py
│   ├── main-GCN.py
│   ├── main-GRU-with-Attention.py
│   ├── main-GRU.py
│   ├── main-LSTM-with-Attention.py
│   ├── main-LSTM.py
│   ├── main-RNN-with-Attention.py
│   ├── main-RNN.py
│   ├── main-ResCNN.py
│   ├── main-ResGCN.py
│   ├── main-Siamese-Network.py
│   └── main-Thin-ResNet.py
├── NEEPU.png
├── Preprocess_EEG_Data
│   ├── For-CNN-based-Models
│   │   └── make_dataset.m
│   ├── For-DNN-based-Models
│   │   └── make_dataset.m
│   ├── For-GCN-based-Models
│   │   └── make_dataset.m
│   ├── For-RNN-based-Models
│   │   └── make_dataset.m
│   └── For-Siamese-Network-One-Shot-Learning
│       └── make_dataset.m
├── README.md
├── Saved_Files
│   └── README.md
├── requirements.txt
└── setup.py

引用

如果您觉得我们的库有用,请在您的出版物中引用我们的论文。我们在此提供 BibTeX 格式的引用条目。

@article{hou2022gcn,
	title   = {{GCNs-Net}: 一种用于解码时间分辨脑电图运动想象信号的图卷积神经网络方法},
        author  = {侯一民、贾淑悦、伦祥敏、郝子谦、史燕、李阳、曾睿、吕景磊},
	journal = {IEEE 神经网络与学习系统汇刊},
	volume  = {},
	number  = {},
	pages   = {1-12},
	year    = {2022年9月},
	doi     = {10.1109/TNNLS.2022.3202569}
}
  
@article{hou2020novel,
	title     = {一种通过 Scout ESI 和 CNN 解码四类脑电图运动想象任务的新方法},
	author    = {侯一民、周璐、贾淑悦、伦祥敏},
	journal   = {神经工程学杂志},
	volume    = {17},
	number    = {1},
	pages     = {016048},
	year      = {2020年2月},
	publisher = {IOP 出版社},
	doi       = {10.1088/1741-2552/ab4af6}
	
}

@article{hou2022deep,
	title   = {基于注意力机制的双向长短时记忆图卷积神经网络在人类运动想象识别中的深度特征挖掘},
	author  = {侯一民、贾淑悦、伦祥敏、张舒、陈涛、王芳、吕景磊},   
	journal = {生物工程与生物技术前沿},      
	volume  = {9},      
	year    = {2022年2月},      
	url     = {https://www.frontiersin.org/article/10.3389/fbioe.2021.706229},       
	doi     = {10.3389/fbioe.2021.706229},      
	ISSN    = {2296-4185}
}

@article{Jia2020AttentionGCN,
	title   = {基于注意力机制的图 ResNet 用于从原始脑电信号中检测运动意图},
	author  = {贾淑悦、侯一民、伦祥敏、吕景磊},
	journal = {arXiv 预印本 arXiv:2007.13484},
	year    = {2022年}
}

我们的论文可以从以下链接下载:

  1. 一种通过 Scout ESI 和 CNN 解码四类脑电图运动想象任务的新方法
    该工作的代码和教程可以在这里找到:GitHub 仓库.

整体框架

Project1

提出的 CNN 架构

Project1

  1. GCNs-Net:一种用于解码时间分辨脑电图运动想象信号的图卷积神经网络方法
    **该工作的演示文稿可以在这里找到:PDF 文件.
Project2

  1. 基于注意力机制的 BiLSTM-GCN 在人类运动想象识别中的深度特征挖掘
    **该工作的演示文稿可以在这里找到:PDF 文件.
Project3.1
Project4.1

  1. 基于注意力机制的图 ResNet 用于从原始脑电信号中检测运动意图

其他实用资源

我认为以下演示文稿在大家开始使用 Python 和 TensorFlow 时会很有帮助。

  1. Python 环境搭建教程 下载

  2. 云服务器的使用及搭建教程 下载

  3. 深度学习中的 TensorFlow 教程 下载

贡献

我们始终欢迎各位的贡献,以帮助 EEG-DL 库变得更好。如果您希望参与贡献或有任何问题,请随时通过电子邮件 shuyuej@ieee.org 与我联系。

组织机构

该库由贾书悦在侯义敏教授的指导下创建并开源,地点为中国吉林省吉林市东北电力大学自动化工程学院。

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|1周前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|1周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

152.6k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|3天前
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|3天前
插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|6天前
插件开发框架