evil-read-arxiv

GitHub
749 84 简单 1 次阅读 昨天Agent其他
AI 解读 由 AI 自动生成,仅供参考

evil-read-arxiv 是一款专为科研人员打造的 AI 论文阅读自动化助手,它巧妙结合了 Claude Code 的智能推理能力与 Obsidian 的知识管理优势,旨在将繁琐的文献调研工作流变得高效而轻松。

面对海量增长的学术论文,研究者往往耗费大量时间在搜索、筛选和整理上。evil-read-arxiv 通过调用 arXiv、Semantic Scholar 及 DBLP 等权威数据源,自动执行每日高质量论文推荐、深度内容分析及顶会论文追踪。它不仅能基于相关性、热门度和质量等多维度智能评分,还能自动生成包含摘要翻译、核心方法提炼、实验分析及优缺点评估的结构化笔记,并自动提取论文图表插入其中,最终同步至你的 Obsidian 知识库并更新关联图谱。

该工具特别适合需要紧跟前沿技术的 AI 研究人员、研究生及开发者使用。其独特亮点在于“邪修”般的高效工作流设计:从晨间的自动日报生成,到对单篇论文的深度拆解,再到针对 CVPR、ICLR 等顶级会议定向挖掘,全程无需人工干预即可产出条理清晰的研究笔记。只需简单配置,evil-read-arxiv 就能成为你专属的 24 小时科研助理,让你将宝贵精力集中于创新思考而非资料搜集。

使用场景

李博士是一名专注于大模型多模态对齐的研究员,正面临顶会截稿前的密集文献调研压力。

没有 evil-read-arxiv 时

  • 信息过载与筛选低效:每天需手动刷新 arXiv 和 Semantic Scholar,在数百篇新论文中肉眼筛选,耗时 2 小时却常漏掉关键成果。
  • 笔记整理碎片化:阅读单篇论文需手动翻译摘要、截图保存图表、打字记录核心观点,一篇深度笔记耗时 45 分钟以上。
  • 知识关联断裂:新旧论文间的逻辑关系靠大脑记忆或手动链接,难以快速构建领域知识图谱,写作综述时思路经常卡壳。
  • 顶会追踪滞后:CVPR、ICLR 等会议论文发布分散,缺乏统一渠道监控,往往等到别人引用才知道错过了重要工作。

使用 evil-read-arxiv 后

  • 智能推荐零延迟start-my-day 技能每日自动推送基于相关性、热度评分的精选列表,早晨 8 点即可获取今日必读的前三篇高质论文。
  • 深度分析自动化:运行 paper-analyze 后,自动生成包含中文摘要、架构解析、实验对比的结构化笔记,并直接插入高清架构图,单篇处理缩短至 5 分钟。
  • 知识图谱自生长:工具自动提取关键词并链接到 Obsidian 既有笔记,实时更新研究脉络,让李博士在写作时能一键追溯技术演进路线。
  • 顶会监控全覆盖:通过 conf-papers 技能定制 CVPR/ICLR 等会议监控,双数据源过滤噪音,确保第一时间掌握最新 SOTA 方法。

evil-read-arxiv 将李博士从繁琐的“搬运工”角色中解放出来,使其能将 90% 的精力真正投入到创新思考与实验设计中。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

未说明

依赖
notes需要安装并配置 Claude Code CLI;需设置 OBSIDIAN_VAULT_PATH 环境变量指向 Obsidian 仓库路径;依赖 arXiv、Semantic Scholar 和 DBLP API 进行数据检索;主要功能为自动化脚本调用而非本地大模型推理,因此无明确 GPU 和高内存需求。
python3.8+
PyMuPDF
evil-read-arxiv hero image

快速开始

evil-read-arxiv

邪修的论文阅读工作流 - 自动化论文搜索、推荐、分析和整理

语言 / Language

简介

这是一套 Claude Code 技能(Skills)集合,用于自动化研究论文的搜索、推荐、分析和整理工作流。通过调用 arXiv 和 Semantic Scholar API,每天为你推荐高质量论文,并自动生成详细笔记和关系图谱。

更新日志

日期 版本 更新内容
2026-03-13 v1.1 新增 conf-papers 技能:支持搜索 CVPR/ICCV/ECCV/ICLR/AAAI/NeurIPS/ICML 等顶级会议论文,基于 DBLP + Semantic Scholar 双数据源,独立配置文件,三维评分推荐
2026-03-01 v1.0 初始版本:start-my-day 每日推荐、paper-analyze 论文分析、extract-paper-images 图片提取、paper-search 论文搜索

功能特点

1. start-my-day - 每日论文推荐

  • 从 arXiv 搜索最近一个月的论文
  • 从 Semantic Scholar 搜索过去一年的高热度论文
  • 基于相关性、新近性、热门度、质量四个维度综合评分
  • 自动生成今日概览和推荐列表
  • 前三篇论文自动生成详细分析和提取图片
  • 自动链接关键词到已有笔记

2. paper-analyze - 论文深度分析

  • 深度分析单篇论文
  • 生成结构化笔记,包含:
    • 摘要翻译和要点提炼
    • 研究背景与动机
    • 方法概述和架构
    • 实验结果分析
    • 研究价值评估
    • 优势和局限性分析
    • 与相关论文对比
  • 自动提取论文图片并插入笔记
  • 更新知识图谱

3. extract-paper-images - 论文图片提取

  • 优先从 arXiv 源码包提取高质量图片
  • 支持从 PDF 提取图片作为备选
  • 自动生成图片索引
  • 保存到笔记目录的 images 子目录

4. paper-search - 论文笔记搜索

  • 在已有笔记中搜索论文
  • 支持按标题、作者、关键词、领域搜索
  • 相关性评分排序

5. conf-papers - 顶会论文搜索推荐

  • 搜索 CVPR/ICCV/ECCV/ICLR/AAAI/NeurIPS/ICML 等顶级会议论文
  • 基于 DBLP API 获取论文列表 + Semantic Scholar 补充引用和摘要
  • 独立配置文件 conf-papers.yaml(关键词、排除词、默认年份/会议)
  • 两阶段过滤:标题关键词轻量筛选 → S2 补充 → 三维评分(相关性 40% + 热门度 40% + 质量 20%)
  • 前三篇论文自动生成详细分析(需有 arXiv ID)

安装

前置要求

  1. Claude Code CLI - 需要安装并配置 Claude Code
  2. Python 3.8+ - 用于运行搜索和分析脚本
  3. 依赖库
    pip install -r requirements.txt
    

安装步骤

  1. 将此仓库克隆或复制到你的 Claude Code skills 目录:

    # Windows PowerShell
    Copy-Item -Recurse evil-read-arxiv\start-my-day $env:USERPROFILE\.claude\skills\
    Copy-Item -Recurse evil-read-arxiv\paper-analyze $env:USERPROFILE\.claude\skills\
    Copy-Item -Recurse evil-read-arxiv\extract-paper-images $env:USERPROFILE\.claude\skills\
    Copy-Item -Recurse evil-read-arxiv\paper-search $env:USERPROFILE\.claude\skills\
    
    # macOS/Linux
    cp -r evil-read-arxiv/start-my-day ~/.claude/skills/
    cp -r evil-read-arxiv/paper-analyze ~/.claude/skills/
    cp -r evil-read-arxiv/extract-paper-images ~/.claude/skills/
    cp -r evil-read-arxiv/paper-search ~/.claude/skills/
    
  2. 配置环境变量和路径(见下文"配置"部分)

  3. 重启 Claude Code CLI

配置

强烈建议:先阅读 QUICKSTART.md 快速完成设置。

步骤1:设置环境变量(推荐)

所有脚本统一通过 OBSIDIAN_VAULT_PATH 环境变量读取 Obsidian Vault 路径,这是最简单的配置方式:

# Windows PowerShell(临时生效)
$env:OBSIDIAN_VAULT_PATH = "C:/Users/YourName/Documents/Obsidian Vault"

# Windows PowerShell(永久生效)
[System.Environment]::SetEnvironmentVariable("OBSIDIAN_VAULT_PATH", "C:/Users/YourName/Documents/Obsidian Vault", "User")

# macOS/Linux(添加到 ~/.bashrc 或 ~/.zshrc)
export OBSIDIAN_VAULT_PATH="/Users/yourname/Documents/Obsidian Vault"

设置环境变量后,无需修改任何脚本中的路径

步骤2:创建配置文件

复制 config.example.yaml 并修改:

cp config.example.yaml config.yaml

编辑 config.yaml,根据你的研究兴趣修改关键词:

vault_path: "/path/to/your/obsidian/vault"

research_domains:
  "你的研究领域1":
    keywords:
      - "keyword1"
      - "keyword2"
    arxiv_categories:
      - "cs.AI"
      - "cs.LG"

然后将修改后的 config.yaml 复制到 Vault 中:

cp config.yaml "$OBSIDIAN_VAULT_PATH/99_System/Config/research_interests.yaml"

步骤3(可选):通过 CLI 参数覆盖路径

如果不想设置环境变量,也可以在每次调用脚本时通过参数指定路径:

python scripts/search_arxiv.py --config "/your/path/research_interests.yaml"
python scripts/scan_existing_notes.py --vault "/your/obsidian/vault"
python scripts/generate_note.py --vault "/your/obsidian/vault" --paper-id "2402.12345" --title "Paper Title" --authors "Author" --domain "大模型"
python scripts/update_graph.py --vault "/your/obsidian/vault" --paper-id "2402.12345" --title "Paper Title" --domain "大模型"

路径格式说明

  • Windows:可以使用正斜杠 / 或双反斜杠 \\

    • 正确:C:/Users/Name/Documents/Vault
    • 正确:C:\\Users\\Name\\Documents\\Vault
    • 错误:C:\Users\Name\Documents\Vault(单反斜杠在 Python 字符串中需要转义)
  • macOS/Linux:使用正斜杠 /

    • 正确:/Users/name/Documents/Vault

Obsidian 目录结构要求

你的 Obsidian Vault 需要包含以下目录结构:

你的Vault/
├── 10_Daily/                    # 每日推荐笔记(自动创建)
│   └── YYYY-MM-DD论文推荐.md
├── 20_Research/
│   └── Papers/                  # 论文详细笔记目录
│       ├── 大模型/
│       │   └── 论文标题.md
│       │       └── images/      # 论文图片
│       ├── 多模态技术/
│       └── 智能体/
└── 99_System/
    └── Config/
        └── research_interests.yaml  # 研究兴趣配置(复制 config.yaml 到这里)

使用方法

开始每天的论文推荐

在你的 Obsidian Vault 目录下打开终端,输入:

start my day

这会:

  1. 搜索最近一个月和过去一年的高质量论文
  2. 根据你的研究兴趣筛选和评分
  3. 生成今日推荐笔记(保存到 10_Daily/ 目录)
  4. 对前三篇论文自动生成详细分析
  5. 提取论文图片并插入笔记
  6. 自动链接关键词到已有笔记

分析单篇论文

如果你想深入阅读某篇论文:

paper-analyze 2602.12345
# 或使用论文标题
paper-analyze "论文标题"

这会:

  1. 下载论文 PDF
  2. 提取图片
  3. 生成详细的分析笔记
  4. 更新知识图谱

提取论文图片

extract-paper-images 2602.12345

搜索已有论文

paper-search "关键词"

目录结构

evil-read-arxiv/
├── README.md                 # 本文件
├── QUICKSTART.md             # 快速开始指南
├── config.example.yaml       # 配置模板(需要复制并修改)
├── requirements.txt          # Python 依赖
├── start-my-day/             # 每日推荐技能
│   ├── SKILL.md              # 技能定义文件
│   └── scripts/
│       ├── search_arxiv.py   # arXiv/Semantic Scholar 搜索脚本
│       ├── scan_existing_notes.py  # 扫描现有笔记
│       └── link_keywords.py  # 关键词自动链接脚本
├── paper-analyze/            # 论文分析技能
│   ├── SKILL.md
│   └── scripts/
│       ├── generate_note.py  # 生成笔记模板
│       └── update_graph.py   # 更新知识图谱
├── extract-paper-images/     # 图片提取技能
│   ├── SKILL.md
│   └── scripts/
│       └── extract_images.py # 图片提取脚本
├── paper-search/             # 论文搜索技能
│   └── SKILL.md
└── conf-papers/              # 顶会论文搜索推荐技能
    ├── SKILL.md              # 技能定义文件
    ├── conf-papers.yaml      # 独立配置(关键词、会议、年份)
    └── scripts/
        └── search_conf_papers.py  # DBLP搜索 + S2补充 + 评分

常用 arXiv 分类

分类代码 名称 说明
cs.AI Artificial Intelligence 人工智能
cs.LG Learning 机器学习
cs.CL Computation and Language 计算语言学/NLP
cs.CV Computer Vision 计算机视觉
cs.MM Multimedia 多媒体
cs.MA Multiagent Systems 多智能体系统
cs.RO Robotics 机器人学

常见问题

Q: 搜索没有结果?

A: 检查以下几点:

  1. 确认网络连接正常
  2. 检查配置文件中的关键词是否正确
  3. 尝试扩大搜索的 arXiv 分类范围

Q: 图片提取失败?

A:

  1. 确保安装了 PyMuPDF:pip install PyMuPDF
  2. 检查 arXiv ID 格式是否正确(如 2602.12345)

Q: 关键词自动链接不准确?

A: 可以在 start-my-day/scripts/link_keywords.py 中修改 COMMON_WORDS 集合,添加你不需要自动链接的词

Q: "Papers directory not found" 错误?

A:

  1. 检查 OBSIDIAN_VAULT_PATH 环境变量是否正确设置
  2. 确认 Obsidian Vault 中的目录结构是否正确创建(20_Research/Papers/)

问:“未指定 vault 路径”错误?

答:设置 OBSIDIAN_VAULT_PATH 环境变量,或在调用脚本时通过 --vault / --config 参数指定路径。

高级配置

修改搜索的 arXiv 分类

在调用 search_arxiv.py 时通过 --categories 参数指定:

python scripts/search_arxiv.py --categories "cs.AI,cs.LG,cs.CL,cs.CV"

修改每天推荐的论文数量

在调用 search_arxiv.py 时通过 --top-n 参数指定:

python scripts/search_arxiv.py --top-n 15

修改评分权重

start-my-day/scripts/search_arxiv.pycalculate_recommendation_score 函数中调整权重。

工作原理

用户输入 "start my day"
         ↓
    1. 加载研究配置
    2. 扫描现有笔记构建索引
         ↓
    3. 搜索 arXiv(最近30天)
    4. 搜索 Semantic Scholar(过去一年高热度)
         ↓
    5. 合并结果并去重
    6. 综合评分并排序
    7. 取前 N 篇
         ↓
    8. 生成今日推荐笔记
    9. 前三篇生成详细分析
    10. 自动链接关键词

订阅

欢迎提交 Issue 和 Pull Request!

如果你觉得这个项目对你有帮助,请给个 Star ⭐️ 支持一下!

Star History Chart

许可证

MIT 许可证

致谢

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来,转换成计算机可读取的结构化数据,让机器真正“看懂”图文内容。 面对海量纸质或电子文档,PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域,它扮演着连接图像与大型语言模型(LLM)的桥梁角色,能将视觉信息直接转化为文本输入,助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显:不仅支持全球 100 多种语言的识别,还能在 Windows、Linux、macOS 等多个系统上运行,并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目,PaddleOCR 既能满足快速集成的需求,也能支撑前沿的视觉语言研究,是处理文字识别任务的理想选择。

74.9k|★★★☆☆|今天
语言模型图像开发框架