[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-Zleap-AI--SAG":3,"tool-Zleap-AI--SAG":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",140436,2,"2026-04-05T23:32:43",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":76,"owner_avatar_url":77,"owner_bio":78,"owner_company":79,"owner_location":79,"owner_email":79,"owner_twitter":79,"owner_website":80,"owner_url":81,"languages":82,"stars":112,"forks":113,"last_commit_at":114,"license":115,"difficulty_score":10,"env_os":116,"env_gpu":117,"env_ram":118,"env_deps":119,"category_tags":128,"github_topics":129,"view_count":23,"oss_zip_url":79,"oss_zip_packed_at":79,"status":16,"created_at":145,"updated_at":146,"faqs":147,"releases":148},4089,"Zleap-AI\u002FSAG","SAG","SAG - SQL驱动的RAG引擎 · 查询时自动构建知识图谱 | SQL-Driven RAG Engine · Automatically Build Knowledge Graph During Querying","SAG 是一款基于 SQL 驱动的新一代 RAG（检索增强生成）引擎，旨在让机器在不依赖庞大预建图谱的前提下，真正“理解”并关联海量文本数据。它核心解决了传统 RAG 检索精度有限、而现有 GraphRAG 方案维护成本高昂且扩展性差的痛点。\n\n与传统方案不同，SAG 无需预先构建和维护静态知识图谱。它能将原始文档自动拆解为“语义原子事件”，并在用户发起查询的瞬间，动态构建关系网络。通过结合 SQL 精确检索、向量语义搜索与 PageRank 算法，SAG 实现了“召回 - 扩展 - 重排序”的三阶段精准搜索，确保每个回答不仅准确，还能完整追溯信息来源与关联链路。\n\n这款工具非常适合希望部署私有化、可审计知识中台的企业技术团队，也适合寻求高效、易定制本地 RAG 方案的普通开发者。同时，对于深入研究 GraphRAG 或“检索 + 知识图谱”算法的研究人员，SAG 提供的事件中心型动态建图机制也极具参考价值。无论是个人知识管理、团队协作文档梳理，还是复杂的科研文献分析，SAG 都能以低维护成本提供高精度的智能问答支持。","\u003Cdiv align=\"center\">\n\n\n# 🌟 SAG\n\n**SQL驱动的RAG引擎 · 查询时自动构建知识图谱**\n\n*The SQL-Driven Smart Auto Graph Engine*\n\n[![zread](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FAsk_Zread-_.svg?style=flat-square&color=00b0aa&labelColor=000000&logo=data%3Aimage%2Fsvg%2Bxml%3Bbase64%2CPHN2ZyB3aWR0aD0iMTYiIGhlaWdodD0iMTYiIHZpZXdCb3g9IjAgMCAxNiAxNiIgZmlsbD0ibm9uZSIgeG1sbnM9Imh0dHA6Ly93d3cudzMub3JnLzIwMDAvc3ZnIj4KPHBhdGggZD0iTTQuOTYxNTYgMS42MDAxSDIuMjQxNTZDMS44ODgxIDEuNjAwMSAxLjYwMTU2IDEuODg2NjQgMS42MDE1NiAyLjI0MDFWNC45NjAxQzEuNjAxNTYgNS4zMTM1NiAxLjg4ODEgNS42MDAxIDIuMjQxNTYgNS42MDAxSDQuOTYxNTZDNS4zMTUwMiA1LjYwMDEgNS42MDE1NiA1LjMxMzU2IDUuNjAxNTYgNC45NjAxVjIuMjQwMUM1LjYwMTU2IDEuODg2NjQgNS4zMTUwMiAxLjYwMDEgNC45NjE1NiAxLjYwMDFaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik00Ljk2MTU2IDEwLjM5OTlIMi4yNDE1NkMxLjg4ODEgMTAuMzk5OSAxLjYwMTU2IDEwLjY4NjQgMS42MDE1NiAxMS4wMzk5VjEzLjc1OTlDMS42MDE1NiAxNC4xMTM0IDEuODg4MSAxNC4zOTk5IDIuMjQxNTYgMTQuMzk5OUg0Ljk2MTU2QzUuMzE1MDIgMTQuMzk5OSA1LjYwMTU2IDE0LjExMzQgNS42MDE1NiAxMy43NTk5VjExLjAzOTlDNS42MDE1NiAxMC42ODY0IDUuMzE1MDIgMTAuMzk5OSA0Ljk2MTU2IDEwLjM5OTlaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik0xMy43NTg0IDEuNjAwMUgxMS4wMzg0QzEwLjY4NSAxLjYwMDEgMTAuMzk4NCAxLjg4NjY0IDEwLjM5ODQgMi4yNDAxVjQuOTYwMUMxMC4zOTg0IDUuMzEzNTYgMTAuNjg1IDUuNjAwMSAxMS4wMzg0IDUuNjAwMUgxMy43NTg0QzE0LjExMTkgNS42MDAxIDE0LjM5ODQgNS4zMTM1NiAxNC4zOTg0IDQuOTYwMVYyLjI0MDFDMTQuMzk4NCAxLjg4NjY0IDE0LjExMTkgMS42MDAxIDEzLjc1ODQgMS42MDAxWiIgZmlsbD0iI2ZmZiIvPgo8cGF0aCBkPSJNNCAxMkwxMiA0TDQgMTJaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik00IDEyTDEyIDQiIHN0cm9rZT0iI2ZmZiIgc3Ryb2tlLXdpZHRoPSIxLjUiIHN0cm9rZS1saW5lY2FwPSJyb3VuZCIvPgo8L3N2Zz4K&logoColor=ffffff)](https:\u002F\u002Fzread.ai\u002FZleap-AI\u002FSAG)\n[![Python](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPython-3.11+-3776AB?style=flat-square&logo=python&logoColor=white)](https:\u002F\u002Fwww.python.org)\n[![FastAPI](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FFastAPI-Latest-009688?style=flat-square&logo=fastapi&logoColor=white)](https:\u002F\u002Ffastapi.tiangolo.com)\n[![Next.js](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FNext.js-14-black?style=flat-square&logo=next.js&logoColor=white)](https:\u002F\u002Fnextjs.org)\n[![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-Apache%202.0-blue?style=flat-square)](LICENSE)\n[![PRs Welcome](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPRs-welcome-brightgreen?style=flat-square)](CONTRIBUTING.md)\n\n**by [Zleap.AI](https:\u002F\u002Fzleap.ai)** · Open Source · Production Ready\n\n\u003Ca href=\"README_en.md\">English\u003C\u002Fa> | \u003Ca href=\"README.md\">中文\u003C\u002Fa>\n\n\u003C\u002Fdiv>\n\n---\n\n\nhttps:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002Fe03567a5-2cc4-4d09-aab9-01277d8d4457\n\n\n---\n\n## 🌟 SAG 是什么？\n\n> [入门版原理介绍](https:\u002F\u002Fmp.weixin.qq.com\u002Fs\u002FdmrLphM3bLBC2Nj1xsfdHg)\n\n**SAG**是SQL驱动的新一代 RAG 引擎，可以在查询时自动构建知识图谱\n\n  - 把原始文本自动拆解成“**语义原子事件**”  \n  - 为每个事件抽取多维“**自然语言向量（多维度实体）**”  \n  - 在 **查询时动态构建关系网络**，而不是预先维护知识图谱\n\n### 核心能力\n\n- **自动理解**：AI自动将文档拆解为原子性的事件\n- **智能关联**：检索时动态构建关系网络，无需预先维护图谱\n- **精准召回**：三阶段搜索（Recall → Expand → Rerank），找到最相关的信息\n- **完整溯源**：每个结果都能追溯来源和关联链路\n- **灵活扩展**：支持自定义实体类型，适配任何业务场景\n\n### 适合谁？\n  - 👨‍💻 **普通开发者**：想要一个好用、易部署、可定制的本地 \u002F 企业 RAG 引擎  \n  - 🏢 **企业技术团队**：需要可审计、可控、私有化部署的知识中台  \n  - 🧑‍🔬 **研究人员**：对 GraphRAG \u002F RAG+KG 感兴趣，想深入算法与数学分析\n\n---\n\n## 💡 应用场景\n\nSAG 最初来源于一个核心问题：**如何在不维护庞大知识图谱的前提下，让机器真正“理解”和“关联”海量文本？**\n\n- **从产品视角**：一个可以托管你所有文档、对话、业务数据的“**数据智能引擎**”  \n- **从技术视角**：一种 **Event-Centric 的动态知识图谱构建算法**，在查询时按需生成图结构  \n- **从实现视角**：组合 **SQL 精确检索 + 向量语义搜索 + PageRank** 的三阶段搜索系统\n\n\n\u003Ctable>\n\u003Ctr>\n\u003Ctd width=\"33%\">\n\n\n#### 📚 个人知识管理\n\n```\n痛点：\n• 笔记分散，难以查找\n• 信息孤岛，关联性差\n• 手动整理费时费力\n\n解决：\n✓ 自动拆分知识卡片\n✓ 智能标注实体关系\n✓ 秒级多维度检索\n```\n\n\u003C\u002Ftd>\n\u003Ctd width=\"33%\">\n\n#### 👥 团队协作文档\n\n```\n痛点：\n• 版本混乱，信息冗余\n• 决策分散，难以追溯\n• 新人上手成本高\n\n解决：\n✓ 自动提取决策点\n✓ 追踪信息演进\n✓ 快速生成报告\n```\n\n\u003C\u002Ftd>\n\u003Ctd width=\"33%\">\n\n#### 🔬 研究分析助手\n\n```\n痛点：\n• 文献量大，难抽重点\n• 手动标注耗时长\n• 关系发现靠直觉\n\n解决：\n✓ 自动提取论点\n✓ 构建主题网络\n✓ 发现隐含关联\n```\n\n\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003C\u002Ftable>\n\n\n### 与传统方案对比\n\n|              | 传统RAG  | GraphRAG | SAG      |\n| ------------ | -------- | -------- | -------- |\n| **数据组织** | 固定切块 | 预构建图 | 事件化   |\n| **关系维护** | 无       | 静态存储 | 动态计算 |\n| **扩展性**   | ⭐⭐       | ⭐⭐⭐      | ⭐⭐⭐⭐⭐    |\n| **维护成本** | 低       | 高       | 低       |\n| **检索精度** | ⭐⭐       | ⭐⭐⭐⭐     | ⭐⭐⭐⭐⭐    |\n| **适用场景** | 简单问答 | 深度问答 | 全场景   |\n\n---\n\n## 🎯 核心特性\n\n### 1. 系统架构一览\n\n\nSAG 的系统设计直接对应其算法设计：**存储时“事件化”，查询时“图谱化”**。\n\n```text\n┌─────────────────────────────────────────────┐\n│                Data Processing 数据处理     │\n│  LOAD   ─→   EXTRACT   ─→   INDEX          │\n│  加载        事件提取        索引（向量+SQL）│\n└────────────────────┬───────────────────────┘\n                     │\n                     ▼\n┌─────────────────────────────────────────────┐\n│                Storage 存储层              │\n│  • MySQL: 事件 \u002F 实体 \u002F 事件-实体关系      │\n│  • Elasticsearch \u002F VecDB: 向量检索         │\n└────────────────────┬───────────────────────┘\n                     │\n                     ▼\n┌─────────────────────────────────────────────┐\n│               Search 检索层                │\n│  Recall  ─→  Expand  ─→  Rerank            │\n│  实体召回      多跳扩展      智能排序       │\n└─────────────────────────────────────────────┘\n```\n\n### 2. 灵活的实体维度系统\n\n**系统默认（5W1H）**：\n\n| 维度       | 含义 | 权重 | 示例                              |\n| ---------- | ---- | ---- | --------------------------------- |\n| 🕐 TIME     | 时间 | 0.9  | \"2024年6月\", \"每周一\", \"昨天下午\" |\n| 📍 LOCATION | 地点 | 1.0  | \"会议室A\", \"北京\", \"线上群聊\"     |\n| 👤 PERSON   | 人员 | 1.1  | \"张三\", \"产品经理\", \"客户\"        |\n| 🎯 TOPIC    | 话题 | 1.5  | \"大模型优化\", \"项目延期\"          |\n| ⚡ ACTION   | 行为 | 1.2  | \"决定\", \"完成\", \"优化\"            |\n| 🏷️ TAGS     | 标签 | 1.0  | \"技术\", \"紧急\", \"待跟进\"          |\n\n**自定义扩展**：\n\n```python\n# 项目管理场景\ncustom_entities = [\n    EntityType(type=\"project_stage\", name=\"项目阶段\", weight=1.2),\n    EntityType(type=\"risk_level\", name=\"风险等级\", weight=1.3)\n]\n\n# 医疗场景\ncustom_entities = [\n    EntityType(type=\"symptom\", name=\"症状\", weight=1.4),\n    EntityType(type=\"diagnosis\", name=\"诊断\", weight=1.5)\n]\n```\n\n### 3. 三阶段智能搜索\n\n```\n阶段1: Recall - 实体召回\n├─ LLM理解查询意图\n├─ 提取结构化实体\n├─ 向量检索相关实体\n└─ 定位关联事件\n    \n阶段2: Expand - 多跳扩展\n├─ 从初始事件出发\n├─ 通过共同实体发现关联\n├─ BFS多跳探索（深度可配）\n└─ 构建完整关系网络\n    \n阶段3: Rerank - 智能排序\n├─ PageRank计算重要性\n├─ 综合：实体权重+时间+相似度\n├─ 方向性权重（重要事件权重大）\n└─ 返回Top-N + 线索链\n```\n\n**可解释性示例**：\n\n```json\n{\n  \"event\": \"MoE架构的稀疏专家层设计\",\n  \"score\": 0.89,\n  \"clues\": [\n    {\n      \"stage\": \"recall\",\n      \"from\": \"Query: 大模型优化\",\n      \"to\": \"Entity: MoE架构\",\n      \"confidence\": 0.92\n    },\n    {\n      \"stage\": \"expand\", \n      \"from\": \"Event: MoE架构优势\",\n      \"to\": \"Event: 稀疏专家层设计\",\n      \"shared_entities\": [\"MoE架构\", \"专家层\"],\n      \"confidence\": 0.85\n    }\n  ]\n}\n```\n\n---\n\n## 🚀 快速开始\n\n### 方式一：Docker Compose（推荐）\n\n```bash\n# 1. 克隆项目\ngit clone https:\u002F\u002Fgithub.com\u002FZleap-AI\u002FSAG.git\ncd SAG\n\n# 2. 配置环境\ncp .env.example .env\n# 编辑 .env：\n#   LLM_API_KEY=sk-xxx\n#   MYSQL_PASSWORD=your_password\n\n# 3. 下载资源 （首次执行）\npython scripts\u002Fdownload_nltk_data.py\n\n# 4. 启动服务\ndocker compose up -d\n\n# 5. 访问\n# 前端: http:\u002F\u002Flocalhost\n# API: http:\u002F\u002Flocalhost\u002Fapi\u002Fdocs\n```\n\n### 方式二：Python SDK\n\n```python\nimport asyncio\nfrom sag import SAGEngine\nfrom sag.modules.load.config import LoadBaseConfig\nfrom sag.modules.extract.config import ExtractBaseConfig\nfrom sag.modules.search.config import SearchBaseConfig\n\nasync def main():\n    # 初始化\n    engine = SAGEngine(source_config_id=\"my-project\")\n    \n    # 加载文档\n    await engine.load(LoadBaseConfig(\n        type=\"path\",\n        origin=[\".\u002Fdocs\u002Farticle.md\"],\n        background=\"技术文档\"\n    ))\n    \n    # 提取事件\n    await engine.extract(ExtractBaseConfig(\n        parallel=True,\n        background=\"AI大模型文档\"\n    ))\n    \n    # 智能检索\n    result = await engine.search(SearchBaseConfig(\n        query=\"如何优化大模型推理速度？\",\n        depth=2,\n        top_k=10\n    ))\n    \n    # 查看结果\n    for event in result.events:\n        print(f\"[{event.score:.2f}] {event.title}\")\n        print(f\"  {event.summary}\\n\")\n\nasyncio.run(main())\n```\n\n### 方式三：Web界面\n\n访问 http:\u002F\u002Flocalhost:3000\n\n1. **上传文档**：拖拽 Markdown、PDF、HTML\n2. **自动处理**：系统自动加载→提取→索引\n3. **智能搜索**：输入自然语言查询\n4. **查看结果**：浏览事件、线索图谱、来源\n\n\n\n---\n\n## 🌐 开源版 vs 完整版\n\n### 功能对比\n\n| 功能         | 开源基础版 | [完整版](https:\u002F\u002Fzleap.ai) |\n| ------------ | ---------- | -------------------------- |\n| **核心引擎** | ✅ 完整开源 | ✅ 相同引擎                 |\n| **文档加载** | ✅ 本地文件 | ✅ 多种信息源               |\n| **数据源**   | ✅ 手动上传 | ✅ 自动更新                 |\n| **内容发布** | ❌          | ✅ 一键生成文章\u002F报告        |\n| **协作**     | ❌ 单用户   | ✅ 团队 + 权限管理          |\n| **高级功能** | ❌          | ✅ 智能推荐 + 自动摘要      |\n| **云服务**   | ❌ 需自建   | ✅ 开箱即用                 |\n| **支持**     | 社区       | 专业技术团队               |\n\n### 为什么开源基础版？\n\n我们相信：\n\n- 🌍 **技术共享**：核心算法应该被更多人使用和改进\n- 🔧 **灵活部署**：企业可自建私有化部署\n- 🤝 **社区驱动**：开源社区的反馈让产品更好\n- 💡 **创新激励**：开发者可基于SAG构建自己的应用\n\n### 什么时候用完整版？\n\n- 需要自动网页追踪和信息流管理\n- 想接入更多信息源\n- 需要团队协作和权限管理\n- 希望零部署，开箱即用\n- 需要专业技术支持\n\n**体验完整版**：[https:\u002F\u002Fzleap.ai](https:\u002F\u002Fzleap.ai)\n\n\n\n---\n## 📖 深入学习\n\n>这一节是给对算法细节感兴趣的开发者和研究人员的简版说明。\n\n### 🧠 核心理念：Event & Natural Language Vector\nSAG 的底层思想可以用两句话概括：\n\n- **事件原子化（Event Atomization）**  \n  *不再按字符\u002FToken 长度“机械切块”，而是将文档转化为一个个 **语义完整、彼此独立** 的“事件 (Event)”。*\n- **自然语言向量（Natural Language Vector）**  \n  *不只把整段文本编码成向量，而是为每个 Event 抽取多维实体：时间、地点、人物、动作、话题、标签…  \n  它们组成了一个“**由自然语言实体构成的向量**”。*\n\n**关键洞察**：  \n- Event 是 **原子知识单元**  \n- Entity 是 **事件的实体维度**  \n- 事件之间的关系不提前计算，而是 **在查询时动态计算**\n\n### 🧮 三阶段搜索算法（Recall → Expand → Rerank）\n\n\n### 1. Recall：实体驱动召回（Entity-Based Recall）\n\n**目标**：从查询语句出发，找到一批高度相关的 **实体 + 事件**。\n\n- **步骤概要**：\n  - **LLM 解析查询**：抽取结构化实体（TOPIC、ACTION、PERSON…）\n  - **向量检索实体**：在实体向量空间中搜索  \n  - **用实体查事件（SQL）**：通过实体 ID 反查事件  \n  - **事件向量检索**：直接在 Event 向量上查  \n  - **交集过滤 + 权重反向传播**：兼顾语义相似度与实体匹配\n\n\n\n### 2. Expand：基于 BFS 的多跳扩展\n\n**目标**：通过“共享实体模式”在事件-实体空间做 **多跳搜索**，找到更深层的相关信息。\n\n- **做法**：\n  - 将高权重实体视作当前“前沿层”  \n  - 用这些实体在 SQL 中查找新事件  \n  - 对新事件计算相似度和权重，并将权重反向传播给新实体  \n  - 只保留“新出现”的实体，形成下一跳前沿层  \n  - 过程中带有 **权重衰减** + **去重**，无新实体时自动收敛\n\n- **特性**：\n  - 与“六度空间理论”类似：任意两个事件，往往可以通过少量中间实体连接  \n  - 深度 2 通常在 **精度 \u002F 召回 \u002F 延迟** 上达到最优平衡\n  \n- **实体权重示意公式**：\n\n$$W(k_i) = \\sum_{e_j \\in E} \\left[ W_{e2}(e_j) \\times \\frac{count(k_i, e_j)}{\\ln(1 + step_{ij})} \\right]$$\n\n### 3. Rerank：基于方向性 PageRank 的排序\n\n在 Recall + Expand 得到的事件子图上，SAG 构建隐式图并运行 **加权 PageRank**：\n\n- **节点**：事件 `e`  \n- **有向边**：共享实体关系，边权由实体权重 + 频次决定：\n\n$$\nW(e_i \\rightarrow e_j) = \\sum_{k \\in (e_i \\cap e_j)} W_{\\text{entity}}(k) \\cdot \\ln(1 + \\text{freq}(k, e_j))\n$$\n\n- **PageRank 迭代**：\n\n$$\n\\mathrm{PR}(e_j) = \\frac{1-d}{N} + d \\sum_{e_i \\in \\mathrm{In}(e_j)} \\mathrm{PR}(e_i) \\cdot \\frac{W(e_i \\rightarrow e_j)}{\\sum\\limits_k W(e_i \\rightarrow e_k)}\n$$\n\n- **最终综合评分**（四因子加权）：\n\n$$\nS(e) = \\alpha \\cdot \\mathrm{PR}(e) + \\beta \\cdot \\mathrm{Sim}(Q, e) + \\gamma \\cdot \\mathrm{EntityScore}(e) + \\delta \\cdot \\mathrm{TimeDecay}(e)\n$$\n\n其中典型配置：α=0.4，β=0.3，γ=0.2，δ=0.1。\n\n---\n\n\n## 🤝 社区与贡献\n\n### 加入我们\n\n- 🌐 官网：[https:\u002F\u002Fzleap.ai](https:\u002F\u002Fzleap.ai)\n- 💬 Discord：[加入讨论](https:\u002F\u002Fdiscord.com\u002Finvite\u002FDRCmtBJhyN)\n- 📧 邮箱：contact@zleap.ai\n- 🐦 Twitter：[@ZleapAI](https:\u002F\u002Fx.com\u002Fzleapai)\n\n### 如何贡献\n\n```bash\n# 1. Fork并克隆\ngit clone https:\u002F\u002Fgithub.com\u002Fyour-name\u002FSAG.git\n\n# 2. 创建分支\ngit checkout -b feature\u002Famazing-feature\n\n# 3. 提交更改\ngit commit -m \"feat: add amazing feature\"\n\n# 4. 推送\ngit push origin feature\u002Famazing-feature\n\n# 5. 开启 Pull Request\n```\n\n**Commit规范**：`feat:` | `fix:` | `docs:` | `refactor:` | `test:` | `chore:`\n\n### 贡献者墙\n\n\n\n\n---\n\n## 🙏 致谢\n\n- 感谢所有贡献者\n- 特别感谢[302.AI](https:\u002F\u002F302.ai)的算力支持\n\n---\n\n## 📄 许可证\n\n\n本项目采用 [Apache-2.0 License](LICENSE)\n\n---\n\n## ⭐ Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FZleap-AI_SAG_readme_d1284fdc384b.png)](https:\u002F\u002Fstar-history.com\u002F#Zleap-AI\u002FSAG&Date)\n\n---\n\n\u003Cdiv align=\"center\">\n\n\n**让信息产生连接，让数据成为资产**\n\nMade with ❤️ by [Zleap Team](https:\u002F\u002Fzleap.ai)\n\n\u003C\u002Fdiv>\n\n---\n","\u003Cdiv align=\"center\">\n\n\n# 🌟 SAG\n\n**SQL驱动的RAG引擎 · 查询时自动构建知识图谱**\n\n*The SQL-Driven Smart Auto Graph Engine*\n\n[![zread](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FAsk_Zread-_.svg?style=flat-square&color=00b0aa&labelColor=000000&logo=data%3Aimage%2Fsvg%2Bxml%3Bbase64%2CPHN2ZyB3aWR0aD0iMTYiIGhlaWdodD0iMTYiIHZpZXdCb3g9IjAgMCAxNiAxNiIgZmlsbD0ibm9uZSIgeG1sbnM9Imh0dHA6Ly93d3cudzMub3JnLzIwMDAvc3ZnIj4KPHBhdGggZD0iTTQuOTYxNTYgMS42MDAxSDIuMjQxNTZDMS44ODgxIDEuNjAwMSAxLjYwMTU2IDEuODg2NjQgMS42MDE1NiAyLjI0MDFWNC45NjAxQzEuNjAxNTYgNS4zMTM1NiAxLjg4ODEgNS42MDAxIDIuMjQxNTYgNS42MDAxSDQuOTYxNTZDNS5zMTUwMiA1LjYwMDEgNS42MDE1NiA1LjMxMzU2IDUuNjAxNTYgNC45NjAxVjIuMjQwMUM1LjYwMTU2IDEuODg2NjQgNS5zMTUwMiAxLjYwMDEgNC45NjE1NiAxLjYwMDFaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik00Ljk2MTU2IDEwLjM5OTlIMi4yNDE1NkMxLjg4ODEgMTAuMzk5OSAxLjYwMTU2IDEwLjY4NjQgMS42MDE1NiAxMS4wMzk5VjEzLjc1OTlDMS42MDE1NiAxNC4xMTM0IDEuODg4MSAxNC4zOTk5IDIuMjQxNTYgMTQuMzk5OUH0NC45NjE1NiM1LjMxNTUwMiAxNC4zOTk5OSA1LjYwMTU2IDEzLjc1OTlVjExLjAzOTlDNS5YjYwMTU2IDEwLjYODY0IDUuMzE1MDIgMTAuMzk5OSA0Ljk6156iIDEwLjM9999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999999......\u003Cdiv align=\"center\">\n\n\n# 🌟 SAG\n\n**SQL驱动的RAG引擎 · 查询时自动构建知识图谱**\n\n*The SQL-Driven Smart Auto Graph Engine*\n\n[![zread](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FAsk_Zread-_.svg?style=flat-square&color=00b0aa&labelColor=000000&logo=data%3Aimage%2Fsvg%2Bxml%3Bbase64%2CPHN2ZyB3aWR0aD0iMTYiIGhlaWdodD0iMTYiIHZpZXdCb3g9IjAgMCAxNiAxNiIgZmlsbD0ibm9uZSIgeG1sbnM9Imh0dHA6Ly93d3cudzMub3JnLzIwMDAvc3ZnIj4KPHBhdGggZD0iTTQuOTYxNTYgMS42MDAxSDIuMjQxNTZDMS44ODgxIDEuNjAwMSAxLjYwMTU2IDEuODg2NjQgMS42MDE1NiAyLjI0MDFWNC45NjAxQzEuNjAxNTYgNS4zMTM1NiAxLjg4ODEgNS42MDAxIDIuMjQxNTYgNS42MDAxSDQuOTYxNTZDNS5zMTUwMiA1LjYwMDEgNS42MDE1NiA1LjMxMzU2IDUuNjAxNTYgNC45NjAxVjIuMjQwMUM1LjYwMTU2IDEuODg2NjQgNS5zMTUwMiAxLjYwMDEgNC45NjE1NiAxLjYwMDFaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik00Ljk2MTU2IDEwLjM5OTlIMi4yNDE1NkMxLjg4ODEgMTAuMzk5OSAxLjYwMTU2IDEwLjY4NjQgMS42MDE1NiAxMS4wMzk5VjEzLjc1OTlDMS42MDE1NiAxNC4xMTM0IDEuODg4MSAxNC4zOTk5IDIuMjQxNTYgMTQuMzk5OUH0NC45NjE1NiM1LjMxNTUwMiAxNC4zOTk5OSA1LjYwMTU2IDEzLjc1OTlVjExLjAzOTlDNS5YjYwMTU2IDEwLjYODY0IDUuMzE1MDIgMTAuMzk5OSA0Ljk6YjE1NiAxMC4zOTOTLaIiBmaWxsPSIjZmZmIi8%2BCjxwYXRoIGQ9Ik0xMy43NTg0IDEuNjAwMUgxMS.0M384C10.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.685IDE.68......\n\n### 方法二：Python SDK\n\n```python\nimport asyncio\nfrom sag import SAGEngine\nfrom sag.modules.load.config import LoadBaseConfig\nfrom sag.modules.extract.config import ExtractBaseConfig\nfrom sag.modules.search.config import SearchBaseConfig\n\nasync def main():\n    # 初始化\n    engine = SAGEngine(source_config_id=\"my-project\")\n    \n    # 加载文档\n    await engine.load(LoadBaseConfig(\n        type=\"path\",\n        origin=[\".\u002Fdocs\u002Farticle.md\"],\n        background=\"技术文档\"\n    ))\n    \n    # 提取事件\n    await engine.extract(ExtractBaseConfig(\n        parallel=True,\n        background=\"AI大模型文档\"\n    ))\n    \n    # 智能检索\n    result = await engine.search(SearchBaseConfig(\n        query=\"如何优化大模型推理速度？\",\n        depth=2,\n        top_k=10\n    ))\n    \n    # 查看结果\n    for event in result.events:\n        print(f\"[{event.score:.2f}] {event.title}\")\n        print(f\"  {event.summary}\\n\")\n\nasyncio.run(main())\n```\n\n### 方法三：Web界面\n\n访问 http:\u002F\u002Flocalhost:3000\n\n1. **上传文档**：拖拽 Markdown、PDF、HTML\n2. **自动处理**：系统自动加载→提取→索引\n3. **智能搜索**：输入自然语言查询\n4. **查看结果**：浏览事件、线索图谱、来源\n\n\n\n---\n\n## 🌐 开源版 vs 完整版\n\n### 功能对比\n\n| 功能         | 开源基础版 | [完整版](https:\u002F\u002Fzleap.ai) |\n| ------------ | ---------- | -------------------------- |\n| **核心引擎** | ✅ 完整开源 | ✅ 相同引擎                 |\n| **文档加载** | ✅ 本地文件 | ✅ 多种信息源               |\n| **数据源**   | ✅ 手动上传 | ✅ 自动更新                 |\n| **内容发布** | ❌          | ✅ 一键生成文章\u002F报告        |\n| **协作**     | ❌ 单用户   | ✅ 团队 + 权限管理          |\n| **高级功能** | ❌          | ✅ 智能推荐 + 自动摘要      |\n| **云服务**   | ❌ 需自建   | ✅ 开箱即用                 |\n| **支持**     | 社区       | 专业技术团队               |\n\n### 为什么开源基础版？\n\n我们相信：\n\n- 🌍 **技术共享**：核心算法应该被更多人使用和改进\n- 🔧 **灵活部署**：企业可自建私有化部署\n- 🤝 **社区驱动**：开源社区的反馈让产品更好\n- 💡 **创新激励**：开发者可基于SAG构建自己的应用\n\n### 什么时候用完整版？\n\n- 需要自动网页追踪和信息流管理\n- 想接入更多信息源\n- 需要团队协作和权限管理\n- 希望零部署，开箱即用\n- 需要专业技术支持\n\n**体验完整版**：[https:\u002F\u002Fzleap.ai](https:\u002F\u002Fzleap.ai)\n\n\n\n---\n## 📖 深入学习\n\n>这一节是给对算法细节感兴趣的开发者和研究人员的简版说明。\n\n### 🧠 核心理念：Event & Natural Language Vector\nSAG 的底层思想可以用两句话概括：\n\n- **事件原子化（Event Atomization）**  \n  *不再按字符\u002FToken 长度“机械切块”，而是将文档转化为一个个 **语义完整、彼此独立** 的“事件 (Event)”。*\n- **自然语言向量（Natural Language Vector）**  \n  *不只把整段文本编码成向量，而是为每个 Event 抽取多维实体：时间、地点、人物、动作、话题、标签…  \n  它们组成了一个“**由自然语言实体构成的向量**”。*\n\n**关键洞察**：  \n- Event 是 **原子知识单元**  \n- Entity 是 **事件的实体维度**  \n- 事件之间的关系不提前计算，而是 **在查询时动态计算**\n\n### 🧮 三阶段搜索算法（Recall → Expand → Rerank）\n\n\n### 1. Recall：实体驱动召回（Entity-Based Recall）\n\n**目标**：从查询语句出发，找到一批高度相关的 **实体 + 事件**。\n\n- **步骤概要**：\n  - **LLM 解析查询**：抽取结构化实体（TOPIC、ACTION、PERSON…）\n  - **向量检索实体**：在实体向量空间中搜索  \n  - **用实体查事件（SQL）**：通过实体 ID 反查事件  \n  - **事件向量检索**：直接在 Event 向量上查  \n  - **交集过滤 + 权重反向传播**：兼顾语义相似度与实体匹配\n\n\n\n### 2. Expand：基于 BFS 的多跳扩展\n\n**目标**：通过“共享实体模式”在事件-实体空间做 **多跳搜索**，找到更深层的相关信息。\n\n- **做法**：\n  - 将高权重实体视作当前“前沿层”  \n  - 用这些实体在 SQL 中查找新事件  \n  - 对新事件计算相似度和权重，并将权重反向传播给新实体  \n  - 只保留“新出现”的实体，形成下一跳前沿层  \n  - 过程中带有 **权重衰减** + **去重**，无新实体时自动收敛\n\n- **特性**：\n  - 与“六度空间理论”类似：任意两个事件，往往可以通过少量中间实体连接  \n  - 深度 2 通常在 **精度 \u002F 召回 \u002F 延迟** 上达到最优平衡\n  \n- **实体权重示意公式**：\n\n$$W(k_i) = \\sum_{e_j \\in E} \\left[ W_{e2}(e_j) \\times \\frac{count(k_i, e_j)}{\\ln(1 + step_{ij})} \\right]$$\n\n### 3. Rerank：基于方向性 PageRank 的排序\n\n在 Recall + Expand 得到的事件子图上，SAG 构建隐式图并运行 **加权 PageRank**：\n\n- **节点**：事件 `e`  \n- **有向边**：共享实体关系，边权由实体权重 + 频次决定：\n\n$$\nW(e_i \\rightarrow e_j) = \\sum_{k \\in (e_i \\cap e_j)} W_{\\text{entity}}(k) \\cdot \\ln(1 + \\text{freq}(k, e_j))\n$$\n\n- **PageRank 迭代**：\n\n$$\n\\mathrm{PR}(e_j) = \\frac{1-d}{N} + d \\sum_{e_i \\in \\mathrm{In}(e_j)} \\mathrm{PR}(e_i) \\cdot \\frac{W(e_i \\rightarrow e_j)}{\\sum\\limits_k W(e_i \\rightarrow e_k)}\n$$\n\n- **最终综合评分**（四因子加权）：\n\n$$\nS(e) = \\alpha \\cdot \\mathrm{PR}(e) + \\beta \\cdot \\mathrm{Sim}(Q, e) + γ \\cdot \\mathrm{EntityScore}(e) + δ \\cdot \\mathrm{TimeDecay}(e)\n$$\n\n其中典型配置：α=0.4，β=0.3，γ=0.2，δ=0.1。\n\n---\n\n\n## 🤝 社区与贡献\n\n### 加入我们\n\n- 🌐 官网：[https:\u002F\u002Fzleap.ai](https:\u002F\u002Fzleap.ai)\n- 💬 Discord：[加入讨论](https:\u002F\u002Fdiscord.com\u002Finvite\u002FDRCmtBJhyN)\n- 📧 邮箱：contact@zleap.ai\n- 🐦 Twitter：[@ZleapAI](https:\u002F\u002Fx.com\u002Fzleapai)\n\n### 如何贡献\n\n```bash\n# 1. Fork并克隆\ngit clone https:\u002F\u002Fgithub.com\u002Fyour-name\u002FSAG.git\n\n# 2. 创建分支\ngit checkout -b feature\u002Famazing-feature\n\n# 3. 提交更改\ngit commit -m \"feat: add amazing feature\"\n\n# 4. 推送\ngit push origin feature\u002Famazing-feature\n\n# 5. 开启 Pull Request\n```\n\n**Commit规范**：`feat:` | `fix:` | `docs:` | `refactor:` | `test:` | `chore:`\n\n### 贡献者墙\n\n\n\n\n---\n\n## 🙏 致谢\n\n- 感谢所有贡献者\n- 特别感谢[302.AI](https:\u002F\u002F302.ai)的算力支持\n\n---\n\n## 📄 许可证\n\n\n本项目采用 [Apache-2.0 License](LICENSE)\n\n---\n\n## ⭐ Star History\n\n[![Star History Chart](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FZleap-AI_SAG_readme_d1284fdc384b.png)](https:\u002F\u002Fstar-history.com\u002F#Zleap-AI\u002FSAG&Date)\n\n---\n\n\u003Cdiv align=\"center\">\n\n\n**让信息产生连接，让数据成为资产**\n\nMade with ❤️ by [Zleap Team](https:\u002F\u002Fzleap.ai)\n\n\u003C\u002Fdiv>\n\n---","# SAG 快速上手指南\n\nSAG 是一款 SQL 驱动的新一代 RAG 引擎，能够在查询时自动构建知识图谱，实现从“机械切块”到“语义事件”的跨越。本指南将帮助开发者在几分钟内完成本地部署并体验核心功能。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Linux \u002F macOS \u002F Windows (需安装 WSL2 或 Docker Desktop)\n*   **Docker & Docker Compose**：版本 20.10+ (推荐使用 Docker Desktop 一键安装)\n*   **Python**：3.11 或更高版本 (仅用于运行辅助脚本，核心服务运行在容器中)\n*   **网络环境**：需要能够访问 HuggingFace 或 NLTK 数据源 (若下载缓慢，建议配置国内镜像或使用代理)\n*   **LLM API Key**：准备一个可用的大模型 API Key (如 OpenAI, Azure, 或国内兼容 OpenAI 协议的模型服务)\n\n## 安装步骤\n\n### 1. 克隆项目代码\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FZleap-AI\u002FSAG.git\ncd SAG\n```\n\n### 2. 配置环境变量\n\n复制示例配置文件并根据实际情况修改关键参数：\n\n```bash\ncp .env.example .env\n```\n\n使用编辑器打开 `.env` 文件，至少配置以下两项：\n*   `LLM_API_KEY`: 填入您的大模型 API Key\n*   `MYSQL_PASSWORD`: 设置数据库密码（可自定义）\n\n> **提示**：如果您使用的是国内大模型服务，请同时检查 `.env` 中的 `LLM_BASE_URL` 是否指向正确的接口地址。\n\n### 3. 下载必要资源\n\n首次运行前，需下载 NLTK 自然语言处理数据。建议在国内网络环境下执行：\n\n```bash\npython scripts\u002Fdownload_nltk_data.py\n```\n\n*(若上述命令因网络超时失败，请尝试配置系统代理后重试)*\n\n### 4. 启动服务\n\n使用 Docker Compose 一键启动所有依赖服务（MySQL, Elasticsearch\u002FVecDB, Backend, Frontend）：\n\n```bash\ndocker compose up -d\n```\n\n等待约 1-2 分钟，待容器完全启动。可通过以下命令查看日志确认状态：\n```bash\ndocker compose logs -f\n```\n\n## 基本使用\n\nSAG 提供 Web 界面、API 和 Python SDK 三种使用方式。\n\n### 方式一：Web 界面（推荐新手）\n\n1.  浏览器访问：**http:\u002F\u002Flocalhost:3000**\n2.  **上传文档**：直接将 Markdown、PDF 或 HTML 文件拖拽至上传区域。\n3.  **自动处理**：系统将自动执行“加载 -> 事件提取 -> 索引构建”，无需人工干预。\n4.  **智能搜索**：在搜索框输入自然语言问题（例如：“上个季度关于大模型优化的决策有哪些？”）。\n5.  **查看结果**：系统将返回关联事件、置信度评分以及完整的推导线索图谱。\n\n### 方式二：Python SDK 调用\n\n适合集成到现有业务系统中。创建一个 `test_sag.py` 文件：\n\n```python\nimport asyncio\nfrom sag import SAGEngine\nfrom sag.modules.load.config import LoadBaseConfig\nfrom sag.modules.extract.config import ExtractBaseConfig\nfrom sag.modules.search.config import SearchBaseConfig\n\nasync def main():\n    # 1. 初始化引擎\n    engine = SAGEngine(source_config_id=\"my-first-project\")\n    \n    # 2. 加载本地文档\n    await engine.load(LoadBaseConfig(\n        type=\"path\",\n        origin=[\".\u002Fdocs\u002Ftech_report.md\"], # 替换为您的文件路径\n        background=\"技术分析报告\"\n    ))\n    \n    # 3. 提取语义事件 (构建图谱)\n    await engine.extract(ExtractBaseConfig(\n        parallel=True,\n        background=\"AI 大模型技术文档\"\n    ))\n    \n    # 4. 执行智能检索\n    result = await engine.search(SearchBaseConfig(\n        query=\"如何优化大模型推理速度？\",\n        depth=2,      # 多跳扩展深度\n        top_k=10      # 返回结果数量\n    ))\n    \n    # 5. 输出结果\n    for event in result.events:\n        print(f\"[{event.score:.2f}] {event.title}\")\n        print(f\"  {event.summary}\\n\")\n\nif __name__ == \"__main__\":\n    asyncio.run(main())\n```\n\n运行脚本：\n```bash\npip install -e .  # 首次运行需安装依赖\npython test_sag.py\n```\n\n### 方式三：API 调试\n\n启动后，可直接访问 Swagger 文档进行 API 测试：\n*   地址：**http:\u002F\u002Flocalhost\u002Fapi\u002Fdocs**\n\n在此界面中，您可以直接尝试 `\u002Fload`, `\u002Fextract`, `\u002Fsearch` 等核心接口，查看请求与响应结构。","某大型电商企业的技术团队正试图从海量的客服对话日志、故障复盘报告和产品需求文档中，挖掘用户投诉的根本原因及关联影响。\n\n### 没有 SAG 时\n- **信息孤岛严重**：传统 RAG 仅能基于关键词或简单语义匹配召回片段，无法识别“支付失败”与“数据库锁死”之间跨越多个文档的隐性因果链条。\n- **图谱维护成本高昂**：若采用传统 GraphRAG，需预先花费数周时间清洗数据并静态构建庞大的知识图谱，一旦业务迭代，图谱即刻过时且难以更新。\n- **溯源模糊不清**：检索结果往往只给出一个结论，缺乏完整的证据链路，分析师难以判断答案是源自某次特定版本的更新还是历史遗留问题。\n- **响应迟钝**：面对突发的新型故障模式，静态系统无法动态调整关联逻辑，导致新出现的风险点长期被忽略。\n\n### 使用 SAG 后\n- **动态构建关联网络**：SAG 在查询瞬间自动将非结构化文本拆解为“语义原子事件”，实时计算出“支付超时”与“近期索引变更”之间的动态关系网。\n- **零预构建负担**：无需预先维护复杂的图结构，新产生的故障报告录入后即可立即参与推理，完美适配高频迭代的互联网业务节奏。\n- **全链路精准溯源**：通过三阶段搜索（Recall → Expand → Rerank），不仅返回根本原因，还清晰展示从现象到根因的完整推导路径和原始文档出处。\n- **深度洞察隐含风险**：利用 PageRank 算法在动态图中发现人工难以察觉的弱关联，提前预警潜在的连锁反应风险。\n\nSAG 通过将静态的知识库转化为查询时按需生成的动态智能网络，让企业在零维护成本下实现了对复杂业务数据的深度理解与精准决策。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FZleap-AI_SAG_95035ee4.png","Zleap-AI","Zleap","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FZleap-AI_91b83092.jpg","AI-Driven Next-Generation Data Platform",null,"https:\u002F\u002Fzleap.ai","https:\u002F\u002Fgithub.com\u002FZleap-AI",[83,87,91,95,99,103,106,109],{"name":84,"color":85,"percentage":86},"Python","#3572A5",67.9,{"name":88,"color":89,"percentage":90},"TypeScript","#3178c6",30.5,{"name":92,"color":93,"percentage":94},"Shell","#89e051",0.9,{"name":96,"color":97,"percentage":98},"CSS","#663399",0.6,{"name":100,"color":101,"percentage":102},"Dockerfile","#384d54",0,{"name":104,"color":105,"percentage":102},"Batchfile","#C1F12E",{"name":107,"color":108,"percentage":102},"JavaScript","#f1e05a",{"name":110,"color":111,"percentage":102},"Mako","#7e858d",1124,20,"2026-04-03T07:54:53","Apache-2.0","Linux, macOS, Windows","未说明 (依赖外部 LLM API，本地无明确 GPU 训练\u002F推理强制要求)","未说明 (建议 8GB+ 以运行 Docker 容器及处理文档)",{"notes":120,"python":121,"dependencies":122},"推荐使用 Docker Compose 部署；需配置外部大模型 API Key (LLM_API_KEY)；首次运行需执行脚本下载 NLTK 数据；存储层依赖 MySQL 和向量数据库 (Elasticsearch 或 VecDB)。","3.11+",[123,124,125,126,127],"FastAPI","Next.js","MySQL","Elasticsearch\u002FVecDB","NLTK",[51,26,54,13,15,53,14],[130,131,132,133,134,135,136,137,138,139,140,141,142,143,144],"ai","fastapi","information-retrieval","knowledge-graph","llm","machine-learning","nextjs","python","rag","vector-search","data-engineering","graphrag","knowledge-base","knowledge-graphs","retrieval-augmented-generation","2026-03-27T02:49:30.150509","2026-04-06T09:05:23.387601",[],[]]