robin

4.7k 928 中等 1 次阅读今天MIT语言模型

AI 解读由 AI 自动生成，仅供参考

Robin 是一款专为暗网开源情报（OSINT）调查打造的 AI 辅助工具。面对暗网信息杂乱、检索困难且充满噪音的痛点，Robin 利用大语言模型（LLM）智能优化搜索查询，自动过滤无关结果，并生成结构化的调查摘要，从而大幅提升情报搜集的效率与准确性。

这款工具特别适合网络安全研究人员、数字取证专家以及需要合规进行威胁情报分析的专业人士使用。它采用模块化架构，将搜索、抓取与 AI 分析流程清晰分离，支持灵活切换 OpenAI、Claude、Gemini 或本地 Ollama 等多种模型。此外，Robin 提供了基于 Streamlit 的友好 Web 界面，让用户无需编写代码即可进行交互式调查，并支持将结果导出为报告。为了保障环境隔离与部署便捷，它还原生支持 Docker 运行，但使用前需确保已配置 Tor 网络以访问暗网资源。请注意，Robin 仅供教育和合法调查用途，使用者需自行承担合规责任。

使用场景

某企业安全团队在监测到内部员工凭证疑似在暗网泄露后，急需确认数据扩散范围并评估风险等级。

没有 robin 时

调查人员需手动配置 Tor 环境并逐个访问多个暗网搜索引擎，操作繁琐且极易因节点不稳定中断。
面对海量杂乱的非结构化搜索结果，人工筛选有效信息耗时极长，难以快速识别真正的泄露源。
缺乏智能分析能力，无法自动关联碎片化线索，导致难以判断泄露数据的真实性和严重程度。
最终报告依赖人工整理截图和文本，格式不统一且效率低下，延误了应急响应黄金时间。

使用 robin 后

通过 Docker 一键部署并集成 Tor，robin 提供可视化 Web 界面，让调查人员无需底层配置即可直接开始检索。
利用内置的大语言模型自动优化查询语句并过滤噪音，robin 能从成千上万条结果中精准提取关键泄露条目。
robin 自动对筛选出的信息进行逻辑分析与总结，快速生成包含风险评级和证据链的初步研判结论。
支持一键导出标准化的调查报告文件，团队可立即基于清晰的数据支撑制定密码重置和通知策略。

robin 将原本需要数小时的高门槛暗网取证工作，转化为分钟级的自动化智能分析流程，极大提升了威胁响应速度。

运行环境要求

操作系统

Linux
macOS
Windows (via WSL)

GPU

未说明

内存

未说明

依赖

notes必须安装并运行 Tor 服务才能执行暗网搜索。支持多种 LLM（OpenAI, Claude, Gemini, Ollama），若使用本地模型（如 Ollama）需自行配置模型环境。推荐通过 Docker 部署以隔离环境。使用 Docker 运行本地模型时需正确配置 host 网络地址。

python3.10+

streamlit

requests

python-dotenv

快速开始

Robin：AI 驱动的暗网 OSINT 工具

Robin 是一款基于 AI 的暗网 OSINT 调查工具。它利用大型语言模型来优化查询、筛选来自暗网搜索引擎的搜索结果，并提供调查摘要。

安装 • 使用 • 贡献 • 致谢

架构

工作流

特性

⚙️ 模块化架构 – 搜索、抓取和 LLM 工作流之间实现清晰分离。
🤖 多模型支持 – 可轻松切换 OpenAI、Claude、Gemini 或 Ollama 等本地模型。
🌐 Web UI – 基于 Streamlit 的交互式界面，便于开展调查。
🐳 Docker 就绪 – 推荐使用 Docker 部署，以实现干净、隔离的运行环境。
📝 自定义报告 – 可将调查结果保存到文件中，用于报告或进一步分析。
🧩 可扩展性 – 易于接入新的搜索引擎、模型或输出格式。

⚠️ 免责声明

本工具仅用于教育和合法的调查目的。根据您所在司法管辖区的不同，访问或与某些暗网内容互动可能属于违法行为。作者对本工具的任何滥用行为以及使用该工具收集的数据概不负责。

请负责任地使用，并自行承担风险。在进行 OSINT 调查之前，请确保遵守所有相关法律和机构政策。

此外，Robin 使用了第三方 API（包括 LLM）。在发送可能包含敏感信息的查询时，请务必谨慎，并仔细阅读您所使用的任何 API 或模型提供商的服务条款。

安装

[!NOTE] 该工具需要 Tor 才能执行搜索。您可以在 Linux/Windows(WSL) 上使用 apt install tor，或在 Mac 上使用 brew install tor 来安装 Tor。安装完成后，请确认 Tor 是否已在后台运行。

[!TIP] 您可以通过创建 .env 文件（参考仓库中的示例 env 文件）或在 PATH 中设置环境变量来提供您选择的 LLM API 密钥。

对于 Ollama，如果您使用 Docker 方法运行，则在您的环境变量中将 OLLAMA_BASE_URL 设置为 http://host.docker.internal:11434；对于其他方法，则设置为 http://127.0.0.1:11434。根据您的操作系统，您可能需要将 Ollama 服务绑定到 0.0.0.0。您可以通过在终端中运行 OLLAMA_HOST=0.0.0.0 ollama serve & 来实现这一点。

Docker [推荐]

拉取最新的 Robin Docker 镜像

docker pull apurvsg/robin:latest

运行 Docker 镜像如下所示：

docker run --rm \
   -v "$(pwd)/.env:/app/.env" \
   --add-host=host.docker.internal:host-gateway \
   -p 8501:8501 \
   apurvsg/robin:latest

[!TIP] 为了在 Docker 重启后保留已保存的调查记录，您可以挂载一个本地目录：
docker run --rm \
   -v "$(pwd)/.env:/app/.env" \
   -v "$(pwd)/investigations:/app/investigations" \
   --add-host=host.docker.internal:host-gateway \
   -p 8501:8501 \
   apurvsg/robin:latest
调查结果会保存在您工作目录下的 investigations/ 文件夹中，您可以在侧边栏的“过往调查”面板中加载这些记录。

打开浏览器并导航至 http://localhost:8501

使用 Python（开发版本）

在安装了 Python 3.10+ 和 Tor 的情况下，运行以下命令：

pip install -r requirements.txt
streamlit run ui.py

打开浏览器并导航至 http://localhost:8501

贡献

欢迎各位贡献！如果您有重大功能更新，欢迎提交 Pull Request。

分支仓库
创建您的功能分支（git checkout -b feature/amazing-feature）
提交更改（git commit -m '添加一些令人惊叹的功能'）
推送到分支（git push origin feature/amazing-feature）
打开 Pull Request

如遇以下情况，请打开 Issue：

如果您发现错误或不良代码
如果您有功能请求的想法
如果您对使用有任何疑问或疑虑
如果您有较小的代码更改

致谢

创意灵感来源于 Thomas Roccia 及其关于暗网的困惑的演示。
工具灵感来源于我的暗网 OSINT 工具仓库。
LLM 提示词灵感来源于 OSINT-Assistant 仓库。
Logo 设计由我的朋友 Tanishq Rupaal 完成。

Robin 快速上手指南

Robin 是一款由 AI 驱动的暗网开源情报（OSINT）调查工具。它利用大语言模型（LLM）优化查询、过滤暗网搜索引擎结果，并生成调查摘要。

环境准备

在开始之前，请确保满足以下系统要求和前置依赖：

操作系统：Linux、macOS 或 Windows (需使用 WSL)。
Python 版本：3.10 或更高版本（仅本地开发模式需要）。
核心依赖：Tor。Robin 必须通过 Tor 网络进行暗网搜索。
- Linux / Windows (WSL): sudo apt install tor
- macOS: brew install tor
- 注意：安装后请确认 Tor 服务已在后台运行。
API Key：你需要准备一个大语言模型的 API Key（支持 OpenAI, Claude, Gemini）或配置本地模型（如 Ollama）。

安装步骤

推荐使用 Docker 方式进行部署，以获得干净、隔离的运行环境。

方法一：Docker 部署（推荐）

拉取镜像
```
docker pull apurvsg/robin:latest
```
配置环境变量 在项目目录下创建 .env 文件，填入你的 LLM API Key。
- 若使用 Ollama 本地模型：
  - Docker 模式下设置：OLLAMA_BASE_URL=http://host.docker.internal:11434
  - 非 Docker 模式下设置：OLLAMA_BASE_URL=http://127.0.0.1:11434
  - 提示：可能需要先在终端运行 OLLAMA_HOST=0.0.0.0 ollama serve & 以允许外部访问。

运行容器 执行以下命令启动服务（挂载 .env 文件）：

docker run --rm \
   -v "$(pwd)/.env:/app/.env" \
   --add-host=host.docker.internal:host-gateway \
   -p 8501:8501 \
   apurvsg/robin:latest

可选：持久化保存调查报告 若需保留历史调查记录，可额外挂载 investigations 目录：
docker run --rm \
   -v "$(pwd)/.env:/app/.env" \
   -v "$(pwd)/investigations:/app/investigations" \
   --add-host=host.docker.internal:host-gateway \
   -p 8501:8501 \
   apurvsg/robin:latest

方法二：Python 本地运行（开发模式）

如果你希望直接运行源码：

安装依赖
```
pip install -r requirements.txt
```
(注：国内用户如遇下载慢，可添加 -i https://pypi.tuna.tsinghua.edu.cn/simple 使用清华源)
启动应用
```
streamlit run ui.py
```

基本使用

访问界面 打开浏览器，导航至 http://localhost:8501。
开始调查
- 在 Web 界面的输入框中输入你的调查关键词或问题。
- Robin 将自动调用配置的 LLM 优化查询，并通过 Tor 连接暗网搜索引擎获取数据。
- 系统将过滤无关结果，并在界面右侧展示由 AI 生成的调查摘要。
查看历史与导出
- 若使用了持久化挂载，可在侧边栏的 Past Investigations 面板加载之前的调查记录。
- 调查结果可保存为文件，用于后续报告撰写或深入分析。

⚠️ 免责声明 本工具仅供教育和合法的情报调查用途。访问暗网内容在某些司法管辖区可能违法。作者不对工具的滥用或收集到的数据负责。使用前请确保遵守当地法律法规及机构政策，并注意第三方 API 的服务条款。

版本历史

v2.52026/03/31

v2.42026/03/25

v2.32026/02/17

v2.22026/02/12

v2.12026/02/11

v2.02026/01/17

v1.152025/12/01

v1.142025/11/25

v1.132025/11/24

v1.122025/11/24

v1.112025/11/19

v1.102025/11/18

v1.92025/11/18

v1.82025/11/17

v1.72025/11/17

v1.62025/09/05

v1.52025/04/28

v1.42025/04/23

v1.32025/04/21

v1.22025/04/17

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 159.3k|★★☆☆☆|今天

开发框架Agent语言模型

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|1周前

语言模型图像Agent

spec-kit

Spec Kit 是一款专为提升软件开发效率而设计的开源工具包，旨在帮助团队快速落地“规格驱动开发”（Spec-Driven Development）模式。传统开发中，需求文档往往与代码实现脱节，导致沟通成本高且结果不可控；而 Spec Kit 通过将规格说明书转化为可执行的指令，让 AI 直接依据明确的业务场景生成高质量代码，从而减少从零开始的随意编码，确保产出结果的可预测性。该工具特别适合希望利用 AI 辅助编程的开发者、技术负责人及初创团队。无论是启动全新项目还是在现有工程中引入规范化流程，用户只需通过简单的命令行操作，即可初始化项目并集成主流的 AI 编程助手。其核心技术亮点在于“规格即代码”的理念，支持社区扩展与预设模板，允许用户根据特定技术栈定制开发流程。此外，Spec Kit 强调官方维护的安全性，提供稳定的版本管理，帮助开发者在享受 AI 红利的同时，依然牢牢掌握架构设计的主动权，真正实现从“凭感觉写代码”到“按规格建系统”的转变。

★ 88.7k|★★☆☆☆|今天

语言模型图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|1周前

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85.1k|★★☆☆☆|1周前

图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。

★ 79.9k|★☆☆☆☆|1周前

语言模型数据工具其他