page-assist
Page Assist 是一款开源浏览器扩展,旨在让你能在浏览网页时,直接调用本地运行的大语言模型来辅助工作。它巧妙地在浏览器侧边栏和独立网页界面中集成了本地 AI 能力,让你无需离开当前页面即可与模型对话,甚至能直接“阅读”并分析当前网页的内容,回答关于页面信息的提问。
这款工具主要解决了用户在使用云端 AI 服务时面临的数据隐私顾虑、网络延迟以及订阅费用等问题。通过将计算完全保留在本地,Page Assist 确保了所有交互数据的安全性与私密性,同时让用户能够免费利用自己的硬件资源运行模型。
它非常适合注重数据隐私的研究人员、需要频繁查阅资料的开发者、希望尝试本地大模型的技术爱好者,以及任何不想依赖云端服务的普通用户。只要你的电脑上安装了 Ollama 或兼容 OpenAI 接口的本地推理后端(如 LM Studio),就能轻松上手。
Page Assist 的独特亮点在于其无缝的浏览器集成体验和对多种本地推理后端的良好支持。它不仅提供了类似 ChatGPT 的流畅聊天界面,还允许通过快捷键快速唤出侧边栏,实现了网页内容与本地智能的即时互动,极大地提升了信息获取和处理的效率。
使用场景
数据分析师小林正在调研竞品最新的市场策略,需要快速从多个长篇技术博客和新闻页面中提取关键信息并整理成报告。
没有 page-assist 时
- 频繁切换窗口:需要在浏览器、笔记软件和 AI 网页版之间反复复制粘贴,打断阅读心流。
- 隐私顾虑重重:担心将未公开的竞品数据或内部链接上传到云端大模型,存在数据泄露风险。
- 上下文理解割裂:手动摘录的片段往往丢失原文语境,导致生成的总结不够准确,需反复核对原文。
- 操作效率低下:面对数十个标签页,人工筛选重点耗时耗力,难以在短时间内完成深度分析。
使用 page-assist 后
- 侧边栏即时交互:按下
Ctrl+Shift+Y即可在当前页面唤出侧边栏,直接让本地模型“阅读”并总结当前文章,无需离开页面。 - 数据完全本地化:依托 Ollama 等本地推理引擎,所有浏览内容和对话记录均保留在本地,彻底消除敏感数据外泄隐患。
- 精准上下文问答:可以直接针对网页具体内容提问(如“这篇文章提到的三个核心增长点是什么?”),模型基于完整页面内容给出精准回答。
- 工作流无缝衔接:在阅读过程中随时调用 Web UI 进行多文档对比分析,将提取的关键点直接整理进报告,大幅提升调研速度。
page-assist 通过将本地 AI 能力无缝嵌入浏览过程,让用户在保障数据隐私的前提下,实现了从“被动阅读”到“智能对话”的效率飞跃。
运行环境要求
- Windows
- macOS
- Linux
未说明 (取决于用户选择的本地 AI 后端,如 Ollama 或 LM Studio)
未说明

快速开始
Page Assist
Page Assist 是一款开源浏览器扩展,为您的本地 AI 模型提供侧边栏和 Web 界面。它使您能够从任何网页与您的模型进行交互。
安装
Page Assist 支持基于 Chromium 的浏览器,如 Chrome、Brave 和 Edge,以及 Firefox。
查看演示(v1.0.0):
功能
侧边栏:可在任何网页上打开的侧边栏。它允许您与模型互动并查看结果。
Web UI:一个 Web 界面,让您像使用 ChatGPT 网站一样与模型互动。
与网页聊天:您可以与网页对话,并就内容提出问题。
想要更多功能吗?请创建一个问题告诉我。
手动安装
先决条件
- 克隆仓库
git clone https://github.com/n4ze3m/page-assist.git
cd page-assist
- 安装依赖项
bun install
- 构建扩展(默认会为 Chrome、Edge 和 Firefox 构建)
bun run build
注意:如果您在使用 Bun 时遇到任何问题,请改用 npm 而不是 bun。
- 加载扩展(Chrome)
- 导航到
chrome://extensions打开扩展管理页面。 - 单击“开发者模式”旁边的切换开关以启用开发者模式。
- 单击“加载已解压的扩展程序”按钮,然后选择
build目录。
- 加载扩展(Firefox)
- 导航到
about:addons打开附加组件页面。 - 单击“扩展程序”选项卡。
- 单击“管理您的扩展程序”按钮。
- 单击“加载临时附加组件”按钮,然后选择
build目录中的manifest.json文件。
使用方法
侧边栏
扩展安装完成后,您可以通过右键菜单或键盘快捷键打开侧边栏。
默认键盘快捷键:Ctrl+Shift+Y
Web UI
您可以通过单击扩展图标打开 Web UI,这将在新标签页中打开 Web UI。
默认键盘快捷键:Ctrl+Shift+L
注意:您可以在 Chrome 扩展管理页面的扩展设置中更改键盘快捷键。
键盘快捷键
Page Assist 支持多种键盘快捷键,以提高您的工作效率:
扩展快捷键
| 操作 | 快捷键 | 描述 |
|---|---|---|
| 打开侧边栏 | Ctrl+Shift+Y |
在任何网页上打开侧边栏 |
| 打开 Web UI | Ctrl+Shift+L |
在新标签页中打开 Web UI |
注意:您可以在浏览器的扩展管理页面自定义扩展快捷键。
应用程序快捷键
| 操作 | 快捷键 | 描述 |
|---|---|---|
| 新聊天 | Ctrl+Shift+O |
开始新的聊天对话 |
| 切换侧边栏 | Ctrl+B |
打开/关闭聊天历史侧边栏 |
| 聚焦文本框 | Shift+Esc |
将焦点移至消息输入框 |
| 切换聊天模式 | Ctrl+E |
在普通聊天和当前页面聊天之间切换 |
开发
您可以在开发模式下运行扩展,以便进行更改并测试。
bun dev
这将启动一个开发服务器,并监视源文件的变化。您可以将扩展加载到浏览器中,测试所做的更改。
浏览器支持
| 浏览器 | 侧边栏 | 与网页聊天 | Web UI |
|---|---|---|---|
| Chrome | ✅ | ✅ | ✅ |
| Brave | ✅ | ✅ | ✅ |
| Firefox | ✅ | ✅ | ✅ |
| Vivaldi | ✅ | ✅ | ✅ |
| Edge | ✅ | ✅ | ✅ |
| LibreWolf | ✅ | ✅ | ✅ |
| Zen Browser | ✅ | ✅ | ✅ |
| Opera | ❌ | ❌ | ✅ |
| Arc | ❌ | ❌ | ✅ |
本地 AI 提供者
Chrome AI(Gemini Nano)
兼容 OpenAI API 的端点(如 LM Studio、llamafile 等)
路线图
- Firefox 支持
- 更多本地 AI 提供者
- 更多自定义选项
- 更好的 UI/UX
隐私
Page Assist 不会收集任何个人数据。扩展仅在您使用分享功能时才会与服务器通信,而该功能可以在设置中禁用。 所有数据都存储在浏览器的本地存储中。您可以查看源代码并自行验证。
您可以在 这里 了解更多关于隐私政策的信息。
贡献
欢迎贡献。如果您有任何功能请求、错误报告或疑问,请随时创建一个问题。
支持
如果您喜欢这个项目并希望支持它,可以请我喝杯咖啡。这将帮助我继续推进该项目。
或者您也可以在 GitHub 上赞助我。
关于 Page Assist 的博客和视频
以下是一些关于 Page Assist 的博客和视频。如果您也撰写了相关博客或制作了视频,欢迎创建 Pull Request 并将其添加到这里。
Page Assist 介绍合集 由 百工智用公众号 发布
许可证
MIT
最后但同样重要的是
在 阿拉普扎 用 ❤️ 制作
版本历史
v1.5.602026/04/05v1.5.592026/03/29v1.5.582026/03/22v1.5.572026/03/15v1.5.562026/03/08v1.5.552026/03/01v1.5.542026/02/22v1.5.532026/02/15v1.5.522026/02/08v1.5.512026/02/01v1.5.502026/01/25v1.5.492026/01/18v1.5.482026/01/11v1.5.472026/01/04v1.5.462025/12/28v1.5.452025/12/21v1.5.442025/12/14v1.5.432025/12/07v1.5.422025/11/30v1.5.412025/11/23常见问题
相似工具推荐
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。



