[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-ChuckHend--pg_vectorize":3,"tool-ChuckHend--pg_vectorize":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",150720,2,"2026-04-11T11:33:10",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":76,"owner_location":77,"owner_email":76,"owner_twitter":78,"owner_website":76,"owner_url":79,"languages":80,"stars":107,"forks":108,"last_commit_at":109,"license":76,"difficulty_score":10,"env_os":110,"env_gpu":111,"env_ram":112,"env_deps":113,"category_tags":120,"github_topics":121,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":125,"updated_at":126,"faqs":127,"releases":153},6693,"ChuckHend\u002Fpg_vectorize","pg_vectorize","Full-text and semantic search on any Postgres","pg_vectorize 是一款专为 PostgreSQL 设计的开源工具，旨在让数据库轻松具备全文检索、语义搜索及混合搜索能力。它通过自动化将文本转换为向量嵌入（Embeddings），并无缝对接主流大语言模型，帮助开发者快速在 Postgres 上构建检索增强生成（RAG）系统或高性能搜索引擎，无需额外部署复杂的独立向量数据库。\n\n该工具主要解决了在传统关系型数据库中集成 AI 搜索功能门槛高、维护难的问题。以往实现语义搜索往往需要引入外部向量库并编写大量同步代码，而 pg_vectorize 能自动监听数据变更并实时更新向量索引，极大降低了运维成本。\n\n它非常适合后端开发者、数据工程师以及希望在现有 Postgres 架构中升级搜索能力的技术团队。无论是使用托管云数据库还是自建实例，都能找到合适的部署方案。\n\npg_vectorize 的独特亮点在于提供了两种灵活的使用模式：一是独立的 HTTP 服务器模式，仅需数据库支持 pgvector 插件即可运行，特别适合无法安装扩展的托管环境；二是原生 Postgres 扩展模式，允许开发者直接通过 SQL 函数（如 `vectoriz","pg_vectorize 是一款专为 PostgreSQL 设计的开源工具，旨在让数据库轻松具备全文检索、语义搜索及混合搜索能力。它通过自动化将文本转换为向量嵌入（Embeddings），并无缝对接主流大语言模型，帮助开发者快速在 Postgres 上构建检索增强生成（RAG）系统或高性能搜索引擎，无需额外部署复杂的独立向量数据库。\n\n该工具主要解决了在传统关系型数据库中集成 AI 搜索功能门槛高、维护难的问题。以往实现语义搜索往往需要引入外部向量库并编写大量同步代码，而 pg_vectorize 能自动监听数据变更并实时更新向量索引，极大降低了运维成本。\n\n它非常适合后端开发者、数据工程师以及希望在现有 Postgres 架构中升级搜索能力的技术团队。无论是使用托管云数据库还是自建实例，都能找到合适的部署方案。\n\npg_vectorize 的独特亮点在于提供了两种灵活的使用模式：一是独立的 HTTP 服务器模式，仅需数据库支持 pgvector 插件即可运行，特别适合无法安装扩展的托管环境；二是原生 Postgres 扩展模式，允许开发者直接通过 SQL 函数（如 `vectorize.table()`）完成向量化与搜索，实现纯粹的“数据库内”操作体验。这种设计既保留了 SQL 开发的便利性，又赋予了数据库强大的 AI 语义理解能力。","\u003Ch1 align=\"center\">\n \u003Cb>pg_vectorize: a VectorDB on Postgres\u003C\u002Fb>\n\u003C\u002Fh1>\n\n[![PostgreSQL](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPostgreSQL-13%20%7C%2014%20%7C%2015%20%7C%2016%20%7C%2017%20%7C%2018-336791?logo=postgresql&logoColor=white)](https:\u002F\u002Fwww.postgresql.org\u002F)\n\nA Postgres server and extension that automates the transformation and orchestration of text to embeddings and provides hooks into the most popular LLMs. This allows you to do get up and running and automate maintenance for vector search, full text search, and hybrid search, which enables you to quickly build RAG and search engines on Postgres.\n\nThis project relies heavily on the work by [pgvector](https:\u002F\u002Fgithub.com\u002Fpgvector\u002Fpgvector) for vector similarity search, [pgmq](https:\u002F\u002Fgithub.com\u002Fpgmq\u002Fpgmq) for orchestration in background workers, and [SentenceTransformers](https:\u002F\u002Fhuggingface.co\u002Fsentence-transformers).\n\n---\n\n\n**API Documentation**: https:\u002F\u002Fchuckhend.github.io\u002Fpg_vectorize\u002F\n\n**Source**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\n\n## Overview\n\npg_vectorize provides two ways to add semantic, full text, and hybrid search to any Postgres making it easy to build retrieval-augmented generation (RAG) on Postgres. This project provides an external server only implementation and SQL experience via a Postgres extension.\n\nModes at a glance:\n\n- HTTP server (recommended for managed DBs): run a standalone service that connects to Postgres and exposes a REST API (POST \u002Fapi\u002Fv1\u002Ftable, GET \u002Fapi\u002Fv1\u002Fsearch).\n- Postgres extension (SQL): install the extension into Postgres and use SQL functions like `vectorize.table()` and `vectorize.search()` (requires filesystem access to Postgres; see [.\u002Fextension\u002FREADME.md](.\u002Fextension\u002FREADME.md)).\n\n## Quick start — HTTP server\n\nRun Postgres and the HTTP servers locally using docker compose:\n\n```bash\n# runs Postgres, the embeddings server, and the management API\ndocker compose up -d\n```\n\nLoad the example dataset into Postgres (optional):\n\n```bash\npsql postgres:\u002F\u002Fpostgres:postgres@localhost:5432\u002Fpostgres -f server\u002Fsql\u002Fexample.sql\n```\n\n```text\nCREATE TABLE\nINSERT 0 40\n```\n\nCreate an embedding job via the HTTP API. This generates embeddings for the existing data and continuously watches for updates or new data:\n\n```bash\ncurl -X POST http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Ftable -d '{\n\t\t\"job_name\": \"my_job\",\n\t\t\"src_table\": \"my_products\",\n\t\t\"src_schema\": \"public\",\n\t\t\"src_columns\": [\"product_name\", \"description\"],\n\t\t\"primary_key\": \"product_id\",\n\t\t\"update_time_col\": \"updated_at\",\n\t\t\"model\": \"sentence-transformers\u002Fall-MiniLM-L6-v2\"\n\t}' -H \"Content-Type: application\u002Fjson\"\n```\n\n```json\n{\"id\":\"16b80184-2e8e-4ee6-b7e2-1a068ff4b314\"}\n```\n\nSearch using the HTTP API:\n\n```bash\ncurl -G \\\n  \"http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fsearch\" \\\n  --data-urlencode \"job_name=my_job\" \\\n  --data-urlencode \"query=camping backpack\" \\\n  --data-urlencode \"limit=1\" \\\n  | jq .\n```\n\n```json\n[\n  {\n    \"description\": \"Storage solution for carrying personal items on ones back\",\n    \"fts_rank\": 1,\n    \"price\": 45.0,\n    \"product_category\": \"accessories\",\n    \"product_id\": 6,\n    \"product_name\": \"Backpack\",\n    \"rrf_score\": 0.03278688524590164,\n    \"semantic_rank\": 1,\n    \"similarity_score\": 0.6296013593673706,\n    \"updated_at\": \"2025-10-05T00:14:39.220893+00:00\"\n  }\n]\n```\n\n## Which should I pick?\n\n- Use the HTTP server when your Postgres is managed (RDS, Cloud SQL, etc.) or you cannot install extensions. It requires only that `pgvector` is available in the database. You the HTTP services separately.\n- Use Postgres extension when you self-host Postgres and can install extensions. This provides an in-database experience and direct SQL APIs for vectorization and RAG.\n\nIf you want hands-on SQL examples or to install the extension into Postgres, see `.\u002Fextension\u002FREADME.md`. For full HTTP API docs and deployment notes, see `.\u002Fserver\u002FREADME.md`.\n\n\nFor contribution guidelines see `CONTRIBUTING.md` in the repo root.\n","\u003Ch1 align=\"center\">\n \u003Cb>pg_vectorize：基于Postgres的向量数据库\u003C\u002Fb>\n\u003C\u002Fh1>\n\n[![PostgreSQL](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPostgreSQL-13%20%7C%2014%20%7C%2015%20%7C%2016%20%7C%2017%20%7C%2018-336791?logo=postgresql&logoColor=white)](https:\u002F\u002Fwww.postgresql.org\u002F)\n\npg_vectorize 是一个 Postgres 服务器及扩展，可自动将文本转换为嵌入向量并进行编排，同时提供与主流大语言模型的集成接口。借助该工具，您可以快速搭建并向量搜索、全文搜索以及混合搜索系统实现自动化运维，从而在 Postgres 上高效构建 RAG 系统和搜索引擎。\n\n本项目深度依赖于 [pgvector](https:\u002F\u002Fgithub.com\u002Fpgvector\u002Fpgvector) 的向量相似度搜索功能、[pgmq](https:\u002F\u002Fgithub.com\u002Fpgmq\u002Fpgmq) 的后台任务编排能力，以及 [SentenceTransformers](https:\u002F\u002Fhuggingface.co\u002Fsentence-transformers) 提供的预训练模型。\n\n---\n\n\n**API 文档**: https:\u002F\u002Fchuckhend.github.io\u002Fpg_vectorize\u002F\n\n**源代码**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\n\n## 概述\n\npg_vectorize 提供两种方式，可为任意 Postgres 数据库添加语义搜索、全文搜索和混合搜索功能，从而轻松在 Postgres 上构建检索增强生成（RAG）系统。该项目既支持独立的外部服务端实现，也通过 Postgres 扩展提供 SQL 使用体验。\n\n模式概览：\n\n- HTTP 服务器（推荐用于托管数据库）：运行一个独立的服务，连接到 Postgres 并暴露 REST API（POST \u002Fapi\u002Fv1\u002Ftable，GET \u002Fapi\u002Fv1\u002Fsearch）。\n- Postgres 扩展（SQL）：将扩展安装到 Postgres 中，使用 `vectorize.table()` 和 `vectorize.search()` 等 SQL 函数（需要访问 Postgres 文件系统；详情请参阅 [.\u002Fextension\u002FREADME.md](.\u002Fextension\u002FREADME.md)）。\n\n## 快速入门 — HTTP 服务器\n\n使用 Docker Compose 在本地运行 Postgres 和 HTTP 服务器：\n\n```bash\n# 启动 Postgres、嵌入向量服务及管理 API\ndocker compose up -d\n```\n\n（可选）将示例数据集加载到 Postgres 中：\n\n```bash\npsql postgres:\u002F\u002Fpostgres:postgres@localhost:5432\u002Fpostgres -f server\u002Fsql\u002Fexample.sql\n```\n\n```text\nCREATE TABLE\nINSERT 0 40\n```\n\n通过 HTTP API 创建嵌入作业。此操作会为现有数据生成嵌入向量，并持续监控数据更新或新增数据：\n\n```bash\ncurl -X POST http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Ftable -d '{\n\t\t\"job_name\": \"my_job\",\n\t\t\"src_table\": \"my_products\",\n\t\t\"src_schema\": \"public\",\n\t\t\"src_columns\": [\"product_name\", \"description\"],\n\t\t\"primary_key\": \"product_id\",\n\t\t\"update_time_col\": \"updated_at\",\n\t\t\"model\": \"sentence-transformers\u002Fall-MiniLM-L6-v2\"\n\t}' -H \"Content-Type: application\u002Fjson\"\n```\n\n```json\n{\"id\":\"16b80184-2e8e-4ee6-b7e2-1a068ff4b314\"}\n```\n\n使用 HTTP API 进行搜索：\n\n```bash\ncurl -G \\\n  \"http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fsearch\" \\\n  --data-urlencode \"job_name=my_job\" \\\n  --data-urlencode \"query=camping backpack\" \\\n  --data-urlencode \"limit=1\" \\\n  | jq .\n```\n\n```json\n[\n  {\n    \"description\": \"Storage solution for carrying personal items on ones back\",\n    \"fts_rank\": 1,\n    \"price\": 45.0,\n    \"product_category\": \"accessories\",\n    \"product_id\": 6,\n    \"product_name\": \"Backpack\",\n    \"rrf_score\": 0.03278688524590164,\n    \"semantic_rank\": 1,\n    \"similarity_score\": 0.6296013593673706,\n    \"updated_at\": \"2025-10-05T00:14:39.220893+00:00\"\n  }\n]\n```\n\n## 我应该选择哪种方式？\n\n- 当您的 Postgres 数据库由第三方托管（如 RDS、Cloud SQL 等）或无法安装扩展时，请使用 HTTP 服务器。它仅需数据库中已存在 `pgvector` 扩展即可运行，且 HTTP 服务可独立部署。\n- 当您自建并托管 Postgres 数据库，且具备安装扩展权限时，请使用 Postgres 扩展。这种方式可在数据库内部直接使用，并提供面向向量化和 RAG 的原生 SQL 接口。\n\n如需更多 SQL 示例或有关如何将扩展安装到 Postgres 的说明，请参阅 `.\u002Fextension\u002FREADME.md`。完整的 HTTP API 文档及部署指南，请参阅 `.\u002Fserver\u002FREADME.md`。\n\n有关贡献指南，请参阅仓库根目录下的 `CONTRIBUTING.md` 文件。","# pg_vectorize 快速上手指南\n\npg_vectorize 是一个基于 PostgreSQL 的向量数据库解决方案，能够自动化将文本转换为向量嵌入（Embeddings），并集成主流大语言模型（LLM）。它支持语义搜索、全文搜索及混合搜索，是构建 RAG（检索增强生成）应用的理想工具。\n\n本指南重点介绍**HTTP Server 模式**，该模式无需在数据库内安装扩展，适用于托管型数据库（如阿里云 RDS、腾讯云 CDB 等）或无法直接操作文件系统的场景。\n\n## 环境准备\n\n### 系统要求\n- **操作系统**：Linux \u002F macOS \u002F Windows (需安装 Docker)\n- **容器运行时**：Docker 及 Docker Compose\n- **数据库版本**：PostgreSQL 13 ~ 18\n- **前置依赖**：\n  - 数据库中需已安装 `pgvector` 扩展（大多数云厂商或现代 PG 镜像默认包含）。\n  - 本地需安装 `curl` 和 `jq` (用于测试 API)。\n\n### 网络加速建议\n由于默认拉取的 HuggingFace 模型（如 `sentence-transformers`）位于海外，国内用户建议在 `docker-compose.yml` 中配置镜像加速，或在运行容器时设置环境变量指向国内镜像源（如 `hf-mirror.com`），以加快模型下载速度。\n\n## 安装步骤\n\n使用 Docker Compose 一键启动 PostgreSQL、嵌入服务及管理 API。\n\n1. **克隆项目或获取配置文件**\n   确保你拥有项目的 `docker-compose.yml` 文件。\n\n2. **启动服务**\n   在终端执行以下命令，后台启动所有必要组件：\n\n```bash\ndocker compose up -d\n```\n\n3. **（可选）加载示例数据**\n   为了快速验证功能，可以加载官方提供的示例数据集：\n\n```bash\npsql postgres:\u002F\u002Fpostgres:postgres@localhost:5432\u002Fpostgres -f server\u002Fsql\u002Fexample.sql\n```\n\n预期输出：\n```text\nCREATE TABLE\nINSERT 0 40\n```\n\n## 基本使用\n\n### 1. 创建向量化任务\n通过 HTTP API 创建一个任务，指定源表、需要向量化列以及使用的模型。该任务会自动处理现有数据，并持续监听新数据或更新。\n\n```bash\ncurl -X POST http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Ftable -d '{\n\t\t\"job_name\": \"my_job\",\n\t\t\"src_table\": \"my_products\",\n\t\t\"src_schema\": \"public\",\n\t\t\"src_columns\": [\"product_name\", \"description\"],\n\t\t\"primary_key\": \"product_id\",\n\t\t\"update_time_col\": \"updated_at\",\n\t\t\"model\": \"sentence-transformers\u002Fall-MiniLM-L6-v2\"\n\t}' -H \"Content-Type: application\u002Fjson\"\n```\n\n响应示例（返回任务 ID）：\n```json\n{\"id\":\"16b80184-2e8e-4ee6-b7e2-1a068ff4b314\"}\n```\n\n> **注意**：首次运行时，系统会自动下载模型文件。国内用户若遇下载超时，请检查 Docker 容器的网络代理配置。\n\n### 2. 执行语义搜索\n任务创建完成后，即可通过 API 进行自然语言搜索。以下示例搜索“露营背包”：\n\n```bash\ncurl -G \\\n  \"http:\u002F\u002Flocalhost:8080\u002Fapi\u002Fv1\u002Fsearch\" \\\n  --data-urlencode \"job_name=my_job\" \\\n  --data-urlencode \"query=camping backpack\" \\\n  --data-urlencode \"limit=1\" \\\n  | jq .\n```\n\n响应示例：\n```json\n[\n  {\n    \"description\": \"Storage solution for carrying personal items on ones back\",\n    \"fts_rank\": 1,\n    \"price\": 45.0,\n    \"product_category\": \"accessories\",\n    \"product_id\": 6,\n    \"product_name\": \"Backpack\",\n    \"rrf_score\": 0.03278688524590164,\n    \"semantic_rank\": 1,\n    \"similarity_score\": 0.6296013593673706,\n    \"updated_at\": \"2025-10-05T00:14:39.220893+00:00\"\n  }\n]\n```\n\n### 下一步\n- **生产部署**：参考 `.\u002Fserver\u002FREADME.md` 获取详细的部署配置和高可用方案。\n- **SQL 模式**：如果你拥有数据库文件系统权限且希望直接在 SQL 中操作，可参考 `.\u002Fextension\u002FREADME.md` 安装 Postgres 扩展版本。","某电商初创团队希望在现有的 PostgreSQL 商品数据库中快速构建具备语义理解能力的智能搜索功能，以支持用户通过自然语言查找商品。\n\n### 没有 pg_vectorize 时\n- **架构复杂且成本高**：团队需额外部署独立的向量数据库（如 Milvus 或 Pinecone）和消息队列，导致技术栈臃肿，运维成本激增。\n- **数据同步困难**：商品信息的增删改无法实时同步到向量库，常出现搜索结果滞后或数据不一致，需编写复杂的 ETL 脚本维护。\n- **开发门槛高**：开发人员需手动调用外部 API 生成 Embedding，并自行编排后台任务来处理文本转换，分散了核心业务开发精力。\n- **混合搜索实现繁琐**：难以在单一查询中高效结合关键词匹配（全文检索）与语义相似度搜索，导致长尾查询效果不佳。\n\n### 使用 pg_vectorize 后\n- **架构极简统一**：直接利用现有 PostgreSQL 作为向量数据库，无需引入新组件，通过 HTTP 服务或 SQL 扩展即可一键开启向量化能力。\n- **自动化实时同步**：配置 `vectorize.table` 后，工具自动监听商品表变更，实时触发 Embedding 更新，确保搜索索引与源数据永远一致。\n- **开箱即用的 LLM 集成**：内置主流模型挂钩，只需一条 API 请求或 SQL 命令即可自动完成文本到向量的转换与编排，大幅降低开发难度。\n- **原生混合搜索支持**：通过简单的参数调用即可同时执行全文检索与语义搜索，并自动计算融合排序分数，显著提升“露营背包”等模糊意图的召回准确率。\n\npg_vectorize 的核心价值在于将复杂的向量检索工程简化为数据库层面的原生操作，让开发者能在不改变现有架构的前提下，低成本、高效率地构建企业级 RAG 应用。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FChuckHend_pg_vectorize_4704f32c.png","ChuckHend","Adam Hendel","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FChuckHend_bf48e1e8.png",null,"Minnesota","adamhendel","https:\u002F\u002Fgithub.com\u002FChuckHend",[81,85,89,93,97,101,105],{"name":82,"color":83,"percentage":84},"Rust","#dea584",94.1,{"name":86,"color":87,"percentage":88},"Python","#3572A5",2.3,{"name":90,"color":91,"percentage":92},"PLpgSQL","#336790",1.8,{"name":94,"color":95,"percentage":96},"Makefile","#427819",1.1,{"name":98,"color":99,"percentage":100},"Dockerfile","#384d54",0.8,{"name":102,"color":103,"percentage":104},"Shell","#89e051",0,{"name":106,"color":76,"percentage":104},"RenderScript",829,38,"2026-04-09T15:18:46","未说明 (基于 Docker 和 PostgreSQL，通常支持 Linux\u002FmacOS\u002FWindows)","未说明 (依赖 SentenceTransformers，可选 GPU 加速)","未说明",{"notes":114,"python":112,"dependencies":115},"该工具提供两种运行模式：1. HTTP 服务器模式（推荐用于托管数据库如 RDS），需单独部署服务并通过 REST API 连接数据库；2. PostgreSQL 扩展模式（需自托管数据库且有文件系统访问权限）。快速启动建议使用 Docker Compose。核心功能依赖 pgvector 进行向量搜索，pgmq 进行后台任务编排，以及 SentenceTransformers 生成嵌入模型。",[116,117,118,119],"PostgreSQL 13-18","pgvector","pgmq","SentenceTransformers",[14,13,15],[122,123,124],"ai","rag","vectordb","2026-03-27T02:49:30.150509","2026-04-12T03:20:08.225499",[128,133,138,143,148],{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},30219,"如何使用已有的嵌入向量（embeddings）而不让 pg_vectorize 重新计算？","您可以手动将现有的嵌入向量插入到 pg_vectorize 管理的表中。具体步骤如下：\n1. 调用 `vectorize.table()` 创建项目。\n2. 直接将您的嵌入向量插入到生成的嵌入表列中，例如：`vectorize.\u003Cproject_name>_embeddings`。\n3. 如果项目使用了 `schedule => 'realtime'`，创建项目时会立即生成处理所有文本的任务。如果您不希望执行这些自动生成的任务，可以手动删除它们。例如运行 SQL：`delete from pgmq where message ->> 'name' = '\u003Cproject_name>'`。","https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fissues\u002F149",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},30220,"如何为大型文档启用分块（chunking）支持以提高检索相关性？","pg_vectorize 计划提供自动分块功能。用户可以通过 `vectorize.table()` 函数自动对输入列中的文本进行分块，或者使用工具函数（如拟议的 `vectorize.chunk_table()`）将大文档拆分为多个小片段并存储到新表中。这使得检索时能获取文档的特定子集，从而提高结果的相关性和特异性，类似于 Langchain 中的 recursive_text_splitter 策略。该功能旨在处理巨型文档，避免将整个文档作为一个向量处理导致的精度下降。","https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fissues\u002F142",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},30221,"删除被 vectorize 监控的表时，相关的任务（jobs）会自动清理吗？","是的，系统通过事件触发器（event trigger）来解决这个问题。当属于 `vectorize.jobs` 的表被删除时，对应的 `vectorize.job` 记录也会自动删除。其实现原理是创建一个名为 `after_drop_trigger` 的函数和一个监听 `DROP TABLE` 标签的事件触发器 `trg_after_drop`。当检测到表删除操作时，触发器会自动执行 `DELETE FROM vectorize.job WHERE table_name = TG_TABLE_NAME;` 来清理相关任务。","https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fissues\u002F148",{"id":144,"question_zh":145,"answer_zh":146,"source_url":147},30222,"目前支持哪些额外的嵌入提供商（Embedding Providers），如何添加新的提供商？","pg_vectorize 正在增加对更多嵌入提供商的支持，包括 AWS Bedrock、Google Vertex、Azure AI 和 Voyage AI。添加新的嵌入提供商需要通过实现所需的代码特征（traits）来完成。开发者可以参考项目中现有的实现示例，例如 Cohere 提供商的代码实现（位于 `core\u002Fsrc\u002Ftransformers\u002Fproviders\u002Fcohere.rs`），以此作为模板来集成其他服务。","https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fissues\u002F152",{"id":149,"question_zh":150,"answer_zh":151,"source_url":152},30223,"如何更改 Ollama 或 OpenAI 的默认嵌入模型？","早期版本中，Ollama 和 OpenAI 的嵌入模型是硬编码的，用户无法直接更改。社区已提出建议并通过新议题（Issue #169）推进此功能的开发。未来的更新将允许用户通过配置变量（如 `vectorize.ollama_embedding_model` 或 `vectorize.openai_embedding_model`）来灵活切换模型（例如从 `text-embedding-ada-002` 切换到其他模型），而无需修改源代码。请关注后续版本更新以获取具体的配置方法。","https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fissues\u002F167",[154,159,164,169,174,179,184,189,194,199,204,209,214,219,224,229,234,239,244,249],{"id":155,"version":156,"summary_zh":157,"released_at":158},214544,"v0.26.1","## 变更内容\n* 由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F265 中更新依赖项\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fcompare\u002Fv0.26.0...v0.26.1","2026-04-06T15:39:27",{"id":160,"version":161,"summary_zh":162,"released_at":163},214545,"v0.26.0","## 变更内容\n* 由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F260 中实现的使用 POST 方法进行搜索\n* 由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F262 中优化的搜索查询\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fcompare\u002Fv0.25.0...v0.26.0","2025-11-16T16:32:56",{"id":165,"version":166,"summary_zh":167,"released_at":168},214546,"extension-v0.23.0","## 变更内容\n* 扩展中增加了对 pg18 的支持，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F261 中实现。","2025-11-15T21:18:11",{"id":170,"version":171,"summary_zh":172,"released_at":173},214547,"v0.25.0","## 变更内容\n* 添加了删除路由及相应代码，用于清理向量化作业。由 @kawidman3 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F259 中实现。\n\n## 新贡献者\n* @kawidman3 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F259 中完成了首次贡献。\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fcompare\u002Fv0.24.0...v0.25.0","2025-10-21T00:02:05",{"id":175,"version":176,"summary_zh":177,"released_at":178},214548,"v0.24.0","## 新功能\n* 服务器端过滤器中支持查询运算符，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F256 中实现\n\n### 其他变更\n* 从扩展的 CI 工作流中移除发布触发器，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F254 中完成\n* 修复 compose 文件中的 pg_isready，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F255 中完成\n\n**完整更新日志**: https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fcompare\u002Fv0.23.0...v0.24.0","2025-10-12T00:47:57",{"id":180,"version":181,"summary_zh":182,"released_at":183},214549,"v0.23.0","## 变更内容\n* 通过 HTTP 实现 table() 和 search() 功能，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F229 中完成\n* 服务器因子功能，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F230 中完成\n* 代理 PoC，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F231 中完成\n* 草稿准备语句支持，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F232 中完成\n* 向 HTTP 服务器添加 limit 参数，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F233 中完成\n* 全文搜索与服务器端重排序功能，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F234 中完成\n* 添加搜索文档，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F235 中完成\n* 为服务器构建容器镜像，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F236 中完成\n* 最小化过滤功能，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F237 中完成\n* 多列索引功能，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F238 中完成\n* 关于在现有 Postgres 上运行的服务器文档，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F239 中完成\n* 向量服务\u002F更新 Hugging Face 后端，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F241 中完成\n* 从库中初始化 pgmq SQL，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F240 中完成\n* 服务器\u002F修复触发器处理程序上的参数，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F242 中完成\n* 当作业未找到时返回 4xx 错误，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F244 中完成\n* 默认 batch_size 设置，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F245 中完成\n* 不因非关键初始化失败而中断，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F246 中完成\n* 缓存连接池与过滤稳定性改进，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F247 中完成\n* 更新自述文件与项目信息，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F248 中完成\n* 更宽松的全文搜索，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F250 中完成\n* 服务器镜像发布工作流，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F251 中完成\n* 更新扩展和服务器的相关文档，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F252 中完成\n* 工作者重构，由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F253 中完成\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fcompare\u002Fv0.22.2...v0.23.0","2025-10-05T12:24:59",{"id":185,"version":186,"summary_zh":187,"released_at":188},214550,"v0.22.2","## 变更内容\n* 由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F223 中完成的安装\n* 由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F224 中将 PostgreSQL 镜像推送至 ghcr\n* 由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F225 中为 vector-serve 使用 ghcr\n* 由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F226 中移除 trunk 分支并更新链接\n* 由 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fpull\u002F227 中将 toml 版本升级至 0.22.2\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FChuckHend\u002Fpg_vectorize\u002Fcompare\u002Fv0.22.1...v0.22.2","2025-05-15T03:23:22",{"id":190,"version":191,"summary_zh":192,"released_at":193},214551,"v0.22.1","## 变更内容\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F220 中添加了基准测试\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F219 中提升了插入\u002F更新性能\n* @nhudson 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F221 中创建了 runs-on.yml 文件\n* @nhudson 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F222 中将自托管运行器改为 runs-on 配置\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.22.0...v0.22.1","2025-04-04T17:21:52",{"id":195,"version":196,"summary_zh":197,"released_at":198},214552,"v0.22.0","## 变更内容\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F200 中折叠了镜像构建中的一些层\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F201 中将 build-push-action 更新至 v6 版本\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F202 中在原生节点上构建 arm\u002Famd 架构的镜像\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F203 中仅传递 Hugging Face 令牌\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F204 中为 arm64 清单添加缺失的 latest 标签\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F205 中从镜像构建中移除了开发依赖项\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F206 中指出，当调度为实时时，update_col 并非必需\n* 功能：支持导入预计算的嵌入向量 @Ayushjhawar8 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F199 中实现\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F207 中指出，Cron 需要 last_updated_at 字段\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F211 中仅从主仓库运行集成测试\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F212 中比较完整的仓库路径\n* 重构：将 table() 函数中的表参数重命名为 relation @Abiji-2020 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F209 中完成\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F213 中根据参数变更更新 SQL\n* 弃用 .init_rag()，转而使用 .table() @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F210 中完成\n* @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F217 中在升级测试中安装旧版本并与主干代码一起使用\n* 为 v0.22 版本做准备 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F216 中完成\n* 改为检查所有者而非事件 @ChuckHend 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F218 中完成\n\n## 新贡献者\n* @Ayushjhawar8 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F199 中做出了首次贡献\n* @Abiji-2020 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F209 中做出了首次贡献\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.21.1...v0.22.0","2025-03-24T15:13:09",{"id":200,"version":201,"summary_zh":202,"released_at":203},214553,"v0.21.1","## 变更内容\n* 由 @Jayko001 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F196 中移除未使用的依赖项\n* 由 @Jayko001 在 https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F198 中修复混合搜索的 bug 并添加相关测试\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.21.0...v0.21.1","2025-02-07T19:41:42",{"id":205,"version":206,"summary_zh":207,"released_at":208},214554,"v0.21.0","## What's Changed\r\n* added function that chunks text inputs in vectorize.table() function #142 by @harshtech123 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F166\r\n* Add chunking support to vectorize.table() by @asr2003 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F162\r\n* vector-serve\u002Fmigrate from poetry to uv by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F192\r\n* Fix chunk by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F193\r\n* EXPERIMENTAL -- Implement hybrid search by @Jayko001 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F195\r\n* add upgrade sql by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F197\r\n\r\n## New Contributors\r\n* @harshtech123 made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F166\r\n* @Jayko001 made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F195\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.20.0...v0.21.0","2025-02-06T15:01:30",{"id":210,"version":211,"summary_zh":212,"released_at":213},214555,"v0.20.0","## What's Changed\r\n* add doc page for pg configs by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F170\r\n* CONTRIBUTING.md: Fix setup instructions by @palash25 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F172\r\n* drop deprecated parameters from vectorize.table() by @Bhavyajain21 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F158\r\n* update migraiton scripts by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F177\r\n* tests: fix typo in embeddings integration tests by @palash25 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F173\r\n* docs: Fix typo for openai config url by @palash25 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F181\r\n* CONTRIBUTING.md: Add missing information regarding enabling extensions by @palash25 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F180\r\n* local only for cached models by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F183\r\n* Add embedding provider for VoyageAI. by @palash25 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F174\r\n* separate job for .\u002Fcore by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F186\r\n* Update Readme and Contributing.md File by @joshuajerin in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F185\r\n* force build and publish pg17 to trunk by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F189\r\n* feat: Add event trigger to handle job cleanup on table drop in vectorize schema by @akhilender-bongirwar in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F178\r\n\r\n## New Contributors\r\n* @palash25 made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F172\r\n* @Bhavyajain21 made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F158\r\n* @joshuajerin made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F185\r\n* @akhilender-bongirwar made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F178\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.19.1...v0.20.0","2025-01-17T23:45:17",{"id":215,"version":216,"summary_zh":217,"released_at":218},214556,"v0.19.1","## What's Changed\r\n* update python deps in vector-serve container by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F155\r\n* Patch pgrelease build by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F156\r\n* Ensure that wget is installed on builder by @nhudson in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F157\r\n* Add Documentation for Filtering Search Results and Partial Indices in Vector Search by @asr2003 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F159\r\n* update test for new example table by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F165\r\n\r\n## New Contributors\r\n* @asr2003 made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F159\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.19.0...v0.19.1","2024-10-23T12:34:07",{"id":220,"version":221,"summary_zh":222,"released_at":223},214557,"v0.19.0","## What's Changed\r\n* pg17 by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F151\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.18.3...v0.19.0","2024-10-15T23:33:28",{"id":225,"version":226,"summary_zh":227,"released_at":228},214558,"v0.18.3","## What's Changed\r\n* fix and rename project views, quiet some logs by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F140\r\n* v0.18.3 by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F141\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.18.2...v0.18.3","2024-09-18T18:37:36",{"id":230,"version":231,"summary_zh":232,"released_at":233},214559,"v0.18.2","## What's Changed\r\n* add pg_monitor permissions by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F139\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.18.1...v0.18.2","2024-09-04T17:17:41",{"id":235,"version":236,"summary_zh":237,"released_at":238},214560,"v0.18.1","## What's Changed\r\n* handle portkey virtkey in bgw by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F138\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.18.0...v0.18.1","2024-08-26T21:51:34",{"id":240,"version":241,"summary_zh":242,"released_at":243},214561,"v0.18.0","## Breaking change\r\n- Dropped `args` param from vectorize.table. use GUC appropriate env var instead. e.g. `ALTER SYSTEM SET vectorize.embedding_service_api_key to 'my_huggingface_api_key'` to use a private model from Hugging Face.\r\n- default embedding model changed from `openai\u002Ftext-embedding-ada-002` to `sentence-transformers\u002Fall-MiniLM-L6-v2`\r\n- default chat model in RAG changed from `openai\u002Fgpt-3.5-turbo` to `tembo\u002Fmeta-llama\u002FMeta-Llama-3-8B-Instruct`\r\n\r\n## What else changed\r\n* add cohere source and trait by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F132\r\n* fix upgrade test by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F133\r\n* portkey integration by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F134\r\n* change to tembo as default source by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F135\r\n* fix image build by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F136\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.17.1...v0.18.0","2024-08-23T16:21:02",{"id":245,"version":246,"summary_zh":247,"released_at":248},214562,"v0.17.1","Metadata release -- updates to Trunk.toml to allow for setting of `shared_preload_libraries` during `trunk install`\r\n\r\n## What's Changed\r\n* Trunk.toml: state `shared_preload_library` by @vrmiguel in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F130\r\n* 0.17.1 by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F131\r\n\r\n## New Contributors\r\n* @vrmiguel made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F130\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.17.0...v0.17.1","2024-08-15T13:39:49",{"id":250,"version":251,"summary_zh":252,"released_at":253},214563,"v0.17.0","## What's Changed\r\n* Update README.md by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F125\r\n* Add support for DiskANN, and HNSW inner product, L2 by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F126\r\n* Add .encode and .generate examples to readme by @ChuckHend in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F127\r\n* Added Ollama support in transform function by @destrex271 in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F106\r\n\r\n## New Contributors\r\n* @destrex271 made their first contribution in https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fpull\u002F106\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Ftembo-io\u002Fpg_vectorize\u002Fcompare\u002Fv0.16.0...v0.17.0","2024-07-16T11:44:48"]