langchainrb
langchainrb 是一款专为 Ruby 开发者打造的开源库,旨在简化基于大语言模型(LLM)的应用程序开发流程。它解决了 Ruby 生态中缺乏统一接口来对接各类主流 AI 模型的痛点,让开发者无需为不同服务商编写重复的适配代码,即可轻松构建智能应用。
该工具主要面向熟悉 Ruby 或 Ruby on Rails 框架的软件工程师和技术团队。无论是想快速原型验证的研究人员,还是致力于在生产环境中集成 AI 功能的全栈开发者,都能通过它高效地实现复杂逻辑。其核心亮点在于提供了一套标准化的抽象层,统一支持包括 OpenAI、Anthropic、Google Gemini、AWS Bedrock 以及本地部署的 Ollama 等十余种主流模型提供商。用户只需切换配置即可在不同后端间无缝迁移,极大地提升了开发灵活性。
此外,langchainrb 内置了构建检索增强生成(RAG)系统、向量搜索、智能助手(聊天机器人)以及提示词管理等关键模块所需的全套工具。它还支持自定义输出解析和评估机制,帮助开发者更精准地控制模型行为并优化应用效果。如果你希望在熟悉的 Ruby 环境中充分利用大语言模型的能力,langchainrb 是一个值得尝试的实用选择。
使用场景
一家拥有大量 Ruby on Rails 遗留代码的电商公司,希望为其客服系统引入基于私有商品文档的智能问答机器人,以自动回答用户关于退换货政策和商品参数的咨询。
没有 langchainrb 时
- 技术栈割裂:团队被迫在现有的 Ruby 项目中嵌入 Python 微服务来调用大模型,导致架构复杂、部署维护成本高昂。
- 重复造轮子:开发者需手动编写代码处理不同大模型厂商(如 OpenAI、Anthropic)的 API 差异,切换模型时几乎要重写底层逻辑。
- RAG 实现困难:构建检索增强生成(RAG)系统时,缺乏统一的向量数据库接口和文本分块工具,数据预处理流程繁琐且易出错。
- 提示词管理混乱:Prompt 模板硬编码在业务逻辑中,缺乏版本管理和动态调整机制,优化回复质量如同“盲人摸象”。
使用 langchainrb 后
- 原生无缝集成:直接在 Gemfile 中引入 langchainrb,无需额外服务即可在 Rails 控制器中调用大模型,保持纯 Ruby 技术栈的统一。
- 统一抽象接口:通过标准化的
Langchain::LLM接口,仅需修改初始化参数即可在 OpenAI、Google Gemini 或本地 Ollama 之间自由切换。 - 一站式 RAG 构建:利用内置的向量存储适配器和文档加载器,快速搭建起从文档切片、向量化到语义检索的完整流水线。
- 结构化输出解析:借助 Output Parsers 功能,轻松将大模型的自然语言回复转化为程序可处理的 JSON 对象,确保业务逻辑稳定运行。
langchainrb 让 Ruby 开发者能够以原生的开发体验,高效构建并落地企业级的大语言模型应用,彻底打破了语言生态的壁垒。
运行环境要求
- 未说明
未说明
未说明

快速开始
💎🔗 Langchain.rb
⚡ 使用 Ruby 构建基于大语言模型的应用程序 ⚡
如需深度集成 Rails,请参阅:langchainrb_rails gem。
提供付费咨询支持!发送邮件给我。
使用场景
- 检索增强生成 (RAG) 和向量搜索
- 助手(聊天机器人)
目录
安装
通过执行以下命令安装 gem 并将其添加到应用程序的 Gemfile 中:
bundle add langchainrb
如果未使用 Bundler 管理依赖项,则可通过以下命令安装 gem:
gem install langchainrb
可能需要其他 gem。它们默认不包含,因此您可以仅包含所需的部分。
使用
require "langchain"
LLM 统一接口
Langchain::LLM 模块提供了一个用于与各种大型语言模型 (LLM) 提供商交互的统一接口。这种抽象使您无需更改应用程序代码即可轻松切换不同的 LLM 后端。
支持的 LLM 提供商
- Anthropic
- AWS Bedrock
- Azure OpenAI
- Cohere
- Google Gemini
- Google Vertex AI
- HuggingFace
- Mistral AI
- Ollama
- OpenAI
- Replicate
使用
所有 LLM 类都继承自 Langchain::LLM::Base,并为常见操作提供一致的接口:
- 生成嵌入
- 生成提示补全
- 生成聊天补全
初始化
大多数 LLM 类可以使用 API 密钥和可选的默认选项进行初始化:
llm = Langchain::LLM::OpenAI.new(
api_key: ENV["OPENAI_API_KEY"],
default_options: { temperature: 0.7, chat_model: "gpt-4o" }
)
生成嵌入
使用 embed 方法为给定文本生成嵌入:
response = llm.embed(text: "Hello, world!")
embedding = response.embedding
embed() 接受的参数
text:(必填)要嵌入的输入文本。model:(可选)使用的模型名称;若未指定,则使用默认嵌入模型。
提示补全
使用 complete 方法为给定提示生成补全:
response = llm.complete(prompt: "Once upon a time")
completion = response.completion
complete() 接受的参数
prompt:(必填)用于补全的输入提示。max_tokens:(可选)要生成的最大标记数。temperature:(可选)控制生成过程中的随机性。较高的值(如 0.8)会使输出更具随机性,而较低的值(如 0.2)则使其更具确定性。top_p:(可选)作为温度的替代品,控制生成标记的多样性。n:(可选)为每个提示生成的补全数量。stop:(可选)API 将在此处停止生成更多标记的序列。presence_penalty:(可选)根据标记在文本中已出现的频率对新标记进行惩罚。frequency_penalty:(可选)根据标记在文本中出现的频率对新标记进行惩罚。
生成聊天补全
使用 chat 方法生成聊天补全:
messages = [
{ role: "system", content: "You are a helpful assistant." },
{ role: "user", content: "What's the weather like today?" }
# Google Gemini 和 Google VertexAI 要求消息采用不同格式:
# { role: "user", parts: [{ text: "why is the sky blue?" }]}
]
response = llm.chat(messages: messages)
chat_completion = response.chat_completion
chat() 接受的参数
messages:(必填)代表对话历史的消息对象数组。model:(可选)要使用的特定聊天模型。temperature:(可选)控制生成过程中的随机性。top_p:(可选)作为温度的替代品,控制生成标记的多样性。n:(可选)要生成的聊天补全选项数量。max_tokens:(可选)聊天补全中要生成的最大标记数。stop:(可选)API 将在此处停止生成更多标记的序列。presence_penalty:(可选)根据标记在文本中已出现的频率对新标记进行惩罚。frequency_penalty:(可选)根据标记在文本中出现的频率对新标记进行惩罚。logit_bias:(可选)修改指定标记出现在补全中的可能性。user:(可选)代表最终用户的唯一标识符。tools:(可选)模型可能调用的工具列表。tool_choice:(可选)控制模型如何调用函数。
切换 LLM 提供商
得益于统一的接口,您可以通过更改实例化的类轻松切换不同的 LLM 提供商:
# 使用 Anthropic
anthropic_llm = Langchain::LLM::Anthropic.new(api_key: ENV["ANTHROPIC_API_KEY"])
# 使用 Google Gemini
gemini_llm = Langchain::LLM::GoogleGemini.new(api_key: ENV["GOOGLE_GEMINI_API_KEY"])
# 使用 OpenAI
openai_llm = Langchain::LLM::OpenAI.new(api_key: ENV["OPENAI_API_KEY"])
响应对象
每个 LLM 方法都会返回一个响应对象,该对象提供了一致的接口来访问结果:
embedding: 返回嵌入向量completion: 返回生成的文本补全chat_completion: 返回生成的聊天补全tool_calls: 返回 LLM 执行的工具调用prompt_tokens: 返回提示中的标记数completion_tokens: 返回补全中的标记数total_tokens: 返回使用的总标记数
[!注意] 虽然核心接口在各提供商之间保持一致,但某些 LLM 可能提供额外的功能或参数。请查阅每个 LLM 类的文档,以了解特定提供商的功能和选项。
提示管理
提示模板
创建带有输入变量的提示:
prompt = Langchain::Prompt::PromptTemplate.new(template: "给我讲一个关于{content}的{adjective}笑话。", input_variables: ["adjective", "content"])
prompt.format(adjective: "有趣", content: "鸡") # "给我讲一个关于鸡的有趣笑话。"
仅使用提示文本而不带输入变量创建 PromptTemplate:
prompt = Langchain::Prompt::PromptTemplate.from_template("给我讲一个关于鸡的有趣笑话。")
prompt.input_variables # []
prompt.format # "给我讲一个关于鸡的有趣笑话。"
将提示模板保存为 JSON 文件:
prompt.save(file_path: "spec/fixtures/prompt/prompt_template.json")
使用 JSON 文件加载新的提示模板:
prompt = Langchain::Prompt.load_from_path(file_path: "spec/fixtures/prompt/prompt_template.json")
prompt.input_variables # ["adjective", "content"]
少量示例提示模板
创建包含少量示例的提示:
prompt = Langchain::Prompt::FewShotPromptTemplate.new(
prefix: "为以下词语写出反义词。",
suffix: "输入:{adjective}\n输出:",
example_prompt: Langchain::Prompt::PromptTemplate.new(
input_variables: ["input", "output"],
template: "输入:{input}\n输出:{output}"
),
examples: [
{ "input": "happy", "output": "sad" },
{ "input": "tall", "output": "short" }
],
input_variables: ["adjective"]
)
prompt.format(adjective: "good")
# 为以下词语写出反义词。
#
# 输入:happy
# 输出:sad
#
# 输入:tall
# 输出:short
#
# 输入:good
# 输出:
将提示模板保存为 JSON 文件:
prompt.save(file_path: "spec/fixtures/prompt/few_shot_prompt_template.json")
使用 JSON 文件加载新的提示模板:
prompt = Langchain::Prompt.load_from_path(file_path: "spec/fixtures/prompt/few_shot_prompt_template.json")
prompt.prefix # "为以下词语写出反义词。"
使用 YAML 文件加载新的提示模板:
prompt = Langchain::Prompt.load_from_path(file_path: "spec/fixtures/prompt/prompt_template.yaml")
prompt.input_variables #=> ["adjective", "content"]
输出解析器
将 LLM 的文本响应解析为结构化输出,例如 JSON。
结构化输出解析器
您可以使用 StructuredOutputParser 生成一个提示,指示 LLM 提供符合特定 JSON 模式的 JSON 响应:
json_schema = {
type: "object",
properties: {
name: {
type: "string",
description: "人的姓名"
},
age: {
type: "number",
description: "人的年龄"
},
interests: {
type: "array",
items: {
type: "object",
properties: {
interest: {
type: "string",
description: "一个感兴趣的领域"
},
levelOfInterest: {
type: "number",
description: "表示该人对该兴趣的兴趣程度,取值范围为 0 到 100"
}
},
required: ["interest", "levelOfInterest"],
additionalProperties: false
},
minItems: 1,
maxItems: 3,
description: "列出该人的兴趣爱好"
}
},
required: ["name", "age", "interests"],
additionalProperties: false
}
parser = Langchain::OutputParsers::StructuredOutputParser.from_json_schema(json_schema)
prompt = Langchain::Prompt::PromptTemplate.new(template: "生成一个虚构角色的详细信息。\n{format_instructions}\n角色描述:{description}", input_variables: ["description", "format_instructions"])
prompt_text = prompt.format(description: "韩国化学系学生", format_instructions: parser.get_format_instructions)
# 生成一个虚构角色的详细信息。
# 您必须将输出格式化为符合给定“JSON Schema”实例的 JSON 值。
# ...
然后解析 LLM 的响应:
llm = Langchain::LLM::OpenAI.new(api_key: ENV["OPENAI_API_KEY"])
llm_response = llm.chat(messages: [{role: "user", content: prompt_text}]).completion
parser.parse(llm_response)
# {
# "name" => "金智贤",
# "age" => 22,
# "interests" => [
# {
# "interest" => "有机化学",
# "levelOfInterest" => 85
# },
# ...
# ]
# }
如果解析器无法解析 LLM 的响应,可以使用 OutputFixingParser。它会将错误信息、之前的输出和原始提示文本发送给 LLM,请求其提供“修复后”的响应:
begin
parser.parse(llm_response)
rescue Langchain::OutputParsers::OutputParserException => e
fix_parser = Langchain::OutputParsers::OutputFixingParser.from_llm(
llm: llm,
parser: parser
)
fix_parser.parse(llm_response)
end
或者,如果您不需要处理 OutputParserException,可以简化代码:
# 我们已经有了 `OutputFixingParser`:
# parser = Langchain::OutputParsers::StructuredOutputParser.from_json_schema(json_schema)
fix_parser = Langchain::OutputParsers::OutputFixingParser.from_llm(
llm: llm,
parser: parser
)
fix_parser.parse(llm_response)
具体示例请参见 这里。
构建检索增强生成(RAG)系统
RAG 是一种帮助 LLM 生成准确且最新信息的方法论。 典型的 RAG 工作流程遵循以下 3 个步骤:
- 从知识库(通常是向量搜索数据库)中检索相关知识(或数据)。
- 构建包含上述检索到的知识的提示。
- LLM 接收上述提示并生成文本补全。 RAG 系统最常见的用法是支持问答系统,用户可以用自然语言提问,并以自然语言获得答案。
向量搜索数据库
Langchain.rb 在支持的向量搜索数据库之上提供了一个便捷的统一接口,使配置索引、添加数据、查询和检索变得非常容易。
支持的向量搜索数据库及功能:
| 数据库 | 开源 | 云服务 |
|---|---|---|
| Chroma | ✅ | ✅ |
| Hnswlib | ✅ | ❌ |
| Milvus | ✅ | ✅ Zilliz Cloud |
| Pinecone | ❌ | ✅ |
| Pgvector | ✅ | ✅ |
| Qdrant | ✅ | ✅ |
| Weaviate | ✅ | ✅ |
| Elasticsearch | ✅ | ✅ |
使用向量搜索数据库 🔍
选择你要使用的向量搜索数据库,添加 gem 依赖并实例化客户端:
gem "weaviate-ruby", "~> 0.8.9"
选择并实例化你将用于生成嵌入的 LLM 提供者:
llm = Langchain::LLM::OpenAI.new(api_key: ENV["OPENAI_API_KEY"])
client = Langchain::Vectorsearch::Weaviate.new(
url: ENV["WEAVIATE_URL"],
api_key: ENV["WEAVIATE_API_KEY"],
index_name: "Documents",
llm: llm
)
你也可以实例化其他任何支持的向量搜索数据库:
client = Langchain::Vectorsearch::Chroma.new(...) # `gem "chroma-db", "~> 0.6.0"`
client = Langchain::Vectorsearch::Hnswlib.new(...) # `gem "hnswlib", "~> 0.8.1"`
client = Langchain::Vectorsearch::Milvus.new(...) # `gem "milvus", "~> 0.9.3"`
client = Langchain::Vectorsearch::Pinecone.new(...) # `gem "pinecone", "~> 1.0"`
client = Langchain::Vectorsearch::Pgvector.new(...) # `gem "pgvector", "~> 0.2"`
client = Langchain::Vectorsearch::Qdrant.new(...) # `gem "qdrant-ruby", "~> 0.9.3"`
client = Langchain::Vectorsearch::Elasticsearch.new(...) # `gem "elasticsearch", "~> 8.2.0"`
创建默认模式:
client.create_default_schema
将纯文本数据添加到你的向量搜索数据库中:
client.add_texts(
texts: [
"首先预热烤箱至 375°F(190°C)。准备四块去骨去皮鸡胸肉,在每块鸡胸肉的一侧切开一个口袋,注意不要完全切断。根据口味用盐和胡椒粉给鸡肉调味。在一口大煎锅中,用中火融化 2 汤匙无盐黄油。加入 1 个小洋葱丁和 2 瓣蒜末,炒至变软,约 3-4 分钟。加入 8 盎司新鲜菠菜,炒至菠菜变软,约 3 分钟。将锅从火上移开,让混合物稍微冷却。",
"在一个碗中,将菠菜混合物与 4 盎司软化的奶油奶酪、1/4 杯磨碎的帕尔马干酪、1/4 杯马苏里拉奶酪丝以及 1/4 茶匙红辣椒碎混合均匀。将混合物均匀地填入每块鸡胸肉的口袋中。如有必要,可用牙签封住口袋。在同一口锅中,用中高火加热 1 汤匙橄榄油,放入酿好的鸡胸肉,每面煎 3-4 分钟,或直至金黄色。"
]
)
或者使用文件解析器加载、解析并将数据索引到你的数据库中:
my_pdf = Langchain.root.join("path/to/my.pdf")
my_text = Langchain.root.join("path/to/my.txt")
my_docx = Langchain.root.join("path/to/my.docx")
client.add_data(paths: [my_pdf, my_text, my_docx])
支持的文件格式:docx、html、pdf、text、json、jsonl、csv、xlsx、eml、pptx。
根据传入的查询字符串检索相似文档:
client.similarity_search(
query:,
k: # 要检索的结果数量
)
根据通过 HyDE 技术 传入的查询字符串检索相似文档:
client.similarity_search_with_hyde()
根据传入的嵌入向量检索相似文档:
client.similarity_search_by_vector(
embedding:,
k: # 要检索的结果数量
)
基于 RAG 的查询:
client.ask(question: "...")
助手
Langchain::Assistant 是一个强大而灵活的类,它结合了大型语言模型 (LLMs)、工具和对话管理,以创建智能、交互式的助手。它旨在处理复杂的对话、执行工具操作,并根据交互上下文提供连贯的响应。
特性
- 支持多个 LLM 提供商(OpenAI、Google Gemini、Anthropic、Mistral AI 以及通过 Ollama 使用的开源模型)
- 可集成多种工具以扩展功能
- 管理对话线程
- 处理自动和手动工具执行
- 支持不同 LLM 提供商的多种消息格式
使用方法
llm = Langchain::LLM::OpenAI.new(api_key: ENV["OPENAI_API_KEY"])
assistant = Langchain::Assistant.new(
llm: llm,
instructions: "你是一位乐于助人的 AI 助手",
tools: [Langchain::Tool::NewsRetriever.new(api_key: ENV["NEWS_API_KEY"])]
)
# 添加用户消息并运行助手
assistant.add_message_and_run!(content: "关于人工智能的最新消息是什么?")
# 向助手提供一张图片
assistant.add_message_and_run!(
content: "请描述这张图片。",
image_url: "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
)
# 访问对话线程
messages = assistant.messages
# 以自动工具执行方式运行助手
assistant.run(auto_tool_execution: true)
# 如果你想流式传输响应,可以添加一个响应处理器
assistant = Langchain::Assistant.new(
llm: llm,
instructions: "你是一位乐于助人的 AI 助手",
tools: [Langchain::Tool::NewsRetriever.new(api_key: ENV["NEWS_API_KEY"])]
) do |response_chunk|
# ...处理响应流
# print(response_chunk.inspect)
end
assistant.add_message(content: "你好")
assistant.run(auto_tool_execution: true)
请注意,目前并非所有 LLM 都支持流式传输。
配置
llm: 要使用的 LLM 实例(必填)tools: 工具实例数组(可选)instructions: 助手的系统指令(可选)tool_choice: 指定工具的选择方式。默认值为 "auto"。也可以传入具体的工具函数名称,这将强制助手始终使用该函数。parallel_tool_calls: 是否允许并行调用多个工具。默认值为 true。add_message_callback: 当有消息被添加到对话中时调用的回调函数(proc 或 lambda)(可选)
assistant.add_message_callback = -> (message) { puts "新消息: #{message}" }
tool_execution_callback: 在工具执行之前调用的回调函数(proc 或 lambda)(可选)
assistant.tool_execution_callback = -> (tool_call_id, tool_name, method_name, tool_arguments) { puts "正在执行 tool_call_id: #{tool_call_id}, tool_name: #{tool_name}, method_name: #{method_name}, tool_arguments: #{tool_arguments}" }
主要方法
add_message: 将用户消息添加到消息数组中。run!: 处理对话并生成响应。add_message_and_run!: 结合添加消息和运行助手的功能。submit_tool_output: 手动提交工具调用的输出。messages: 返回当前正在进行的消息列表。
内置工具 🛠️
Langchain::Tool::Calculator: 用于计算数学表达式。需要安装gem "eqn"。Langchain::Tool::Database: 连接你的 SQL 数据库。需要安装gem "sequel"。Langchain::Tool::FileSystem: 与文件系统交互(读写)。Langchain::Tool::GoogleSearch: 基于 SerpApi 的 Google 搜索 API 封装。需要安装gem "google_search_results"。Langchain::Tool::NewsRetriever: 基于 NewsApi.org 的新闻文章获取封装。Langchain::Tool::RubyCodeInterpreter: 用于执行生成的 Ruby 代码。需要安装gem "safe_ruby"(仍在寻找更好的解决方案)。Langchain::Tool::Tavily: 基于 Tavily AI 的封装。Langchain::Tool::Vectorsearch: 向量搜索类的封装。Langchain::Tool::Weather: 调用 Open Weather API 获取当前天气。Langchain::Tool::Wikipedia: 调用 Wikipedia API。需要安装gem "wikipedia-client"。
创建自定义工具
可以通过创建继承 Langchain::ToolDefinition 模块并实现所需方法的类,轻松扩展 Langchain::Assistant 的功能。
class MovieInfoTool
extend Langchain::ToolDefinition
define_function :search_movie, description: "MovieInfoTool:按标题搜索电影" do
property :query, type: "string", description: "要搜索的电影标题", required: true
end
define_function :get_movie_details, description: "MovieInfoTool:获取特定电影的详细信息" do
property :movie_id, type: "integer", description: "电影的 TMDb ID", required: true
end
def initialize(api_key:)
@api_key = api_key
end
def search_movie(query:)
tool_response(...)
end
def get_movie_details(movie_id:)
tool_response(...)
end
end
使用示例:
movie_tool = MovieInfoTool.new(api_key: "...")
assistant = Langchain::Assistant.new(
llm: llm,
instructions: "你是一个可以帮助提供电影信息的AI助手",
tools: [movie_tool]
)
assistant.add_message_and_run(content: "你能告诉我关于电影《盗梦空间》的信息吗?")
# 查看对话中最后一条消息的回复
assistant.messages.last
错误处理
助手内置了对无效输入、不支持的 LLM 类型以及工具执行失败等情况的错误处理机制。它使用状态机来管理对话流程,并优雅地处理各种场景。
演示
评估 (Evals)
评估模块是一组工具,可用于评估和跟踪 LLM 及其 RAG(检索增强生成)流水线的输出性能。
RAGAS
Ragas 帮助你评估你的检索增强生成(RAG)流水线。其实现基于这篇论文和原始的 Python 仓库。Ragas 会跟踪以下 3 个指标,并给出 0.0 到 1.0 的分数:
- 忠实度 - 答案基于给定的上下文。
- 上下文相关性 - 检索到的上下文集中且几乎没有无关信息。
- 答案相关性 - 生成的答案直接回答了提出的问题。
# 我们建议使用 Langchain::LLM::OpenAI 作为 Ragas 的 LLM
ragas = Langchain::Evals::Ragas::Main.new(llm: llm)
# LLM 生成的答案
# 提出的问题(或原始提示)
# 检索到的上下文(通常来自向量搜索数据库)
ragas.score(answer: "", question: "", context: "")
# =>
# {
# ragas_score: 0.6601257446503674,
# answer_relevance_score: 0.9573145866787608,
# context_relevance_score: 0.6666666666666666,
# faithfulness_score: 0.5
# }
示例
更多示例请参见:/examples
日志记录
Langchain.rb 使用标准的 Ruby Logger 机制,默认日志级别为 Logger::DEBUG。
若需显示所有日志消息:
Langchain.logger.level = Logger::DEBUG
默认情况下,日志会输出到 STDOUT。若要配置日志目标(例如写入文件),可以这样做:
Langchain.logger = Logger.new("path/to/file", **Langchain::LOGGER_OPTIONS)
问题
如果在安装 pragmatic_segmenter 所需的 unicode gem 时遇到问题,可以尝试运行以下命令:
gem install unicode -- --with-cflags="-Wno-incompatible-function-pointer-types"
开发
git clone https://github.com/patterns-ai-core/langchainrb.gitcp .env.example .env,然后填写.env文件中的环境变量。bundle exec rake来确保测试通过,并运行 standardrb。bin/console加载 gem 进入 REPL 会话。你可以自由添加自己的 LLM、工具、代理等实例,并进行实验。- 也可以选择安装 lefthook git hooks 用于 pre-commit 自动 lint:
gem install lefthook && lefthook install -f
Discord
加入我们的 Langchain.rb Discord 服务器。
星标历史
贡献
欢迎在 GitHub 上提交 bug 报告和 pull 请求:https://github.com/patterns-ai-core/langchainrb。
许可证
该 gem 以开源形式发布,遵循 MIT 许可证 的条款。
版本历史
0.19.52025/05/010.19.42025/02/170.19.32025/01/130.19.22024/11/260.19.12024/11/210.19.02024/10/230.18.02024/10/120.17.12024/10/070.17.02024/10/020.16.12024/09/300.16.02024/09/190.15.62024/09/160.15.52024/09/100.15.42024/08/300.15.32024/08/270.15.22024/08/230.15.12024/08/190.15.02024/08/140.14.02024/07/120.13.52024/07/01常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
