what-llm-to-use

GitHub
654 38 非常简单 1 次阅读 1周前Apache-2.0开发框架图像Agent语言模型
AI 解读 由 AI 自动生成,仅供参考

what-llm-to-use 是一份由 Continue 社区维护的开源指南,旨在帮助开发者在快速迭代的 DevAI 领域中,轻松理清“该选择哪个大语言模型(LLM)”这一难题。面对市面上层出不穷的模型,许多人在构建软件时往往难以抉择。这份资源通过清晰的决策逻辑,引导用户根据自身需求在开源与商业模型之间做出明智判断:是追求数据隐私、低成本和本地部署的灵活性,还是倾向于性能顶尖、设置便捷的商业服务?

该指南特别聚焦于编码场景,详细梳理了如 Code Llama、WizardCoder 等主流开源模型的特点、参数量及适用场景,并提供了从本地运行到团队部署的实用建议。它不仅列出了模型清单,更解释了不同选择背后的权衡因素,例如内存限制、网络连接需求以及成本考量。

无论是正在寻找合适辅助编程工具的软件开发人员,还是希望为团队搭建私有化代码模型的技术负责人,都能从中获得极具价值的参考。what-llm-to-use 以社区驱动的方式持续更新,确保内容紧跟技术前沿,是开发者探索 AI 编程助手时不可或缺的实用手册。

使用场景

某初创团队的后端工程师需要在本地 IDE 中集成代码辅助功能,但面对数十个快速迭代的开源与商业大模型,难以确定最适合当前硬件配置和预算的方案。

没有 what-llm-to-use 时

  • 工程师在 Hugging Face 和社区论坛中盲目搜索,花费数天对比 Code Llama、WizardCoder 等模型的参数差异,效率极低。
  • 因不清楚本地显存限制,错误下载了 34B 参数模型导致运行崩溃,或选择了过小的 7B 模型致使代码生成质量不达标。
  • 缺乏对“本地部署”与“托管服务”适用场景的清晰认知,误将敏感代码发送至公共 API,引发数据合规风险。
  • 团队内部对选型标准不统一,有人追求最新模型,有人侧重成本,导致技术栈碎片化,维护成本激增。

使用 what-llm-to-use 后

  • 直接查阅工具整理的实时清单,快速锁定基于 Llama 2 架构且经过指令微调的 WizardCoder 作为首选目标。
  • 依据工具提供的决策逻辑,结合本地显存大小,精准选择 13B 版本在本地运行,既保证了生成质量又避免了内存溢出。
  • 参考工具中关于开源与商业模型的对比指南,明确将核心业务代码保留在本地环境,仅对非敏感任务调用商业 API。
  • 团队依托该工具建立的统一选型框架,迅速达成共识,确定了从开发到部署的标准化大模型应用路径。

what-llm-to-use 通过提供结构化的决策视角,帮助开发者在纷繁复杂的模型生态中快速找到性能、成本与安全性的最佳平衡点。

运行环境要求

GPU

未说明(取决于具体选择的开源模型大小,如 7B/13B/34B 等对显存有不同要求)

内存

未说明(文中提到选择本地运行开源模型时需要“足够的可用内存”,但未给出具体数值)

依赖
notes该仓库并非一个可直接运行的软件工具,而是一份关于编码用大语言模型(LLM)的选型指南和列表。它不包含具体的安装脚本、依赖库或系统环境要求。用户需根据指南中提到的模型(如 Code Llama, WizardCoder 等),自行参考各模型原始仓库的部署文档来配置相应的操作系统、GPU、内存及 Python 环境。
what-llm-to-use hero image

快速开始

应该使用哪款大语言模型?来自 DevAI 领域的视角

在 DevAI 领域——即借助大型语言模型(LLMs)进行软件开发的开发者社区——发展速度如此之快,要决定选用哪款模型往往颇具挑战性。

我们基于自身作为 Continue 社区 一员的经验创建了这个仓库。欢迎提出改进建议,并通过提交 Pull Request 帮助我们保持其最新状态!

现有哪些大语言模型?

大语言模型的数量非常多。我们决定聚焦于目前大家普遍使用的那些:

LLMs 图表

您可以在 这里 找到包含所有这些模型及其相关信息的 CSV 文件。

编码时都在使用哪些大语言模型?

开发者们是如何做出选择的呢?

首先需要决定的是:是使用 开源 模型,还是 商业 模型:

  • 当您希望将代码完全保留在本地环境、拥有充足的可用内存、希望控制成本或希望能够端到端地自主管理和优化时,通常会选择 开源 大语言模型。
  • 而当您追求最佳性能、偏好简单可靠的部署方式、本地内存不足、不介意代码流出本地环境,或者对成本问题并不敏感时,则更倾向于选择 商业 大语言模型。

如果您决定使用 开源 模型,接下来就需要判断是在本地机器上部署,还是选择托管服务提供商:

  • 如果您有足够的可用内存、希望免费使用,或者希望在无需互联网连接的情况下也能运行模型,那么通常会选择在 本地机器 上部署开源模型。
  • 若您期望获得最优的开源模型、本地内存有限,或是希望让模型同时服务于多人,则更倾向于选择在 托管服务商 上部署开源模型。

我们维护了一份面向团队的开源代码 LLM 部署指南,详情请见 这里

如果您选择使用 商业 模型,通常会获取相应的 API 密钥,并尝试对比多个不同的模型。建议的质量以及使用成本,都是重要的考量因素。

开源

以下是截至2023年10月,开发者在编码时使用的开源大语言模型列表,大致按受欢迎程度从高到低排序。

1. Code Llama

Code Llama 是由 Meta 训练的用于生成和讨论代码的大语言模型。它基于 Llama 2 构建。尽管在 Big Code Models Leaderboard 上排名低于 WizardCoder 和 Phind-CodeLlama,但它却是这两者的基础模型。Code Llama 提供 7B、13B 和 34B 三种不同规模的版本,因此无论是在本地设备上还是通过托管服务提供商使用,都十分流行。目前,它是最知名的开源编码基础模型,引领着开源社区构建具备编码能力的大语言模型的努力。

详情
创建者:Meta
发布日期:2023年8月24日
许可证:Llama 2 Community
基础模型:Llama 2
参数量:7B、13B、34B

2. WizardCoder

WizardCoder 是由 WizardLM 团队基于 Code Llama 构建的大语言模型。该团队采用了 Evol-Instruct 方法,专门针对编码任务调整后生成训练数据集,并用其对 Code Llama 进行微调。WizardCoder 同样提供 7B、13B 和 34B 三种规模的版本。因此,它是迄今为止最受欢迎的开源指令微调大语言模型。

详情
创建者:WizardLM
发布日期:2023年8月26日
许可证:Llama 2 Community
基础模型:Code Llama
参数量:7B、13B、34B

3. Phind-CodeLlama

Phind-CodeLlama 是由 Phind 公司基于 Code Llama 构建的大语言模型。该公司使用了一个包含约 8 万个高质量编程问题及解答的专有数据集对 Code Llama 进行了微调,随后又在此基础上继续进行了 15 亿个额外 token 的微调。目前,该模型在 Big Code Models Leaderboard 上位居榜首。不过,它仅提供 34B 参数规模的版本,因此需要更多的内存资源才能运行。

详情
创建者:Phind
发布日期:2023年8月28日
许可证:Llama 2 Community
基础模型:Code Llama
参数量:34B

4. Mistral

Mistral 是由 Mistal AI 训练的 7B 参数大语言模型。它是本列表中最新发布的模型,于九月底正式推出。Mistal AI 表示,该模型“在代码相关任务上的表现接近 CodeLlama 7B,同时在英语任务上也表现出色”。尽管目前只提供这一种小规模版本,但在发布后的前几周内,它已经引起了广泛的关注。现在,以 Mistral 为基础的首批微调模型也开始出现,未来预计还会有更多相关应用问世。

详情
创建者:Mistral AI
发布日期:2023年9月27日
许可证:Apache 2.0
基础模型:Mistral
参数量:7B

5. StarCoder

StarCoder 是由 BigCode 团队训练的 15B 参数大语言模型,于五月发布时可谓领先于时代。它基于 The Stack (v1.2) 数据集中超过 80 种编程语言进行训练,且排除了选择退出请求的数据。需要注意的是,StarCoder 并非指令型模型,因此像“编写一个计算平方根的函数”这样的指令效果并不理想。不过,通过使用 Tech Assistant prompt,可以显著提升其实用性。

详情
创建者:BigCode
发布日期:2023年5月4日
许可证:OpenRAIL-M
基础模型:StarCoder
参数量:15B

6. DeepSeek Coder

DeepSeek Coder 是由 DeepSeek AI 在 2 万亿个 token 上训练的大语言模型。该模型的数据集涵盖了超过 80 种编程语言,是本列表中最新的模型之一,并据报道在多项与编码相关的基准测试中取得了非常优异的成绩。

详情
创建者:DeepSeek AI
发布日期:2023年11月3日
许可证:DeepSeek License Agreement
基础模型:DeepSeek Coder
参数量:1.3B、6.7B、33B

7. Llama2

Llama 2 是由 Meta 在 2 万亿个 token 上训练的大语言模型。它是目前最受欢迎的开源大语言模型,因此即便在代码编辑方面不如上述许多模型,仍有不少开发者在使用它。更重要的是,作为最流行的编码专用大语言模型——Code Llama——正是基于 Llama 2 构建的,而 Llama 2 又进一步成为了 WizardCoder 和 Phind-CodeLlama 的基础。

详情
创建者:Meta
发布日期:2023年7月18日
许可证:Llama 2 Community
基础模型:Llama 2
参数量:7B、13B、70B

商业用途

以下是截至2023年10月,开发者在编码时使用的商业大语言模型列表,按受欢迎程度从高到低排序。

1. GPT-4

来自OpenAI的GPT-4通常被认为是编码时最佳的大语言模型。它在代码生成和讨论方面非常有帮助。不过,使用时需要通过OpenAI的API将代码发送到其服务器,且费用较高。尽管如此,它仍然是目前最流行的编码用大语言模型,大多数开发者都在使用它。所有在2023年7月6日之前成功支付过1美元或以上的OpenAI API用户都已获得GPT-4的访问权限,而OpenAI计划很快向所有开发者开放访问。

2. GPT-4 Turbo

同样来自OpenAI的GPT-4 Turbo比GPT-4更便宜、更快。它的知识截止日期为2023年4月,上下文窗口大小为128K tokens。截至2023年11月,该模型仍处于预览阶段,但任何拥有OpenAI API账户并已具备GPT-4访问权限的用户都可以使用它。

3. GPT-3.5 Turbo

来自OpenAI的GPT-3.5 Turbo比GPT-4更便宜、更快;然而,它的建议远不如GPT-4有用。同样,使用时也需要通过OpenAI的API将代码发送过去。截至目前,它是第二受欢迎的编码用大语言模型。所有开发者只需注册一个OpenAI账户即可使用。

4. Claude 2

Claude 2是由Anthropic训练的大语言模型,相比Claude的第一版,其编码能力有了显著提升。尤其是在提供大量上下文信息时,Claude 2的表现优于其他大语言模型。使用时需通过Anthropic的API将代码发送过去。目前,申请Claude 2的访问权限是必需的。

5. PaLM 2

PaLM 2是由Google训练的大语言模型。要试用它,您需要先通过MakerSuite获取API密钥,然后利用PaLM API将代码发送给Google,而这两者目前均处于公开预览阶段。

贡献

如果您发现有遗漏的模型,或者希望分享您的看法,欢迎提交PR或创建议题!我们致力于维护一个由社区驱动、内容最新的编码辅助大语言模型索引。

如果您喜欢这篇博客文章,并希望在未来阅读更多关于DevAI——一个借助大语言模型构建软件的开发者社区——的相关内容,请在此处订阅我们的月度通讯:here

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|2周前
Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码(fair-code)工作流自动化平台,旨在让用户在享受低代码快速构建便利的同时,保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点,帮助用户轻松连接 400 多种应用与服务,实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”:既可以通过直观的可视化界面拖拽节点搭建流程,也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外,n8n 原生集成了基于 LangChain 的 AI 能力,支持用户利用自有数据和模型构建智能体工作流。在部署方面,n8n 提供极高的自由度,支持完全自托管以保障数据隐私和控制权,也提供云端服务选项。凭借活跃的社区生态和数百个现成模板,n8n 让构建强大且可控的自动化系统变得简单高效。

184.7k|★★☆☆☆|今天
数据工具开发框架Agent

AutoGPT

AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台,核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点,让用户只需设定目标,AI 即可自主规划步骤、调用工具并持续运行直至完成任务。 无论是开发者、研究人员,还是希望提升工作效率的普通用户,都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体;研究人员能基于开源架构探索多智能体协作机制;而非技术背景用户也可直接选用预置的智能体模板,立即投入实际工作场景。 AutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑,每个块负责单一动作,灵活且易于调试。同时,平台支持本地自托管与云端部署两种模式,兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本,即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛,让人人都能成为 AI 的创造者与受益者。

183.6k|★★★☆☆|今天
Agent语言模型插件

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|2周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

161.1k|★★☆☆☆|今天
开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信

144.3k|★☆☆☆☆|4天前
Agent插件