FinGLM
FinGLM 是一个致力于推动"AI+ 金融”融合的开源大模型项目,旨在构建开放、公益且持久的金融智能生态。它核心解决的是金融领域专业文本(如上市公司年报)难以被普通用户快速理解和分析的痛点,通过人工智能技术将复杂的财务数据、专业术语及隐含信息转化为自然流畅的对话交互,让非专业人士也能获得专家级的金融分析洞察。
该项目非常适合金融行业的从业者、希望探索垂直领域大模型应用的开发者以及相关研究人员使用。在技术实现上,FinGLM 提供了一套完整的端到端解决方案:从高效的 PDF 年报解析与表格还原,到精细化的数据切分与指标计算,再到基于 ChatGLM 架构的模型微调(支持 LoRA、P-Tuning v2 等策略)及数据库联动问答。其独特亮点在于不仅开源了超过 70GB 的万份年报数据集和人工标注评测数据,还整合了多个竞赛优胜团队的最佳实践代码与模型,并配套了详尽的课程教程。作为一个完全公益的项目,FinGLM 希望通过社区协作,降低金融大模型的开发门槛,促进技术普惠。
使用场景
某中型券商的投研团队需要在短时间内从上万份上市公司年报中提取关键财务指标并生成分析简报,以支持季度策略会的决策。
没有 FinGLM 时
- 数据处理效率极低:分析师需人工下载并阅读数千页 PDF 格式的年报,手动摘录资产负债表等核心数据,耗时数天且容易出错。
- 非结构化信息难利用:年报中关于“未来规划”或“风险提示”的文字描述难以被传统数据库检索,导致大量隐性价值信息被遗漏。
- 专业门槛高且响应慢:面对复杂的金融术语和跨公司对比需求,初级分析师难以快速给出专家级的解读,无法即时响应投资经理的临时查询。
- 缺乏统一标准:不同人员计算的增长率、行业排名等指标口径不一,导致最终报告数据打架,影响决策可信度。
使用 FinGLM 后
- 自动化解析与入库:利用 FinGLM 的 PDF 转 TXT 及数据切分流程,系统自动将万份年报转化为结构化数据并存入数据库,数据准备时间从数天缩短至小时级。
- 深度语义理解:基于微调后的金融大模型,FinGLM 能精准识别并总结年报中的非结构化文本,如自动提炼管理层对未来的战略意图。
- 交互式智能问答:投研人员只需输入自然语言问题(如“对比 A 公司与行业均值的营业成本率”),FinGLM 即可自动生成查询语句并返回带分析结论的答案。
- 标准化计算输出:内置的金融公式计算模块确保了增长率、行业排名等指标的计算逻辑统一,直接输出可信赖的分析结果。
FinGLM 通过将繁琐的文档处理转化为智能化的对话交互,让金融分析师从“数据搬运工”转型为真正的“决策参谋”。
运行环境要求
- Linux
- Windows
必需(基于 ChatGLM-6B 微调及推理),具体型号和显存未说明,需支持 CUDA
未说明(数据集加载建议流式处理以避免内存溢出)

快速开始
🌐 FinGLM
📃 FinGLM: 致力于构建一个开放的、公益的、持久的金融大模型项目,利用开源开放来促进「AI+金融」。
【🔥 2023/11/23 Update】新增了1、2、3代 ChatGLM-6B 模型的课程内容,包括 PPT、视频和技术文档。
【🔥 2023/11/17 Update】新增一个解决方案「随便取个名」
🚀 目录
📖 项目介绍
📈 一个旨在深度解析上市公司年报的对话交互智能系统。面对金融文本中的专业术语与暗含信息,我们致力于用AI实现专家级别的金融分析。
🚀 在AI领域,虽然已在文本对话取得进展,但真正的金融交互场景仍然是一个巨大挑战。多方机构联手举办此次竞赛,探索金融领域AI的边界。
📘 上市公司年报为投资者呈现了公司的经营状况、财务状况和未来规划。专业知识是解读的关键,而我们的目标是通过AI技术让这一过程变得更简单、更准确。
🛠 项目框架
1. 数据准备流程
-
- 转换为 TXT 格式。
- 保留表格并合并单元格。
数据切分:
- 基础信息:例如公司名称等。
- 财务数据:例如资产负债表等。
- 综合信息:例如财务指标等。
数据处理:
- 计算基础公式:如营业成本率等。
- 计算增长率。
- 计算行业均值和排名。
存入数据库:
- 存入 SQL、Mongo 和 ES 中。
- 包括建表及存储。
2. 模型微调流程
数据分类:如 SQL 数据、ES 数据等。
选择微调策略:例如 ptuningv2、lora等。
执行微调:根据选定策略。
3. 问答流程
- 输入问题:用户输入问题。
- Prompt 准备:根据问题生成 prompt。
- 生成查询语句:基于 GPU 使用率选择生成方法。
- 查询数据库:并返回结果。
- 答案生成:结合问题和查询结果生成答案。
🌱 开源路线图
1. 开源策略
1) 赛事转型
- 比赛转型为学习赛,允许任何人学习使用。
2) 数据开源
- 目前开源数据有 70G/1w+份年报数据、10000条人工标注评测数据等。
- 后续我们也将根据项目需求,持续迭代更新数据。
3) 方案/代码/模型开源
- 经同意,结婚买房代代韭菜、Chatglm反卷总局、nsddd、馒头科技、南哪都队、龙盈战队、安硕硕眼探企、随便取个名等团队的方案、代码、模型完全开源,纳入FinGLM项目。
- 我们将长期维护优化 FinGLM 项目,提供便捷解决方案。
4) 开放交流
- 以上团队成员将共同维护 FinGLM项目,确保项目持续迭代。我们也欢迎更多团队来共同贡献问题和方案。
- 我们将不定期组织线上、线下交流,将更优秀的技术推广给每个项目成员。
- FinGLM 开源项目出于完全公益目的,欢迎所有开发者申请加入,当然我们会进行严格审核。
5) 学习教程
- 基于FinGLM项目的开发,我们将整合并制作以下(包含且不限于)学习教程.
- 数据预处理教程
- 数据库使用教程
- GLM的使用教程
- Prompt编写教程
- 模型微调数据准备
- 模型微调技巧和步骤
- 全流程落地
6) 项目资源池
- 为了维持项目的健康发展,部分项目组织者(个人和企业)提供 10 万元作为开源项目资金池,以及提供项目算力、数据和模型支持。
- 我们欢迎所有受益于本项目的个人或单位来赞助本项目,包括且不限于以上内容,欢迎联系我们。
2. 开源进度
第一期:
- 组织 SMP 2023 ChatGLM 金融大模型挑战赛
- 比赛数据集开源
- 年报数据集
- PDF 文件。包含 11588 份 2019 年至 2021 年期间的部分上市公司年度报告。
- TXT 文件。利用
pdf2txt.py对 PDF 文件解析而来。 - HTML 文件。
- 数据库接入
- sqlite
- mongodb
- 年报数据集
- 决赛项目开源:
- 新增项目开源:
第二期:
- 微调Fintune
- 完善nl2sql
- 增加学习教程
- 数据预处理教程
- 数据库使用教程
- GLM的使用教程
- Prompt编写教程
- 模型微调数据准备
- 模型微调技巧和步骤
- 全流程落地
- 问答系统异常处理
- 提供详细使用手册
- 文档注释完善
🏆 开源项目
项目介绍博客:
0. FinGLM_all
本项目为安硕硕眼探企团队,根据自己的项目以及其他几队的项目整合而成。后续我们也将围绕此项目进行持续迭代升级。

1. 馒头科技
2. 南哪都队

3. Chatglm反卷总局

4. nsddd

5. 龙盈战队

6. 结婚买房代代韭菜

7. TabIsabaopilong

8. 饺子研究院

9. 流宝真人

10. 随便取个名
[PPT] [视频][代码]

📚 数据集
1. 年报数据集
我们开源的数据集涵盖了2019-2021年期间部分上市公司的年度报告。该数据集共包含 11588 个详尽的 PDF 文件(list)。您可以利用这些PDF文件的内容来构建您需要的数据库或者向量库。为了避免计算资源浪费,我们也将相应的文件转换成 TXT文件和 HTML文件,供大家使用。
PDF下载
大小:69GB 文件格式:pdf文件 文件数量:11588
git加载
# 要求安装 git lfs
git clone http://www.modelscope.cn/datasets/modelscope/chatglm_llm_fintech_raw_dataset.git
sdk加载
# Note:
# 1. 【重要】请将modelscope sdk升级到v1.7.2rc0,执行: pip3 install "modelscope==1.7.2rc0" -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html
# 2. 【重要】datasets版本限制为 >=2.8.0, <=2.13.0,可执行: pip3 install datasets==2.13.0
from modelscope.msdatasets import MsDataset
# 使用流式方式加载「推荐」
# 无需全量加载到cache,随下随处理
# 其中,通过设置 stream_batch_size 可以使用batch的方式加载
ds = MsDataset.load('chatglm_llm_fintech_raw_dataset', split='train', use_streaming=True, stream_batch_size=1)
for item in ds:
print(item)
# 加载结果示例(单条,pdf:FILE字段值为该pdf文件本地缓存路径,文件名做了SHA转码,可以直接打开)
{'name': ['2020-03-24__北京鼎汉技术集团股份有限公司__300011__鼎汉技术__2019年__年度报告.pdf'], 'pdf:FILE': ['~/.cache/modelscope/hub/datasets/modelscope/chatglm_llm_fintech_raw_dataset/master/data_files/430da7c46fb80d4d095a57b4fb223258ffa1afe8bf53d0484e3f2650f5904b5c']}
# 备注:
1. 自定义缓存路径,可以自行设置cache_dir参数,即 MsDataset.load(..., cache_dir='/to/your/path')
2. 补充数据加载(从9493条增加到11588条),sdk加载注意事项
a) 删除缓存中的csv映射文件(默认路径为): ~/.cache/modelscope/hub/datasets/modelscope/chatglm_llm_fintech_raw_dataset/master/data_files/732dc4f3b18fc52380371636931af4c8
b) 使用MsDataset.load(...) 加载,默认会reuse已下载过的文件,不会重复下载。
TXT下载
注意:pdf转txt格式文件,方便大家复用(有个文件损坏了,所以总数比pdf少1个,共11587 个)
# Linux
wget https://sail-moe.oss-cn-hangzhou.aliyuncs.com/open_data/hackathon_chatglm_fintech/alltxt.zip
# Windows示例
Invoke-WebRequest -Uri https://sail-moe.oss-cn-hangzhou.aliyuncs.com/open_data/hackathon_chatglm_fintech/alltxt.zip -OutFile D:\\alltxt.zip
HTML下载
注意:pdf转html格式文件,方便大家复用(有个文件损坏了,所以总数比pdf少,共11582 个)
# Linux
wget https://sail-moe.oss-cn-hangzhou.aliyuncs.com/open_data/hackathon_chatglm_fintech/allhtml.zip
# Windows示例
Invoke-WebRequest -Uri https://sail-moe.oss-cn-hangzhou.aliyuncs.com/open_data/hackathon_chatglm_fintech/allhtml.zip -OutFile D:\\allhtml.zip
使用建议
以下是我们推荐的处理步骤:
1、PDF文本和表格提取:您可以使用如pdfplumber、pdfminer等工具包提取PDF文件中的文本和表格数据。
2、数据切分:根据PDF文件的目录、子目录和章节信息,对内容进行精确的切块处理。
3、构建基础金融数据库:依据金融知识和PDF内容,设计专业的金融数据库字段和格式。例如,定义资产负债表、现金流量表和利润表等。
4、信息提取:使用大模型的信息提取能力和NLP技术来抽取对应的金融字段信息。例如,请使用json方式输出目录的内容,其中章节的名称作为key,页码作为value。同时,请详细地抽取表格内的数据,以JSON格式输出。
5、构建金融知识问答库:结合构建的金融数据库,应用大模型构建基础的金融问答库。例如,
{"question":"某公司2021年的财务费用为多少元?", "answer": "某公司2021年的财务费用为XXXX元。"}
prompt:用多种句式修改question及answer的内容。
{"question":"为什么财务费用可以是负的?", "answer": ""}
prompt:请模仿上面的question给出100个类似的问题与对应的答案,用json输出。
6、构建向量库:借助于如Word2Vec、Text2Vec等技术,从原始文本数据中提取出语义向量。使用pgvector这种基于PostgreSQL的扩展来存储和索引这些向量,从而建立起一个可供高效查询的大规模向量库。
7、应用:结合向量库、大模型、langchain等工具,提升应用效果。
2. 标注数据
在 SMP 2023 ChatGLM 金融大模型挑战赛 中我们分别进行了初赛、复赛A、复赛B、复赛C。针对这几轮比赛,我们分别人工标注了相关数据,累计总共有 10000 条。
数据示例:
{"ID": 1,
"question": "2019年中国工商银行财务费用是多少元?",
"answer":"2019年中国工商银行财务费用是12345678.9元。"}
{"ID": 2,
"question": "工商银行2019年营业外支出和营业外收入分别是多少元?",
"answer": "工商银行2019年营业外支出为12345678.9元,营业外收入为2345678.9元。"}
{"ID":3,
"question": "中国工商银行2021年净利润增长率是多少?保留2位小数。",
"answer": "中国工商银行2020年净利润为12345678.90元,2021年净利润为22345678.90元,根据公式,净利润增长率=(净利润-上年净利润)/上年净利润,得出结果中国工商银行2021年净利润增长率81.00%。" }
与此同时,我们也针对比赛撰写了评测代码。我们依据:
\begin{array}{ll}
max_{similar}(sentence1,sentence2,sentence3), & 无基础信息及关键词\\
0.25+0.25+max_{similar}(sentence1,sentence2,sentence3)*0.5, & 基础信息正确,关键词正确 \\
0.25 + 0 + max_{similar}(sentence1,sentence2,sentence3)*0.5, & 基础信息正确,关键词错误\\
0, & 基础信息错误
\end{array}
评测示例:
{"question": "2019年中国工商银行财务费用是多少元?",
"prompt": {"财务费用": "12345678.9元", "key_word":"财务费用、2019", "prom_answer": "12345678.9元"},
"answer": [
"2019年中国工商银行财务费用是12345678.9元。",
"2019年工商银行财务费用是12345678.9元。",
"中国工商银行2019年的财务费用是12345678.9元。" ]
}
评测计算示例:
答案一:工商银行2019年财务费用是12345678.9元。
most similar sentences:
2019年工商银行财务费用是12345678.9元。 (Score: 0.9915)
中国工商银行2019年的财务费用是12345678.9元。 (Score: 0.9820)
2019年中国工商银行财务费用是12345678.9元。 (Score: 0.9720)
评分:0.25+0.25+0.9915*0.5=0.9958分。
评分解释:prom_answer正确、包含所有key_word、相似度最高0.9915。
答案二:2019年中国工商银行财务费用是335768.91元。
评分:0分。
评分解释:prom_answer错误不得分。
答案三:12345678.9元。
most similar sentences:
2019年工商银行财务费用是12345678.9元。 (Score: 0.6488)
2019年中国工商银行财务费用是12345678.9元。 (Score: 0.6409)
中国工商银行2019年的财务费用是12345678.9元。 (Score: 0.6191)
评分:0.25+0+0.6488*0.5=0.5744分。
评分解释:prom_answer正确、未包含所有key_word、相似度最高0.6488。
📊 项目问答演示
{"id": 0, "question": "2021年其他流动资产第12高的是哪家上市公司?", "answer": "2021年其他流动资产第12高的公司是苏美达股份有限公司。"}
{"id": 1, "question": "注册地址在重庆的上市公司中,2021年营业收入大于5亿的有多少家?", "answer": "2021年注册在重庆,营业收入大于5亿的公司一共有4家。"}
{"id": 2, "question": "广东华特气体股份有限公司2021年的职工总人数为?", "answer": "2021年广东华特气体股份有限公司职工总人数是1044人。"}
{"id": 3, "question": "在保留两位小数的情况下,请计算出金钼股份2019年的流动负债比率", "answer": "2019金钼股份流动负债比率是61.10%。其中流动负债是1068418275.97元;总负债是1748627619.69元;"}
{"id": 4, "question": "2019年负债总金额最高的上市公司为?", "answer": "2019年负债合计最高的是上海汽车集团股份有限公司。"}
{"id": 5, "question": "2019年总资产最高的前五家上市公司是哪些家?", "answer": "2019年资产总计最高前五家是上海汽车集团股份有限公司、中远海运控股股份有限公司、国投电力控股股份有限公司、华域汽车系统股份有限公司、广州汽车集团股份有限公司。"}
{"id": 6, "question": "2020年营业收入最高的3家并且曾经在宁波注册的上市公司是?金额是?", "answer": "注册在宁波,2020年营业收入最高的3家是宁波均胜电子股份有限公司营业收入47889837616.15元;宁波建工股份有限公司营业收入19796854240.57元;宁波继峰汽车零部件股份有限公司营业收入15732749552.37元。"}
{"id": 7, "question": "注册地址在苏州的上市公司中,2020年利润总额大于5亿的有多少家?", "answer": "2020年注册在苏州,利润总额大于5亿的公司一共有2家。"}
{"id": 8, "question": "浙江运达风电股份有限公司在2019年的时候应收款项融资是多少元?", "answer": "2019年浙江运达风电股份有限公司应收款项融资是51086824.07元。"}
{"id": 9, "question": "神驰机电股份有限公司2020年的注册地址为?", "answer": "2020年神驰机电股份有限公司注册地址是重庆市北碚区童家溪镇同兴北路200号。"}
{"id": 10, "question": "2019年山东惠发食品股份有限公司营业外支出和营业外收入分别是多少元?", "answer": "2019年山东惠发食品股份有限公司营业外 income 是1018122.97元;营业外 expense 是2513885.46元。"}
{"id": 11, "question": "福建广生堂药业股份有限公司2020年年报中提及的财务费用增长率具体是什么?", "answer": "2020福建广生堂药业股份有限公司财务费用增长率是34.33%。其中,财务费用是7766850.48元;上年财务费用是5781839.51元。"}
{"id": 12, "question": "华灿光电股份有限公司2021年的法定代表人与上年相比相同吗?", "answer": "不相同,华灿光电股份有限公司2020年法定代表人是俞信华,2021年法定代表人是郭瑾。"}
{"id": 13, "question": "请具体描述一下2020年仲景食品控股股东是否发生变更。", "answer": "2020年,仲景食品控股股东没有发生变更。"}
{"id": 14, "question": "什么是其他债权投资?", "answer": "其他债权投资是指企业或机构投资者通过购买债券、贷款、定期存款等金融产品获得的固定收益。这些金融产品通常由政府、公司或其他机构发行,具有一定的信用等级和风险。\n\n其他债权投资是企业或机构投资组合中的一部分,通常用于稳定收益和分散风险。与股票投资相比,其他债权投资的风险较低,但收益也相对较低。\n\n其他债权投资的管理和投资策略与其他资产类别类似,包括分散投资、风险控制、收益最大化等。然而,由于其他债权投资的种类繁多,其投资和管理也存在一定的特殊性。"}
课程
GLM的使用教程
1. 一代 ChatGLM-6B
2. 二代模型:ChatGLM2-6B
3. 三代模型:ChatGLM3-6B
🤝 贡献者
以下是为本项目做出贡献的团队和个人:
- 🌟 安硕硕眼探企
- 🌟 馒头科技
- 🌟 南哪都队
- 🌟 Chatglm反卷总局
- 🌟 nsddd
- 🌟 龙盈战队
- 🌟 结婚买房代代韭菜
- 🌟 小打小闹
- 🌟 东北大土豆
- 🌟 随便取个名
- 🌟 ... 更多贡献者
FinGLM 开源项目出于完全公益目的,欢迎所有开发者申请加入,当然我们会进行严格审核。如有意向,请填写 表单 。
免责声明
本项目相关资源仅供研究、交流使用,一般不建议用于商业用途;如用于商业用途,由此所带来的法律风险,请自行承担。
涉及到模型商业使用问题,请务必遵循相关模型的协议,例如 ChatGLM-6B。
🔍 项目联系
项目交流群
开源赞助
开源贡献
Star History
常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

