aws-ml-enablement-workshop
aws-ml-enablement-workshop 是一套旨在帮助企业快速组建跨职能团队、利用生成式 AI 推动产品增长的实战工作坊指南。它主要解决了企业在引入 AI 技术时,业务规划与技术开发脱节、想法难以快速验证以及缺乏高效落地流程的痛点。
该资源特别适合企业的产品经理、业务策划人员、开发者及设计师共同使用。通过模拟亚马逊经典的"Working Backwards"(逆向工作法)流程,引导团队从客户体验出发,在短短两天内完成从概念构思到原型构建的全过程。其独特亮点在于将生成式 AI 深度融入工作流的每一个环节:不仅辅助团队并行撰写多份新闻稿以验证假设,还能结合 Kiro CLI 等工具,在极短时间内(如 10-20 分钟)自动生成可交互的产品原型和指标收集系统。
这种“边做边学”的模式,让团队能在 3 至 6 个月内实现产品上线,有效避免了纸上谈兵,确保创意能迅速转化为可衡量的商业价值。无论是希望转型的传统企业,还是寻求效率突破的技术团队,都能从中获得一套经过验证的 AI 落地方法论。
使用场景
某大型金融机构的法人销售团队与技术开发部门希望利用生成式 AI 重构客户提案流程,但在跨部门协作与落地路径上陷入僵局。
没有 aws-ml-enablement-workshop 时
- 部门墙厚重:业务方只提模糊需求,开发方埋头写代码,双方缺乏共同语言,导致最终产品偏离客户真实痛点。
- 验证周期漫长:从构思到做出可演示的原型(Mock)往往耗时数周,无法快速通过市场反馈验证假设,容易陷入“纸上谈兵”。
- AI 应用浮于表面:仅将生成式 AI 用于简单的文案润色,未能将其深度融入从策划、假设立案到原型构建的全流程。
- 失败风险高企:由于缺乏亚马逊"Working Backwards"(逆向工作法)的思维训练,项目常在开发后期才发现方向错误,造成资源浪费。
使用 aws-ml-enablement-workshop 后
- 组建跨职能特种部队:通过 Day0 至 Day2 的密集工作坊,业务与开发人员组成统一战队,基于“以客户为中心”的逆向思维共同定义产品愿景。
- 极速原型验证:利用工作坊提供的生成式 AI 流程(如 Kiro CLI),团队在短短 10-20 分钟内即可构建出包含前端页面和指标追踪的功能原型,立即开展假设验证。
- 全流程 AI 赋能:将生成式 AI 应用于 пресс-релиз(新闻稿)撰写、多方案并行测试及自动化提案生成,显著提升了创新效率与质量。
- 明确落地路线图:在 3.5 小时的实战演练后,团队不仅更新了产品规划,还制定了清晰的 3-6 个月发布计划,确保从概念到生产环境的平滑过渡。
该工具通过标准化的亚马逊产品开发流程与生成式 AI 实践,帮助企业在数月内将跨部门创意转化为可衡量的商业增长,成功复刻了 MUFG 等企业的转型奇迹。
运行环境要求

快速开始
机器学习赋能工作坊
ML Enablement Workshop 是一个旨在组建能够将包括生成式 AI 在内的 AI/ML 技术转化为产品增长动力的团队的工作坊。
| 跨部门团队组建 | 实践亚马逊开发流程 | 约6个月内上线 |
|---|---|---|
![]() |
![]() |
![]() |
| 企划与业务方和开发方协同合作 | 从客户体验出发逆向思考 实践 Working Backwards |
通过使用生成式AI进行广泛且并行的价值验证来实现 |
🚴 工作坊流程
在开始工作坊之前,我们会先为参与者讲解工作坊的意义与作用,从 Day0 开始。完成 Day0 后,我们将进入分为实践篇和改进篇的两部分课程。
- 在 Day0 中,确认启动条件及前期准备工作。
- 在 实践篇 中,实践亚马逊的产品开发流程,并 结合生成式AI 制作多个新产品的新闻稿或功能发布文案。同时,基于这些内容构建用于假设验证的原型(参考:当日流程)。
- 在 改进篇 中,整合通过原型获得的经验与洞见,由参与者自行实践亚马逊的开发流程并更新新闻稿。随后,规划未来3至6个月内实现发布的初步步骤。
| 标题 | Day0:明确目标与角色 | 实践篇:践行亚马逊模式 | 改进篇:启动自主假设验证 |
|---|---|---|---|
| 图片 | ![]() |
![]() |
![]() |
| 工作内容 | 确认每位参与者的角色 | 基于“Working Backwards”方法提出假设并开始并行验证 | 参与者自行优化流程,制定面向发布的初步计划 |
| 时间 | 1小时(可远程) | 3.5小时 | 3小时 |
ML Enablement Workshop 的优势如下:
- ⚡ 可在短时间内学习并实践亚马逊的产品开发流程——“Working Backwards”方法
- 🤖 通过将生成式AI贯穿从策划到原型构建的全过程,积累经验,从而优化产品开发流程
- 🛠 通过使用原型获取反馈,确保策划方案不流于空谈
| 要点 | 说明 |
|---|---|
| 我们使用了作为生成式AI工具的 Kiro CLI 来实践以需求驱动的方式进行开发,在工作坊结束后可以顺利过渡到基于需求的设计与实现阶段。 |
成果示例
以“提升英语会话能力以便参加英语会议”为主题,我们按照工作坊指南,利用生成式AI推进了“Working Backwards”方法的实践。该案例完全由生成式AI生成,未经过人工编辑。这一示例旨在展示如何借助生成式AI将人类的时间更多地投入到细节确认以及更具影响力的问题设计上。
此外,我们还提供了一个关于“电商网站商品页面自动生成与预览功能”的原型示例。该原型的搭建耗时约10至20分钟,主要由三个部分组成:首页、应用功能页面(响应数据为模拟数据)以及点击和页面浏览等指标的统计功能。这些指标将在改进篇中被使用。
| 首页 | 功能页面 | 指标 |
|---|---|---|
![]() |
![]() |
![]() |
客户案例
我们汇总了使用研讨会的客户的反馈。
特别是关于生成式 AI 的案例,请务必参阅以下博客:利用生成式 AI 的关键在于跨部门团队:从 ML Enablement Workshop 的四个案例中学习
参与研讨会的 MUFG 公司作为日本首家金融机构,在 2024 年 re:Invent 大会上发表了演讲!
| 视频 | 概述 |
|---|---|
![]() |
MUFG 如何利用生成式 AI 改变企业销售:高效、可扩展且适应性强 在企业销售中的金融产品推荐客户体验方面,销售团队与开发团队联合举办了 ML Enablement Workshop,共同定义了理想的客户体验及其实现路径。销售团队负责验证提案的价值,而开发团队则推进基于生成式 AI 的提案自动生成流程。借助 AWS 的原型设计项目支持前端开发,并持续进行后续优化。最终,在短短三个月内,潜在客户数量增加了十倍,成交率提升了 30%,取得了显著的业务成果。 |
关于我们研讨会实践的书籍已于 2024 年出版。
| 书 | 概述 |
|---|---|
![]() |
通过案例理解 MLOps:规模化机器学习成果的解决方案 (亚马逊链接) 本书不仅从技术层面探讨了 MLOps 整体的基础设施建设,还深入剖析了如何构建支持机器学习的文化,并结合理论与各企业的实际应用案例进行讲解。 我们将本次研讨会的实践经验收录于第 9 章“克服机器学习项目 80% 失败率的实践”中。 ・相关链接:出版纪念活动视频 / 演讲资料 / 写作背景与意图 |
其他使用过我们服务的客户评价
| 客户 | 引言 |
|---|---|
![]() |
StudyPocket 株式会社 通过 ML Enablement Workshop 中运用生成式 AI 的逆向思维实践,我们得以直面那些挑战常识的问题,成功推出了贴近教育场景的功能。在第一天和第二天安排的用户访谈中,我们也基于原型验证了假设,进一步坚定了信心。 |
![]() |
JINS 株式会社 在 ML Enablement Workshop 中,门店经验丰富的员工与数据科学家携手合作,具体化了利用生成式 AI 打造全新客户体验的方案。通过讨论加深了对客户痛点及 JINS 优势的理解,并制定了详细的计划,从而顺利推进了后续项目。 |
![]() |
PKSHA Technology 株式会社 我们不仅完整地实践了亚马逊的‘逆向思维’方法,还在其后设置了回顾与优化环节,以两阶段的形式帮助我们重新审视并改进原本尚不明确的功能与商业计划。最终,我们掌握了一套非常实用且有价值的框架。 |
![]() |
BASE 株式会社 五个产品团队同时并行开展工作,在短时间内实现了工程师与产品经理之间围绕规划、实施及 KPI 的深度讨论,从而快速有效地落地了生成式 AI 的应用场景。 |
![]() |
Saison Technology 株式会社 通过 ML Enablement Workshop,我们让每位成员的想法可视化并共享,避免了先入为主的偏见,从而做出了充满信心的决策。 ・查看详细案例 |
![]() |
三菱 UFJ 银行株式会社 借助 ML Enablement Workshop 和原型设计的支持,我们能够迅速而顺畅地启动并循环推进从目标销售体验的设计、验证到改进的整个流程。 ・查看详细案例 ・2024 年 re:Invent 大会上的演讲视频 |
![]() |
Kokopelli 株式会社 通过 ML Enablement Workshop 中的客户体验分析,我们确定了对 Big Advance 客户最具影响力的生成式 AI 应用场景,并设定了具体任务及效果评估的 KPI。 ・查看详细案例 ・Kokopelli 公司的 AWS 生成式 AI 案例:ML Enablement Workshop 确定并验证的应用场景 |
![]() |
Geniee 株式会社 通过 ML Enablement Workshop 富有启发性的体验,我们不仅带回了明确的行动方案,还获得了高质量的思考框架。 ・查看详细案例 |
| Money Forward 株式会社 借助 ML Enablement Workshop,产品经理、开发人员和研发人员共同参与,促进了机器学习推进过程中不可或缺的角色间沟通。 ・详细案例:为用户提供最大附加价值的 AI 应用方向 (@ AWS SaaS 2022 大会) |
此外,众多客户的各个产品团队也纷纷采用了我们的研讨会。
如果您愿意分享使用案例,请通过 Issue 与我们联系。
🚶 研讨会实施前
若希望在实施 ML Enablement Workshop 之前提升组织整体的 AI/ML 应用素养,请考虑使用社区版资料。
社区工作坊
思考如何利用生成式AI推動產品成長的工作坊
本工作坊主要面向產品經理,旨在學習如何在產品中應用生成式AI的創意發想、建立商業模式,以及以客戶為中心的產品開發流程。透過匯集多家公司的產品經理,促進跨企業間的意見交流,從全新視角激發創新靈感。過去活動報告與演示資料請參閱下表:
| 索引 | 圖片 | 演示文稿/報告 |
|---|---|---|
| vol.4 | ![]() |
活動報告:生成式AI時代的產品開發流程改善——以逆向思考與價值探索實踐(本次聚焦於如何結合生成式AI改進產品開發流程) ・工作坊進行資料 ・活動頁面 |
| vol.3 | ![]() |
活動報告:發現生成式AI能發揮作用的產品體驗關鍵——從24項價值畫布分析中所見 ・工作坊進行資料 ・工作用價值畫布底板 ・價值畫布完成後的行動指南 ・活動頁面 |
| vol.2 | ![]() |
活動報告:借助社群力量打磨將AI融入產品的想法 AWS 大渕麻莉:關於生成式AI應用中產品經理重要性日益提升的論述 Notion 早川和輝:從Notion AI學到的生成式AI產品假設驗證與實踐方法 AWS 久保隆宏:生成式AI應用場景的構思與驗證 活動頁面 |
| vol.1 | ![]() |
活動報告:舉辦「思考如何利用生成式AI推動產品成長的工作坊」 Sansan 西田貴紀:從Sansan Labs的LLM應用談起的LLM專案要點整理 株式會社Gaudiy 北川和貴:LLM代理面向C端用戶所提供的可能性與難題(限內部公開) AWS 久保隆宏:生成式AI應用場景的構思與驗證 活動頁面 |
此外,我們也有為單一公司舉辦的成功案例。
| 索引 | 圖片 | 客戶報告 |
|---|---|---|
| 1 | ![]() |
株式會社Rikunabi:成功推動公司內部生成式AI應用的實踐方法 在AWS的協助下,舉辦了面向內部員工的生成式AI工作坊,涵蓋從創意發想到商業模式設計等環節。其宗旨是讓Rikunabi約50位工程師與產品經理共同合作,圍繞具體問題展開討論,以探討生成式AI的實際應用場景。 我本人也參與其中,在針對新業務及現有業務中的各種挑戰進行多角度腦力激盪,並梳理PSF(Problem Solution Fit)的過程中,獲得了許多新的洞見。 |
| 2 | ![]() |
NTT數據IntraMart公司:推動產品成長的生成式AI應用場景工作坊實施報告 為推進利用生成式AI進行多種功能強化,我們與AWS合作舉辦了「推動產品成長的生成式AI應用場景工作坊」 藉由與產品研發及服務團隊的核心成員交流意見,激發出豐富多元的想法,這是一次非常有意義的經驗。 |
🏃♀️ 工作坊結束後
為了協助大家在工作坊結束後快速建構原型,AWS特別公開了多項資源。
生成式AI的AWS實現範例集
透過AWS Generative AI Solution Box,您只需擁有AWS帳號,即可在一鍵操作下於數分鐘內部署以下解決方案。
此外,您還可參考AWS生成式AI案例集,了解各行業企業的實際應用案例。
| 圖片 | 詳情 |
|---|---|
![]() |
generative-ai-use-cases 這是一個一站式試用平台,涵蓋生成式AI的多種應用場景。無論是聊天、摘要、圖像生成、增強型搜尋、文件校對、翻譯,還是網頁內容提取等功能,都能立即體驗並感受其效果。 |
![]() |
bedrock-claude-chat 這是一款能夠快速且安全地部署生成式AI聊天功能的應用程式。它提供專注於聊天的功能,例如增強型搜尋以及嵌入系統提示詞的自定義機器人分享等。 |
AI/ML的AWS實現範例集
| 圖片 | 詳情 |
|---|---|
![]() |
aws-ml-jp 這個儲存庫提供了AWS AI/ML服務的示例代碼及學習資源。除了使用Amazon SageMaker進行模型訓練外,還包含基礎模型微調的示例實現等內容。 |
![]() |
awesome-studio-lab-jp 這是一個收集了可在無需AWS帳號且免費使用的Amazon SageMaker Studio Lab平台上學習的機械學習內容的儲存庫。 |
机器学习项目体验动手实践
这是一份面向开发者的机器学习动手实践资料。按照目录中的编号从1开始逐步进行,您可以学习在每个开发流程中需要做什么、为什么要这样做以及如何去做。本次动手实践将使用 Amazon SageMaker Studio Lab 进行。有关账户创建方法和使用说明,请参阅Amazon SageMaker Studio Lab 使用指南。
| 编号 | 流程 | 标题 | 内容 | 视频 |
|---|---|---|---|---|
| 1 | 引言 | 机器学习模型开发项目的推进方式 | ||
| 2 | 环境搭建 | 搭建机器学习模型的开发环境 | ||
| 3 | 业务理解 | 计算机器学习的价值 | ||
| 4 | 分析 | 诊断数据是否能创造价值 | ||
| 5 | 准备 | 根据诊断结果补充数据 | ||
| 6 | 预处理 | 将数据转化为机器学习模型易于识别的形式 | ||
| 7 | 训练 | 训练机器学习模型 | ||
| 8 | 测试 | 评估机器学习模型 | (即将上线) | |
| 9 | 结束 | 从机器学习模型的开发到部署 | (即将上线) |
场景化动手实践
这是一套针对特定场景的动手实践内容,帮助您从规划到实施全面学习 AI/ML 项目。
- 服务退订率优化场景 (所需时间 2~3 小时)
- 以某手机公司退订率优化为主题,从业务理解到模型测试,一站式体验整个流程的动手实践。
ML Enablement Workshop 常见问题解答
- ML Enablement Workshop 是由谁开发并维护的?
- 由 AWS 开发并维护。本资料凝聚了 AWS 在助力客户利用 AI/ML 方面的丰富经验。关于具体的改进过程,请参阅以下文章:
- 学习 AI/ML 应用的成功模式!AWS 热门研讨会以亚马逊风格全新登场:介绍了 ML Enablement Workshop v2 大版本升级的背景。
- 深刻体会到约 80% 的机器学习项目失败并非空穴来风,但依然挑战不向现实低头的研讨会:总结了 ML Enablement Workshop 改进版 (v1.1) 中改进前的挑战及改进后的亮点。
- 公开机器学习项目体验式动手实践:首次发布时的文章。
- 除了 AWS,我们还调研了包括 Amazon、Spotify、Uber 等全球知名产品的管理者如何应用机器学习,并将相关内容融入其中。感兴趣的朋友可以参阅 探访运用数据科学的产品经理。
- ML Enablement Workshop 应该如何实施?
- 在满足相关条件的情况下,AWS 可以提供支持(详情请咨询贵公司 AWS 负责人)。由于所有资料均已公开,您也可以参考组织者指南,自行在内部开展活动。
- 使用 ML Enablement Workshop 是否需要付费或获得许可?
- 不需要。该资料已在 GitHub 上以开源形式发布,您可以在许可证范围内免费使用。不过,禁止除 AWS 以外的个人或法人以“ML Enablement Workshop”或与其相似的名称举办研讨会。此举旨在避免客户混淆,请予以理解。
- AWS 的服务与本次研讨会无关吗?
- 在最新版本的研讨会上,必须使用 AI 编码助手,AWS 推荐使用 Amazon Q Developer CLI。
- AWS 为何要开发和改进 ML Enablement Workshop?
- 目的是为了扩大 AI/ML 在生产环境中的应用。这不仅有利于客户,对 AWS 来说,在生产环境中推广其 AI/ML 服务也是业务扩展的关键。
- 特别是在日本,能够主导基于数据的策划和业务改进的人才仅占约 20%,仅为美国的三分之一左右;即使是初创企业,也只有约一成的企业因技术革新而考虑产品转型。这种差距是导致日本 AI 应用效果仅为美国七分之一、初创企业成长速度仅为美国三十分之一的主要原因。感兴趣的朋友还可以参阅以下资料:
- 为什么日本的 AI 应用效果仅为美国七分之一?:📹视频
- 面对日本初创企业成长速度仅为美国三十分之一的现状,数据科学家能做些什么?
- 是否可以将 ML Enablement Workshop 作为推动 AI/ML 应用的内部学习会来开展?
- 不可以。ML Enablement Workshop 是一个用于制定行动计划的研讨会,而非培训课程。在实施时,您需要选定特定的产品或产品功能。
- 探讨促进产品增长的生成式 AI 使用场景研讨会 是一个可在 2–3 小时内完成使用场景构思与验证的程序。更多详细信息请参阅附加内容。
外部演讲资料
- 融入其中的广播节目
- 在播客中分享了ML赋能工作坊的开发背景及所获得的洞见。
- 如何打造能够产出高价值机器学习产品的团队 Part1
- 如何打造能够产出高价值机器学习产品的团队 Part2
- 何时以及如何对大规模语言模型进行微调
- 该幻灯片讲解了为何在利用生成式AI推动产品增长时需要进行微调,以及应采取怎样的步骤。介绍了业务、开发和机器学习三个阶段的流程,并作为业务阶段的支持手段,推荐了ML赋能工作坊。
- 游戏行业中生成式AI的应用
- 这是一篇汇总了游戏行业应用生成式AI的案例及应用要点的演讲稿。
- 引领产品增长的生成式AI应用战略
- 该资料讲解了如何从短期的生成式AI试用,逐步制定出能够实现长期产品差异化的发展战略。基于生成式AI的应用案例,针对业务、开发和机器学习三个阶段分别阐述了关键点。
改进建议
我们欢迎关于动手实践内容的建议与问题!请事先阅读一下贡献指南,我们将不胜感激。
- 提交建议/问题报告的链接(Issue)
- 提交内容改进/修复补丁的链接(Pull Request)
- 如有疑问:GitHub讨论区
- 安全相关事宜:贡献指南
许可证
版本历史
v3.1.02025/10/10v3.0.12025/09/08v3.0.02025/09/02v2.1.02025/09/02v2.0.02025/09/021.1.02023/10/091.0.02023/04/03常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器




























