[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-owainlewis--awesome-artificial-intelligence":3,"tool-owainlewis--awesome-artificial-intelligence":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",148568,2,"2026-04-09T23:34:24",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108111,"2026-04-08T11:23:26",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":77,"owner_email":78,"owner_twitter":72,"owner_website":79,"owner_url":80,"languages":81,"stars":82,"forks":83,"last_commit_at":84,"license":85,"difficulty_score":86,"env_os":87,"env_gpu":88,"env_ram":88,"env_deps":89,"category_tags":92,"github_topics":93,"view_count":32,"oss_zip_url":81,"oss_zip_packed_at":81,"status":17,"created_at":105,"updated_at":106,"faqs":107,"releases":143},6163,"owainlewis\u002Fawesome-artificial-intelligence","awesome-artificial-intelligence","A curated list of Artificial Intelligence (AI) courses, books, video lectures and papers.","awesome-artificial-intelligence 是一份精心策划的开源资源清单，旨在为构建和部署人工智能系统提供“必读、必用”的核心指南。面对 AI 领域技术迭代快、资料碎片化的痛点，它帮助开发者从海量信息中筛选出真正具有长期价值的内容，涵盖从理论基础到工程落地的全链路知识。\n\n这份清单特别适合 AI 工程师、技术负责人及希望深入理解大模型应用的研究人员使用。其独特亮点在于不仅收录了经典的学术教材与前沿论文，更聚焦于\"AI 工程化”实战，详细整理了关于 RAG（检索增强生成）、智能体（Agents）架构、系统评估及安全护栏等关键领域的最佳实践。无论是 Chip Huyen 关于机器学习系统设计的权威著作，还是 Anthropic、Google 发布的智能体构建指南，亦或是 PocketFlow、LangGraph 等轻量级框架，这里都提供了经过验证的高质量入口。对于想要避开营销噪音、扎实掌握生产级 AI 系统构建方法的专业人士而言，awesome-artificial-intelligence 是一座值得信赖的知识宝库。","# Awesome Artificial Intelligence\n\nA curated collection of **must-use, actively maintained resources** for building and shipping AI systems.  \n\nFocus: **AI engineering** (RAG, agents, evals, guardrails, deploy) plus the best books, guides, papers, and a *carefully selected* set of tools.\n\n![](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fowainlewis_awesome-artificial-intelligence_readme_40c555f302f9.gif)\n\n---\n\n## 🏛 Core Resources (Evergreen)\n\n_The foundations — these will still be valuable five years from now, even if today’s tools are gone._\n\n### 📚 Books\n**Modern & Practical**\n- [Designing Machine Learning Systems](https:\u002F\u002Fwww.oreilly.com\u002Flibrary\u002Fview\u002Fdesigning-machine-learning\u002F9781098107956\u002F) — Scalable, maintainable ML pipelines (Chip Huyen).\n- [Generative Deep Learning (2nd Edition)](https:\u002F\u002Fwww.oreilly.com\u002Flibrary\u002Fview\u002Fgenerative-deep-learning\u002F9781098134174\u002F) — GANs, VAEs, diffusion models (David Foster).\n- [AI Engineering](https:\u002F\u002Fwww.oreilly.com\u002Flibrary\u002Fview\u002Fai-engineering\u002F9781098166298\u002F) — End-to-end AI product building (Chip Huyen).\n- [100 Page Language Models Book](https:\u002F\u002Fwww.thelmbook.com\u002F) — This book guides you through the evolution of language models, starting from machine learning fundamentals.\n\n**Foundational**\n- [Artificial Intelligence: A Modern Approach](https:\u002F\u002Faima.cs.berkeley.edu\u002F) — Comprehensive AI theory (Russell & Norvig).\n- [Deep Learning](https:\u002F\u002Fwww.deeplearningbook.org\u002F) — Neural networks & architectures (Goodfellow, Bengio, Courville).\n- [Reinforcement Learning: An Introduction (2nd Edition)](https:\u002F\u002Fweb.stanford.edu\u002Fclass\u002Fpsych209\u002FReadings\u002FSuttonBartoIPRLBook2ndEd.pdf) — RL fundamentals (Sutton & Barto).\n\n---\n\n### 🏗 AI Engineering\n_Frameworks and design patterns for building robust, production-grade AI systems._  \n_Personal note: you don't need tons of frameworks — start with simple LLM calls and work up._\n\n#### 📖 Guides & Playbooks\n- **[Building Effective Agents (Anthropic)](https:\u002F\u002Fwww.anthropic.com\u002Fengineering\u002Fbuilding-effective-agents)** — ⭐ Patterns, pitfalls, and tradeoffs for designing AI agents.\n- [OpenAI Agents Guide](https:\u002F\u002Fcdn.openai.com\u002Fbusiness-guides-and-resources\u002Fa-practical-guide-to-building-agents.pdf) — Practical guide on building agents\n- [Google AI Agents Paper](https:\u002F\u002Fwww.kaggle.com\u002Fwhitepaper-agents) - Practical guide to building AI agents from Google\n- [Google Agents Companion Paper](https:\u002F\u002Fwww.kaggle.com\u002Fwhitepaper-agent-companion) - Guide from Google\n- [OpenAI Cookbook](https:\u002F\u002Fcookbook.openai.com\u002F) — Example code, recipes, and best practices for working with OpenAI APIs.\n- [LLM Engineer Handbook](https:\u002F\u002Fgithub.com\u002FSylphAI-Inc\u002FLLM-engineer-handbook) — A goldmine of useful links for AI engineers\n\n#### 🤖 Frameworks \n- [PocketFlow](https:\u002F\u002Fthe-pocket.github.io\u002FPocketFlow\u002F) — Extremely minimalist AI agent framework in just 100 lines of code. Fantastic way to learn.\n- [Google ADK](https:\u002F\u002Fgoogle.github.io\u002Fadk-docs\u002F) — Google's Agent Development Kit (Python, Java). Great local development experience + A2A + MCP.\n- [Pydantic-AI](https:\u002F\u002Fai.pydantic.dev\u002F) — Typed, structured LLM orchestration framework built on Pydantic models for safe, predictable outputs.\n- [LangGraph](https:\u002F\u002Fwww.langchain.com\u002Flanggraph) — Build multi-agent workflows with stateful graphs on top of LangChain.\n- [CrewAI](https:\u002F\u002Fwww.crewai.com\u002F) — Agent orchestration with structured tasks and human-in-the-loop controls.\n- [AutoGen](https:\u002F\u002Fmicrosoft.github.io\u002Fautogen\u002F) — Microsoft’s framework for multi-agent conversation and collaboration.\n\n#### 📦 Retrieval-Augmented Generation (RAG)\n- [LlamaIndex](https:\u002F\u002Fwww.llamaindex.ai\u002F) — Data framework for ingesting, indexing, and querying private data with LLMs.\n- [Haystack](https:\u002F\u002Fhaystack.deepset.ai\u002F) — Open-source search\u002FRAG framework with modular pipelines.\n- [Docling](https:\u002F\u002Fgithub.com\u002Fdocling-project\u002Fdocling) — Great library for ingesting any kind of document for RAG ⭐\n\n#### Evals \n\n- [OpenAI Evals](https:\u002F\u002Fgithub.com\u002Fopenai\u002Fevals) — OpenAI's framework for writing evals\n\n---\n\n### 📄 Landmark Papers\n_Research that shaped modern AI — worth reading to understand the \"why\" behind today’s architectures._\n- [Attention Is All You Need](https:\u002F\u002Farxiv.org\u002Fabs\u002F1706.03762) — Transformer architecture.\n- [Scaling Laws for Neural Language Models](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.08361) — Model\u002Fdata\u002Fcompute scaling.\n- [Language Models are Few-Shot Learners](https:\u002F\u002Farxiv.org\u002Fabs\u002F2005.14165) — GPT-3 capabilities.\n- [Constitutional AI](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.08073) — Safer model alignment.\n\n---\n\n## 🎓 Courses\n_Learn from the best — structured content for every level._\n\n**Beginner**\n- [Google Generative AI Learning Path](https:\u002F\u002Fwww.cloudskillsboost.google\u002Fpaths\u002F118)\n- [Hugging Face LLM Course](https:\u002F\u002Fhuggingface.co\u002Flearn\u002Fllm-course\u002Fchapter1\u002F1)\n- [Fast.ai — Practical Deep Learning](https:\u002F\u002Fcourse.fast.ai\u002F)\n\n**Intermediate \u002F Advanced**\n- [Stanford CS324: Large Language Models](https:\u002F\u002Fstanford-cs324.github.io\u002Fwinter2022\u002F)\n- [Full Stack Deep Learning](https:\u002F\u002Ffullstackdeeplearning.com\u002F)\n- [MIT 6.S191: Intro to Deep Learning](https:\u002F\u002Fintrotodeeplearning.com\u002F)\n\n**Focused**\n- [DeepLearning.AI Short Courses](https:\u002F\u002Flearn.deeplearning.ai\u002F)\n- [Google Deepmind| Introduction to Reinforcement Learning](https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ)\n- [Karpathy’s LLM Zero-to-Hero](https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ)\n- [Neural Nets - Zero-to-Hero](https:\u002F\u002Fwww.youtube.com\u002Fplaylist?list=PLAqhIrjkxbuWI23v9cThsA9GvCAUhRvKZ)\n\n---\n\n## 📰 Newsletters\n_Stay current with AI developments without drowning in noise._\n- [The Rundown AI](https:\u002F\u002Fwww.therundown.ai\u002F)\n- [AlphaSignal](https:\u002F\u002Falphasignal.ai\u002F)\n- [Superhuman AI](https:\u002F\u002Fwww.superhuman.ai\u002F)\n- [AI Engineer](https:\u002F\u002Fnewsletter.owainlewis.com)\n\n## ⚡ Tools\n\nTools for building and deploying AI applications. \n\n### 💬 Models\n- [ChatGPT](https:\u002F\u002Fopenai.com\u002Fchatgpt\u002Foverview\u002F) — Best for general coding + reasoning.\n- [Claude](https:\u002F\u002Fwww.anthropic.com\u002Fclaude) — Best for long-context analysis and structured thinking.\n- [Gemini](https:\u002F\u002Fgemini.google.com\u002F) — Best for Google ecosystem integration.\n- [Perplexity](https:\u002F\u002Fwww.perplexity.ai\u002F) — Best for quick research with live citations.\n- [Cohere](https:\u002F\u002Fcohere.com\u002F) — Best for enterprise LLMs with strong retrieval-augmented generation APIs.\n- [Mistral](https:\u002F\u002Fmistral.ai\u002F) — Best for lightweight, high-performance open-weight models.\n- [Qwen](https:\u002F\u002Fqwenlm.github.io\u002F) — Best for multilingual and Chinese-first applications.\n- [DeepSeek](https:\u002F\u002Fdeepseek.com\u002F) — Best for efficient, cost-optimized large models with competitive reasoning.\n  \n### 👨‍💻 Code & Developer Tools\n- [Claude Code](https:\u002F\u002Fwww.anthropic.com\u002Fclaude) — IDE extensions with long-context code edits.\n- [GitHub Copilot](https:\u002F\u002Fgithub.com\u002Ffeatures\u002Fcopilot) — In-IDE code completion, chat, and refactors.\n- [Cursor](https:\u002F\u002Fcursor.sh\u002F) — LLM-powered IDE for multi-file edits and codebase-aware chat.\n  \n### 🎨 Multimedia AI Tools\n\n#### 🖼 Image\n- [ChatGPT-4o Image Generation](https:\u002F\u002Fopenai.com\u002Fchatgpt) — Integrated image creation with style control.\n- [Midjourney](https:\u002F\u002Fwww.midjourney.com\u002F) — Artistic and photorealistic images and video.\n- [Adobe Firefly](https:\u002F\u002Fwww.adobe.com\u002Fsensei\u002Fgenerative-ai\u002Ffirefly.html) — Integrated into Creative Cloud.\n- [Ideogram](https:\u002F\u002Fideogram.ai\u002F) — Precise, legible text in generated images.\n- [Flux](https:\u002F\u002Fblackforestlabs.ai\u002F) — High-res, prompt-editable images.\n\n#### 🎥 Video\n- [Kling](https:\u002F\u002Fklingai.com\u002F) — Cinematic, realistic video generation.\n- [Google Veo 3](https:\u002F\u002Fdeepmind.google\u002Ftechnologies\u002Fveo\u002F) — High-quality video with synchronized audio.\n- [Runway](https:\u002F\u002Frunwayml.com\u002F) — Video editing + generation.\n\n#### 🎙 Audio\n- [ElevenLabs](https:\u002F\u002Felevenlabs.io\u002F) — High-quality text-to-speech.\n- [Suno](https:\u002F\u002Fsuno.ai\u002F) — AI music from text prompts.\n- [Aiva](https:\u002F\u002Fwww.aiva.ai\u002F) — Music composition for media.\n\n---\n","# 超棒的人工智能\n\n一个精心挑选的、**必用且持续维护的资源集合**，用于构建和部署人工智能系统。\n\n重點：**AI工程**（RAG、代理、評估、安全防護、部署）以及最佳書籍、指南、論文和一組*精選工具*。\n\n![](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fowainlewis_awesome-artificial-intelligence_readme_40c555f302f9.gif)\n\n---\n\n## 🏛 核心資源（永續）\n\n_這些是基礎——即使今天的工具不再存在，五年後仍然會很有價值。_\n\n### 📚 書籍\n**現代且實用**\n- 《設計機器學習系統》 — 可擴展、易維護的機器學習管道（Chip Huyen）。\n- 《生成式深度學習（第二版）》 — GAN、VAE、擴散模型（David Foster）。\n- 《AI工程》 — 端到端AI產品開發（Chip Huyen）。\n- 《100頁語言模型書》 — 本書帶你了解語言模型的演進，從機器學習基礎開始。\n\n**基礎性**\n- 《人工智能：一種現代方法》 — 全面的人工智能理論（Russell & Norvig）。\n- 《深度學習》 — 神經網絡與架構（Goodfellow, Bengio, Courville）。\n- 《強化學習：導論（第二版）》 — 強化學習基礎（Sutton & Barto）。\n\n---\n\n### 🏗 AI工程\n_用於構建健壯、生產級別AI系統的框架與設計模式。_  \n_個人建議：並不需要大量框架——從簡單的LLM調用開始，逐步提升。_\n\n#### 📖 指南與操作手冊\n- **[打造高效代理（Anthropic）](https:\u002F\u002Fwww.anthropic.com\u002Fengineering\u002Fbuilding-effective-agents)** — ⭐ 設計AI代理的模式、陷阱與權衡。\n- 《OpenAI代理指南》 — 建立代理的實用指南。\n- 《Google AI代理論文》 - Google提供的AI代理實用指南。\n- 《Google代理伴侶論文》 - Google提供的指南。\n- 《OpenAI Cookbook》 — 使用OpenAI API的示例代碼、配方及最佳實踐。\n- 《LLM工程手冊》 — 對AI工程師極具價值的鏈接寶庫。\n\n#### 🤖 框架 \n- 《PocketFlow》 — 精簡至100行代碼的極簡AI代理框架，是學習的絕佳方式。\n- 《Google ADK》 — Google的代理開發套件（Python、Java）。本地開發體驗優異，支援A2A與MCP。\n- 《Pydantic-AI》 — 基於Pydantic模型的類型化、結構化LLM協調框架，確保輸出安全且可預測。\n- 《LangGraph》 — 在LangChain之上，利用狀態圖構建多代理工作流。\n- 《CrewAI》 — 提供結構化任務與人為介入控制的代理協調工具。\n- 《AutoGen》 — Microsoft推出的多代理對話與協作框架。\n\n#### 📦 檢索增強生成（RAG）\n- 《LlamaIndex》 — 用於攝取、索引和查詢私有數據的LLM數據框架。\n- 《Haystack》 — 開源搜索\u002FRAG框架，具有模塊化管道。\n- 《Docling》 — 非常適合用於RAG的任何文檔攝取庫 ⭐\n\n#### 評估 \n\n- 《OpenAI Evals》 — OpenAI的評估框架。\n\n---\n\n### 📄 標誌性論文\n_塑造現代AI的研究——值得閱讀，以理解當今架構背後的「為什麼」。_\n- 《注意力就是一切》 — Transformer架構。\n- 《神經語言模型的規模定律》 — 模型、數據與運算規模的關係。\n- 《語言模型是少樣本學習者》 — GPT-3的能力。\n- 《憲法式AI》 — 更安全的模型對齊方法。\n\n---\n\n## 🎓 課程\n_向最優秀的專家學習——適合各個水平的結構化內容。_\n\n**初學者**\n- 《Google生成式AI學習路徑》\n- 《Hugging Face LLM課程》\n- 《Fast.ai—實用深度學習》\n\n**中高級**\n- 《史丹福CS324：大型語言模型》\n- 《全棧深度學習》\n- 《MIT 6.S191：深度學習入門》\n\n**專注領域**\n- 《DeepLearning.AI短課程》\n- 《Google Deepmind| 強化學習入門》\n- 《Karpathy的LLM從零到英雄》\n- 《神經網路—從零到英雄》\n\n---\n\n## 📰 新聞通訊\n_在不被噪音淹沒的情況下，隨時掌握AI發展動態。_\n- 《The Rundown AI》\n- 《AlphaSignal》\n- 《Superhuman AI》\n- 《AI Engineer》\n\n## ⚡ 工具\n\n用於構建和部署AI應用程序的工具。\n\n### 💬 模型\n- 《ChatGPT》 — 最適合通用編碼與推理。\n- 《Claude》 — 最適合長上下文分析與結構化思考。\n- 《Gemini》 — 最適合與Google生態系統整合。\n- 《Perplexity》 — 最適合快速研究並附帶即時引用。\n- 《Cohere》 — 最適合企業級LLM，擁有強大的檢索增強生成API。\n- 《Mistral》 — 最適合輕量級、高性能的開源模型。\n- 《Qwen》 — 最適合多語言及以中文為主的應用。\n- 《DeepSeek》 — 最適合高效、成本優化的大型模型，推理能力具競爭力。\n\n### 👨‍💻 編碼與開發工具\n- 《Claude Code》 — 具有長上下文代碼編輯功能的IDE擴展。\n- 《GitHub Copilot》 — IDE內的代碼補全、聊天與重構功能。\n- 《Cursor》 — 基於LLM的IDE，可用於多文件編輯及代碼庫感知聊天。\n\n### 🎨 多媒体 AI 工具\n\n#### 🖼 图像\n- [ChatGPT-4o 图像生成](https:\u002F\u002Fopenai.com\u002Fchatgpt) — 集成图像创作，支持风格控制。\n- [Midjourney](https:\u002F\u002Fwww.midjourney.com\u002F) — 创作艺术风及照片级逼真图像与视频。\n- [Adobe Firefly](https:\u002F\u002Fwww.adobe.com\u002Fsensei\u002Fgenerative-ai\u002Ffirefly.html) — 集成于 Creative Cloud。\n- [Ideogram](https:\u002F\u002Fideogram.ai\u002F) — 在生成图像中实现精准、易读的文本。\n- [Flux](https:\u002F\u002Fblackforestlabs.ai\u002F) — 高分辨率、可编辑提示词的图像。\n\n#### 🎥 视频\n- [Kling](https:\u002F\u002Fklingai.com\u002F) — 创作电影级、逼真的视频。\n- [Google Veo 3](https:\u002F\u002Fdeepmind.google\u002Ftechnologies\u002Fveo\u002F) — 高质量视频，附带同步音频。\n- [Runway](https:\u002F\u002Frunwayml.com\u002F) — 视频编辑与生成一体化。\n\n#### 🎙 音频\n- [ElevenLabs](https:\u002F\u002Felevenlabs.io\u002F) — 高品质文本转语音。\n- [Suno](https:\u002F\u002Fsuno.ai\u002F) — 根据文本提示生成AI音乐。\n- [Aiva](https:\u002F\u002Fwww.aiva.ai\u002F) — 为媒体创作音乐。 \n\n---","# Awesome Artificial Intelligence 快速上手指南\n\n`awesome-artificial-intelligence` 并非一个单一的可安装软件包，而是一个精选的**人工智能工程资源清单**。它汇集了构建和部署 AI 系统所需的书籍、框架、论文、课程及工具。本指南将帮助你快速筛选核心资源并搭建开发环境。\n\n## 环境准备\n\n由于该清单涵盖多个独立的开源框架（如 LangGraph, LlamaIndex, AutoGen 等），你需要准备通用的 Python 开发环境。\n\n### 系统要求\n- **操作系统**: Linux, macOS 或 Windows (推荐 WSL2)\n- **Python 版本**: Python 3.10 或更高版本 (大多数现代 AI 框架已不再支持 Python 3.9 及以下)\n- **硬件**: \n  - 基础学习：任意现代 CPU，8GB+ 内存\n  - 本地模型运行\u002F微调：推荐 NVIDIA GPU (显存 8GB+)\n\n### 前置依赖\n建议先安装基础工具链：\n```bash\n# 检查 Python 版本\npython --version\n\n# 安装 pip 包管理器的增强工具\npip install --upgrade pip setuptools wheel\n\n# 安装虚拟环境管理工具 (推荐 uv 或 venv)\n# 使用 uv (更快，推荐):\ncurl -LsSf https:\u002F\u002Fastral.sh\u002Fuv\u002Finstall.sh | sh\n# 或使用标准库:\npython -m venv ai-env\n```\n\n## 安装步骤\n\n你不需要“安装”整个清单，而是根据需求选择具体的框架进行安装。以下是针对清单中推荐的几个核心框架的安装命令。\n\n**注意**：国内开发者建议使用清华源或阿里源加速下载。\n\n### 1. 创建并激活虚拟环境\n```bash\n# 如果使用 uv\nuv venv ai-env\nsource ai-env\u002Fbin\u002Factivate  # Windows: ai-env\\Scripts\\activate\n\n# 如果使用标准 venv\npython -m venv ai-env\nsource ai-env\u002Fbin\u002Factivate  # Windows: ai-env\\Scripts\\activate\n```\n\n### 2. 安装核心框架 (按需选择)\n\n#### 方案 A：轻量级代理框架 (PocketFlow)\n适合初学者理解 Agent 原理。\n```bash\npip install pocketflow -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n#### 方案 B：企业级代理编排 (LangGraph \u002F CrewAI)\n适合构建复杂的多代理工作流。\n```bash\n# 安装 LangGraph (基于 LangChain)\npip install langgraph langchain-core langchain-openai -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n\n# 或安装 CrewAI\npip install crewai crewai-tools -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n#### 方案 C：RAG 数据框架 (LlamaIndex)\n适合构建私有知识库问答系统。\n```bash\npip install llama-index llama-index-llms-openai -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n#### 方案 D：类型安全的 LLM 编排 (Pydantic-AI)\n适合需要严格输出结构的场景。\n```bash\npip install pydantic-ai -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n```\n\n## 基本使用\n\n以下以清单中推荐的 **PocketFlow** (极简主义) 和 **LangGraph** (生产级) 为例，展示如何快速启动一个最简单的 AI 应用。\n\n### 示例 1：使用 PocketFlow 构建最小 Agent\n这是一个仅用几行代码即可运行的示例，用于理解 Agent 的基本循环。\n\n```python\nfrom pocketflow import Node, Flow\n\n# 定义一个简单的节点\nclass HelloNode(Node):\n    def action(self, state):\n        print(\"Hello from PocketFlow!\")\n        return state\n\n# 创建流程并运行\nflow = Flow()\nflow.add_node(HelloNode())\nflow.run({})\n```\n\n### 示例 2：使用 LangGraph 构建状态化工作流\n这是构建生产级多步代理的基础模式。\n\n```python\nfrom typing import Annotated, TypedDict\nfrom langgraph.graph import StateGraph, START, END\nfrom langgraph.graph.message import add_messages\n\n# 定义状态结构\nclass State(TypedDict):\n    messages: Annotated[list, add_messages]\n\n# 定义节点函数\ndef call_model(state: State):\n    # 此处通常调用 LLM API，示例中仅打印\n    print(\"Processing messages...\")\n    return {\"messages\": [\"AI response\"]}\n\n# 构建图\nbuilder = StateGraph(State)\nbuilder.add_node(\"agent\", call_model)\nbuilder.add_edge(START, \"agent\")\nbuilder.add_edge(\"agent\", END)\n\ngraph = builder.compile()\n\n# 运行\nresult = graph.invoke({\"messages\": [(\"user\", \"Hello\")]})\nprint(result)\n```\n\n### 下一步建议\n1. **阅读核心文档**：访问清单中列出的 [Building Effective Agents (Anthropic)](https:\u002F\u002Fwww.anthropic.com\u002Fengineering\u002Fbuilding-effective-agents) 了解设计模式。\n2. **深入学习**：参考 Chip Huyen 的《Designing Machine Learning Systems》或《AI Engineering》书籍建立系统工程思维。\n3. **关注前沿**：订阅 `The Rundown AI` 或 `AI Engineer` 通讯以保持技术敏感度。","某初创团队正急于构建一款基于私有文档的企业级 AI 客服助手，需要在两周内完成从技术选型到原型上线的全过程。\n\n### 没有 awesome-artificial-intelligence 时\n- **资源筛选耗时巨大**：团队成员在 GitHub 和谷歌上盲目搜索\"RAG 框架”或\"Agent 教程”，被大量过时、低星或缺乏维护的仓库淹没，难以辨别优劣。\n- **技术路线摇摆不定**：由于缺乏权威的工程指南，团队在 LangChain、AutoGen 等框架间反复横跳，甚至试图从零手写代理逻辑，导致架构设计频繁推倒重来。\n- **忽视关键工程环节**：专注于模型调用而忽略了评估（Evals）和安全护栏（Guardrails），直到演示前夕才发现输出结果不可控且无法量化效果。\n- **理论基础薄弱**：遇到复杂的检索失败案例时，因未系统阅读过《Designing Machine Learning Systems》等经典著作，只能凭直觉修补，无法根治数据流水线问题。\n\n### 使用 awesome-artificial-intelligence 后\n- **直达核心生产级资源**：直接采纳列表中精选的 LlamaIndex 处理文档摄入，利用 Docling 解析复杂 PDF，瞬间锁定了当前最稳健的 RAG 技术栈。\n- **复用成熟代理模式**：参考 Anthropic 的《Building Effective Agents》指南和 PocketFlow 极简示例，快速搭建了状态可控的多智能体工作流，避免了重复造轮子。\n- **建立标准化评估体系**：引入 OpenAI Evals 框架，在开发早期即建立了自动化测试集，确保每次迭代都能量化回答准确率与安全性。\n- **系统化知识赋能**：团队共读《AI Engineering》与《100 Page Language Models Book》，统一了对可扩展 ML 流水线的认知，高效解决了长尾报错问题。\n\nawesome-artificial-intelligence 通过提供经过严格筛选的“常青”资源，将团队从信息噪音中解放出来，使其能专注于构建高可用的 AI 产品而非寻找工具。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fowainlewis_awesome-artificial-intelligence_ea879df2.png","owainlewis","Owain Lewis","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fowainlewis_cb9d50ac.jpg","AI Engineer. Director, Engineering, OCI. ","Oracle","United Kingdom","owain@owainlewis.com","https:\u002F\u002Fowainlewis.com","https:\u002F\u002Fgithub.com\u002Fowainlewis",null,13286,2165,"2026-04-10T02:41:34","MIT",1,"","未说明",{"notes":90,"python":88,"dependencies":91},"该仓库（awesome-artificial-intelligence）是一个精选的资源列表（包含书籍、指南、论文、课程和工具链接），而非一个可直接运行的单一软件或框架。因此，README 中不包含具体的操作系统、GPU、内存、Python 版本或依赖库的安装要求。具体的环境需求取决于用户从列表中选择并实际部署的特定工具（如 LangGraph, LlamaIndex, AutoGen 等）或模型。",[],[14,15,13],[94,95,96,97,98,99,100,101,102,103,104],"machine-learning","machine-intelligence","artificial-intelligence","reinforcement-learning","intelligent-systems","deep-learning","intelligent-machines","ai","statistical-learning","unsupervised-learning","neural-network","2026-03-27T02:49:30.150509","2026-04-10T15:54:55.693223",[108,113,118,123,128,133,138],{"id":109,"question_zh":110,"answer_zh":111,"source_url":112},27914,"该仓库使用什么许可证？","该仓库已添加许可证。参考了 awesome 列表的标准规范，通常采用 CC0 或其他开源友好许可证，以确保内容的自由传播和使用。","https:\u002F\u002Fgithub.com\u002Fowainlewis\u002Fawesome-artificial-intelligence\u002Fissues\u002F8",{"id":114,"question_zh":115,"answer_zh":116,"source_url":117},27913,"如何提名视频、播客或多媒体资源加入列表？","您可以直接在 Issue 中提出建议并提供链接（例如 Sam Harris 与 Joe Rogan 关于 AI 的视频讨论）。维护者在评估后会将其添加到列表中。如果不确定内容是否合适，可以先发起讨论。","https:\u002F\u002Fgithub.com\u002Fowainlewis\u002Fawesome-artificial-intelligence\u002Fissues\u002F10",{"id":119,"question_zh":120,"answer_zh":121,"source_url":122},27908,"发现列表中的资源链接失效（404 错误）该怎么办？","如果您发现链接失效，可以提交 Pull Request (PR) 进行修复。社区成员通常会提供更新后的可用链接。例如，当 Prolog\u002FLisp\u002FJava 相关资源的 Dropbox 链接失效时，用户提供了新的替代链接：http:\u002F\u002Fwww.cs.fsu.edu\u002F~cap5605\u002FLuger_0136070477_1.pdf 。维护者会合并这些更改以更新底层链接。","https:\u002F\u002Fgithub.com\u002Fowainlewis\u002Fawesome-artificial-intelligence\u002Fissues\u002F31",{"id":124,"question_zh":125,"answer_zh":126,"source_url":127},27909,"有哪些推荐的 AI 编程竞赛或挑战平台？","列表中已收录多个让 AI 相互竞争或协作的编程竞赛平台，包括：Battlecode (每年举办一次)、Hello World Open、AI Challenge 以及 The AI Games。如果您知道其他优秀的竞赛平台，也欢迎提交 PR 添加。","https:\u002F\u002Fgithub.com\u002Fowainlewis\u002Fawesome-artificial-intelligence\u002Fissues\u002F11",{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},27910,"如何向该项目贡献内容？是否有严格的指南？","该项目目前没有特别繁琐的贡献指南。维护者表示不需要过于拘谨，直接提交 Pull Request (PR) 即可。只要内容相关且质量合格，通常都会被接受。","https:\u002F\u002Fgithub.com\u002Fowainlewis\u002Fawesome-artificial-intelligence\u002Fissues\u002F9",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},27911,"是否有关于人工智能主题的电影推荐列表？","是的，社区认为电影与哲学类似，能引发对 AI 的思考。项目已接受建议并添加了以 AI 为核心焦点的电影列表（如《机械姬》等）。如果您有推荐的电影，可以通过提交 PR 将其加入列表。","https:\u002F\u002Fgithub.com\u002Fowainlewis\u002Fawesome-artificial-intelligence\u002Fissues\u002F12",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},27912,"为什么某些自动提交的商业推广内容会被拒绝？","由自动化代理（automated agent）提交的商业情报工具或推广内容通常不适合该仓库，会被直接关闭。该项目主要关注教育资源、库和代码，而非实时的商业分析服务或新闻通讯。","https:\u002F\u002Fgithub.com\u002Fowainlewis\u002Fawesome-artificial-intelligence\u002Fissues\u002F187",[]]