[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-HazyResearch--meerkat":3,"tool-HazyResearch--meerkat":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",160015,2,"2026-04-18T11:30:52",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",109154,"2026-04-18T11:18:24",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":72,"owner_avatar_url":73,"owner_bio":74,"owner_company":75,"owner_location":75,"owner_email":76,"owner_twitter":75,"owner_website":77,"owner_url":78,"languages":79,"stars":113,"forks":114,"last_commit_at":115,"license":116,"difficulty_score":32,"env_os":117,"env_gpu":118,"env_ram":117,"env_deps":119,"category_tags":130,"github_topics":132,"view_count":32,"oss_zip_url":75,"oss_zip_packed_at":75,"status":17,"created_at":138,"updated_at":139,"faqs":140,"releases":176},9262,"HazyResearch\u002Fmeerkat","meerkat","Explore and understand your training and validation data.","Meerkat 是一款开源 Python 库，旨在帮助开发者轻松探索、可视化并标注训练与验证数据。它特别擅长处理文本、图像、视频、PDF 等非结构化数据，解决了传统工具在管理复杂多模态数据集时流程繁琐、难以直观理解的痛点。\n\n无论是机器学习研究员还是数据工程师，都能通过 Meerkat 快速构建交互式数据视图。其核心优势在于“低开销”与“高智能”：用户仅需几行代码即可无缝对接 Pandas、Arrow 或 Hugging Face 等现有数据格式，无需将数据上传至外部数据库或进行格式转换，真正实现了“数据在哪里，就在哪里操作”。\n\n此外，Meerkat 的独特之处在于能将机器学习模型（如大语言模型或 CLIP）直接嵌入交互界面。这使得用户不仅能查看数据，还能利用模型能力进行智能搜索、自动分组和语义匹配。其组件化设计类似 Seaborn，既支持声明式快速绘图，又允许无限定制与组合，让用户能灵活搭建符合特定需求的数据分析看板，从而更高效地洞察数据特征，优化模型表现。","\u003Cdiv align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_042941c3fd08.png\" height=100 alt=\"Meerkat logo\"\u002F>\n\n---\n\n\u003C!-- ![GitHub Workflow Status](https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Factions\u002Fworkflows\u002F.github\u002Fworkflows\u002Fci.yml\u002Fbadge.svg) -->\n[![GitHub](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002FHazyResearch\u002Fmeerkat)](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002FHazyResearch\u002Fmeerkat)\n[![pre-commit](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpre--commit-enabled-brightgreen?logo=pre-commit&logoColor=white)](https:\u002F\u002Fgithub.com\u002Fpre-commit\u002Fpre-commit)\n\nCreate interactive views of any dataset.\n\n[**Website**](http:\u002F\u002Fmeerkat.wiki)\n| [**Quickstart**](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Fstart\u002Fquickstart-df.html)\n| [**Docs**](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Findex.html)\n| [**Contributing**](CONTRIBUTING.md)\n| [**Discord**](https:\u002F\u002Fdiscord.gg\u002Fpw8E4Q26Tq)\n| [**Blogpost**](https:\u002F\u002Fhazyresearch.stanford.edu\u002Fblog\u002F2023-03-01-meerkat)\n\n\u003C\u002Fdiv>\n\n\n## ⚡️ Quickstart\n\n```bash\npip install meerkat-ml\n```\n\u003C!-- \n> **_GPU Install_**: If you want to use Meerkat with a GPU, you will need to install PyTorch with GPU support. See [here](https:\u002F\u002Fpytorch.org\u002Fget-started\u002Flocally\u002F) for more details. -->\n\n\u003C!-- ```bash\npip install \"meerkat-ml @ git+https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat@clever-dev\"\n```  -->\n\u003C!-- \n> **_Optional Dependencies_**: some parts of Meerkat rely on optional dependencies e.g. audio processing may rely on utilities from `torchaudio`. See  -->\n\u003C!-- \nThen try one of our demos,\n\n```bash\nmk demo tutorial-image-gallery --copy\n```\n\nExplore the code for this demo in `tutorial-image-gallery.py`. To see a full list of demos, use `mk demo --help`.  -->\n\n**Next Steps**.\nCheck out our [Getting Started page](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Fstart\u002Fquickstart-df.html) and our [documentation](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Findex.html) to start building with Meerkat.\n\n## Why Meerkat?\n\nMeerkat is an open-source Python library that helps users visualize, explore, and annotate any dataset. It is especially useful when processing unstructured data types (_e.g._ free text, PDFs, images, video) with machine learning models. \n\n### ✏️ Features and Design Principles\n\nHere are four principles that inform Meerkat's design.\n\n**(1) Low overhead.**  With four lines of Python, start interacting with any dataset. \n- Zero-copy integrations with your preferred data abstractions: Pandas, Arrow, HF Datasets, Ibis, SQL.\n- Limited data movement. With Meerkat, you interact with your data where it already lives: no uploads to external databases and no reformatting.\n\n```python\nimport meerkat as mk\ndf = mk.from_csv(\"paintings.csv\")\ndf[\"image\"] = mk.files(\"image_url\")\ndf\n```\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_93765c1eb6fe.gif\" height=300 alt=\"Meerkat logo\"\u002F>\n\u003C\u002Fdiv>\n\n\n**(2) Diverse data types.** Visualize and annotate almost any data type in Meerkat interfaces: text, images, audio, video, MRI scans, PDFs, HTML, JSON. \n\n\u003Cdiv align=\"center\">\n\t\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_389d99d3aa62.gif\" height=300 alt=\"\"\u002F>\n\u003C\u002Fdiv>\n\n\n**(3) \"Intelligent\" user interfaces.** Meerkat makes it easy to embed **machine learning models** (e.g. LLMs) within user interfaces to enable intelligent functionality such as searching, grouping and autocomplete. \n\n```python\ndf[\"embedding\"] = mk.embed(df[\"img\"], engine=\"clip\")\nmatch = mk.gui.Match(df,\n\tagainst=\"embedding\",\n\tengine=\"clip\"\n)\nsorted_df = mk.sort(df,\n\tby=match.criterion.name,\n\tascending=False\n)\ngallery = mk.gui.Gallery(sorted_df)\nmk.gui.html.div([match, gallery])\n```\n\n\u003Cdiv align=\"center\">\n\t\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_d5391a259894.gif\" height=300 alt=\"Meerkat logo\"\u002F>\n\u003C\u002Fdiv>\n\n**(4) Declarative (think: Seaborn), but also infinitely customizable and composable.**\nMeerkat visualization components can be composed and customized to create new interfaces. \n\n```python\nplot = mk.gui.plotly.Scatter(df=plot_df, x=\"umap_1\", y=\"umap_2\",)\n\n@mk.gui.reactive\ndef filter(selected: list, df: mk.DataFrame):\n    return df[df.primary_key.isin(selected)]\n\nfiltered_df = filter(plot.selected, plot_df)\ntable = mk.gui.Table(filtered_df, classes=\"h-full\")\n\nmk.gui.html.flex([plot, table], classes=\"h-[600px]\") \n```\n\n\u003Cdiv align=\"center\">\n\t\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_92e0d34a438c.gif\" height=300 alt=\"Meerkat logo\"\u002F>\n\u003C\u002Fdiv>\n\n\n### ✨ Use cases where Meerkat shines\n- _Exploratory analysis over unstructured data types._ [Demo](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=a8FBT33QACQ)\n- _Spot-checking the behavior of large language models (e.g. GPT-3)._  [Demo](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=3ItA70qoe-o)\n- _Identifying systematic errors made by machine learning models._ [Demo](https:\u002F\u002Fyoutu.be\u002F4Kk_LZbNWNs)\n- _Rapid labeling of validation data._\n\n### 🤔 Use cases where Meerkat may not be the right fit\n\n- _Are you only working with structured data (e.g. numerical and categorical variables)?_ Popular data visualization libraries (_e.g._ [Seaborn](https:\u002F\u002Fseaborn.pydata.org\u002F), [Matplotlib](https:\u002F\u002Fmatplotlib.org\u002F)) are often sufficient. If you're looking for interactivity, [Plotly](https:\u002F\u002Fplotly.com\u002F) and [Streamlit](https:\u002F\u002Fstreamlit.io\u002F) work well with structured data. Meerkat is differentiated in how it visualizes unstructured data types: long-form text, PDFs, HTML, images, video, audio...  \n- _Are you trying to make a straightforward demo of a machine learning model (single input\u002Foutput, chatbot) and share with the world?_ [Gradio](https:\u002F\u002Fgradio.app\u002F) is likely a better fit! Though, if your demo involves visualizing lots of data, you may find Meerkat useful.\n- _Are you trying to manually label tens of thousands of data points?_  If you are looking for a data labeling tool to use with a labeling team, there are great open source labeling solutions designed for this (_e.g._ [LabelStudio](https:\u002F\u002Flabelstud.io\u002F)). In contrast, Meerkat is great fit for teams\u002Findividuals without access to a large labeling workforce who are using pretrained models (_e.g._ GPT-3) and need to label validation data or in-context examples.\n\n\n\n\n\u003C!-- Our goal is to make foundation models a more reliable\nsoftware abstraction for processing unstructured datasets.\n[Read our blogpost to learn more.](https:\u002F\u002Fhazyresearch.stanford.edu\u002Fblog\u002F2023-03-01-meerkat)\n -->\n\n\n\n## ✉️ About\n\nMeerkat is being built by Machine Learning PhD students in the [Hazy Research](https:\u002F\u002Fhazyresearch.stanford.edu) lab at Stanford. We're excited to build for a future where models will make it easier for teams to sift and reason through large volumes of unstructtured data effortlessly. \n\nPlease reach out to `kgoel [at] cs [dot] stanford [dot] edu, eyuboglu [at] stanford [dot] edu, and arjundd [at] stanford [dot] edu` if you would like to use Meerkat for a project, at your company or if you have any questions.\n","\u003Cdiv align=\"center\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_042941c3fd08.png\" height=100 alt=\"Meerkat logo\"\u002F>\n\n---\n\n\u003C!-- ![GitHub Workflow Status](https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Factions\u002Fworkflows\u002F.github\u002Fworkflows\u002Fci.yml\u002Fbadge.svg) -->\n[![GitHub](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002FHazyResearch\u002Fmeerkat)](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Flicense\u002FHazyResearch\u002Fmeerkat)\n[![pre-commit](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fpre--commit-enabled-brightgreen?logo=pre-commit&logoColor=white)](https:\u002F\u002Fgithub.com\u002Fpre-commit\u002Fpre-commit)\n\n为任何数据集创建交互式视图。\n\n[**官网**](http:\u002F\u002Fmeerkat.wiki)\n| [**快速入门**](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Fstart\u002Fquickstart-df.html)\n| [**文档**](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Findex.html)\n| [**贡献指南**](CONTRIBUTING.md)\n| [**Discord**](https:\u002F\u002Fdiscord.gg\u002Fpw8E4Q26Tq)\n| [**博客文章**](https:\u002F\u002Fhazyresearch.stanford.edu\u002Fblog\u002F2023-03-01-meerkat)\n\n\u003C\u002Fdiv>\n\n\n## ⚡️ 快速入门\n\n```bash\npip install meerkat-ml\n```\n\u003C!-- \n> **_GPU 安装_**: 如果您希望使用 GPU 运行 Meerkat，需要安装支持 GPU 的 PyTorch。更多详情请参阅 [这里](https:\u002F\u002Fpytorch.org\u002Fget-started\u002Flocally\u002F)。 -->\n\n\u003C!-- ```bash\npip install \"meerkat-ml @ git+https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat@clever-dev\"\n```  -->\n\u003C!-- \n> **_可选依赖_**: Meerkat 的某些功能依赖于可选的第三方库，例如音频处理可能需要 `torchaudio` 提供的工具。更多信息请参阅 -->\n\u003C!-- \n然后您可以尝试我们的一个示例：\n\n```bash\nmk demo tutorial-image-gallery --copy\n```\n\n您可以在 `tutorial-image-gallery.py` 中查看该示例的代码。要查看所有示例的列表，请运行 `mk demo --help`。  -->\n\n**下一步**。\n请访问我们的[入门页面](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Fstart\u002Fquickstart-df.html)和[文档](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Findex.html)，开始使用 Meerkat 构建您的项目。\n\n## 为什么选择 Meerkat？\n\nMeerkat 是一个开源的 Python 库，旨在帮助用户可视化、探索和标注任何类型的数据集。它在处理非结构化数据（如自由文本、PDF、图像、视频等）并将其用于机器学习模型时尤为有用。\n\n### ✏️ 特性与设计原则\n\n以下是指导 Meerkat 设计的四个核心原则。\n\n**(1) 低开销。** 仅需四行 Python 代码，即可开始与任何数据集进行交互。\n- 与您常用的数据抽象层零拷贝集成：Pandas、Arrow、HF Datasets、Ibis、SQL。\n- 数据移动最小化。使用 Meerkat，您可以直接在数据存储位置与其交互，无需上传到外部数据库或重新格式化数据。\n\n```python\nimport meerkat as mk\ndf = mk.from_csv(\"paintings.csv\")\ndf[\"image\"] = mk.files(\"image_url\")\ndf\n```\n\n\u003Cdiv align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_93765c1eb6fe.gif\" height=300 alt=\"Meerkat logo\"\u002F>\n\u003C\u002Fdiv>\n\n\n**(2) 多样化的数据类型。** 在 Meerkat 的界面中，几乎可以可视化和标注任何类型的数据：文本、图像、音频、视频、MRI 扫描、PDF、HTML、JSON 等。\n\n\u003Cdiv align=\"center\">\n\t\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_389d99d3aa62.gif\" height=300 alt=\"\"\u002F>\n\u003C\u002Fdiv>\n\n\n**(3) “智能”用户界面。** Meerkat 能够轻松地将**机器学习模型**（如 LLM）嵌入到用户界面中，从而实现智能功能，例如搜索、分组和自动补全。\n\n```python\ndf[\"embedding\"] = mk.embed(df[\"img\"], engine=\"clip\")\nmatch = mk.gui.Match(df,\n\tagainst=\"embedding\",\n\tengine=\"clip\"\n)\nsorted_df = mk.sort(df,\n\tby=match.criterion.name,\n\tascending=False\n)\ngallery = mk.gui.Gallery(sorted_df)\nmk.gui.html.div([match, gallery])\n```\n\n\u003Cdiv align=\"center\">\n\t\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_d5391a259894.gif\" height=300 alt=\"Meerkat logo\"\u002F>\n\u003C\u002Fdiv>\n\n**(4) 声明式（类似 Seaborn），同时无限可定制且可组合。**\nMeerkat 的可视化组件可以组合和定制，以创建全新的界面。\n\n```python\nplot = mk.gui.plotly.Scatter(df=plot_df, x=\"umap_1\", y=\"umap_2\",)\n\n@mk.gui.reactive\ndef filter(selected: list, df: mk.DataFrame):\n    return df[df.primary_key.isin(selected)]\n\nfiltered_df = filter(plot.selected, plot_df)\ntable = mk.gui.Table(filtered_df, classes=\"h-full\")\n\nmk.gui.html.flex([plot, table], classes=\"h-[600px]\") \n```\n\n\u003Cdiv align=\"center\">\n\t\u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_readme_92e0d34a438c.gif\" height=300 alt=\"Meerkat logo\"\u002F>\n\u003C\u002Fdiv>\n\n\n### ✨ Meerkat 的典型应用场景\n- _对非结构化数据进行探索性分析。_ [演示](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=a8FBT33QACQ)\n- _快速检查大型语言模型（如 GPT-3）的行为。_ [演示](https:\u002F\u002Fwww.youtube.com\u002Fwatch?v=3ItA70qoe-o)\n- _识别机器学习模型产生的系统性错误。_ [演示](https:\u002F\u002Fyoutu.be\u002F4Kk_LZbNWNs)\n- _快速标注验证数据。_\n\n### 🤔 Meerkat 可能不适用的场景\n\n- _您是否只处理结构化数据（如数值和分类变量）？_ 常用的数据可视化库（如 [Seaborn](https:\u002F\u002Fseaborn.pydata.org\u002F) 和 [Matplotlib](https:\u002F\u002Fmatplotlib.org\u002F)）通常已经足够。如果您需要交互功能，[Plotly](https:\u002F\u002Fplotly.com\u002F) 和 [Streamlit](https:\u002F\u002Fstreamlit.io\u002F) 对结构化数据的支持也非常出色。Meerkat 的独特之处在于其对非结构化数据类型的可视化能力：长文本、PDF、HTML、图像、视频、音频等。\n- _您是否正在构建一个简单的机器学习模型演示（单输入单输出、聊天机器人）并与公众分享？_ [Gradio](https:\u002F\u002Fgradio.app\u002F) 可能更适合！不过，如果您的演示涉及大量数据的可视化，Meerkat 仍然会很有用。\n- _您是否需要手动标注数万条数据？_ 如果您正在寻找一款适合标注团队使用的开源标注工具，那么像 [LabelStudio](https:\u002F\u002Flabelstud.io\u002F) 这样的工具是更好的选择。相比之下，Meerkat 更适合那些没有大规模标注团队资源、但又需要利用预训练模型（如 GPT-3）来标注验证数据或上下文示例的团队或个人。\n\n\n\n\n\u003C!-- 我们的目标是让基础模型成为处理非结构化数据集时更可靠的软件抽象。\n[阅读我们的博客文章了解更多。](https:\u002F\u002Fhazyresearch.stanford.edu\u002Fblog\u002F2023-03-01-meerkat)\n -->\n\n\n\n## ✉️ 关于我们\n\nMeerkat 由斯坦福大学 [Hazy Research](https:\u002F\u002Fhazyresearch.stanford.edu) 实验室的机器学习博士生团队开发。我们致力于构建一个未来，在这个未来中，模型将使团队能够更轻松地筛选和推理海量的非结构化数据。\n\n如果您希望在项目或公司中使用 Meerkat，或者有任何问题，请联系 `kgoel [at] cs [dot] stanford [dot] edu, eyuboglu [at] stanford [dot] edu, and arjundd [at] stanford [dot] edu`。","# Meerkat 快速上手指南\n\nMeerkat 是一个开源 Python 库，专为可视化、探索和标注**非结构化数据**（如文本、图像、视频、PDF 等）而设计。它支持与机器学习模型（包括大语言模型）深度集成，帮助开发者轻松构建交互式数据视图。\n\n## 环境准备\n\n*   **操作系统**：支持 Linux、macOS 和 Windows。\n*   **Python 版本**：建议 Python 3.8 或更高版本。\n*   **前置依赖**：\n    *   基础安装仅需 `pip`。\n    *   **GPU 支持（可选）**：若需使用 GPU 加速（例如运行深度学习模型），请预先安装支持 CUDA 的 PyTorch。详见 [PyTorch 官方安装指南](https:\u002F\u002Fpytorch.org\u002Fget-started\u002Flocally\u002F)。\n    *   **可选依赖**：处理音频等特定格式时，可能需要 `torchaudio` 等额外库。\n\n## 安装步骤\n\n使用 pip 直接安装核心包：\n\n```bash\npip install meerkat-ml\n```\n\n> **提示**：国内用户若下载缓慢，可指定清华或阿里镜像源加速安装：\n> ```bash\n> pip install meerkat-ml -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n## 基本使用\n\nMeerkat 的核心优势在于低代码开销地加载数据并创建交互式界面。以下是加载 CSV 文件并渲染图像列的最简示例：\n\n### 1. 加载数据与创建视图\n\n只需几行代码即可将本地文件路径转换为可交互的图像列，并查看数据框：\n\n```python\nimport meerkat as mk\n\n# 从 CSV 文件加载数据\ndf = mk.from_csv(\"paintings.csv\")\n\n# 将包含图片 URL 或路径的列转换为可交互的图像列\ndf[\"image\"] = mk.files(\"image_url\")\n\n# 在 Jupyter Notebook 或支持的 IDE 中直接显示交互式表格\ndf\n```\n\n执行上述代码后，你将看到一个包含缩略图的交互式表格，可以直接在界面中浏览图像、排序和过滤数据。\n\n### 2. 进阶：结合机器学习模型\n\nMeerkat 允许嵌入模型进行智能搜索或聚类。例如，使用 CLIP 模型生成图像嵌入并进行相似度匹配：\n\n```python\n# 生成图像嵌入向量\ndf[\"embedding\"] = mk.embed(df[\"img\"], engine=\"clip\")\n\n# 创建基于嵌入的匹配组件\nmatch = mk.gui.Match(df, against=\"embedding\", engine=\"clip\")\n\n# 根据匹配结果排序\nsorted_df = mk.sort(df, by=match.criterion.name, ascending=False)\n\n# 构建画廊视图\ngallery = mk.gui.Gallery(sorted_df)\n\n# 组合组件并渲染\nmk.gui.html.div([match, gallery])\n```\n\n更多详细用法、组件组合技巧及演示项目，请访问 [Meerkat 官方文档](http:\u002F\u002Fmeerkat.wiki\u002Fdocs\u002Findex.html)。","某计算机视觉团队正在构建一个医疗影像诊断模型，需要快速审查成千上万张包含病灶标记的 X 光片与对应的医生文本报告。\n\n### 没有 meerkat 时\n- **数据查看割裂**：图像存储在文件服务器，文本标签在 CSV 中，开发人员需编写繁琐脚本手动关联，无法直观对照“图 - 文”一致性。\n- **错误定位困难**：发现模型在特定类别上表现差时，难以快速筛选出该类别的所有样本进行人工复核，只能随机抽样碰运气。\n- **标注迭代低效**：发现脏数据（如标错位置的病灶）后，缺乏交互式界面直接修正或添加新注释，必须导出修改后再重新加载。\n- **多模态支持缺失**：面对 PDF 格式的原始诊断书或非标准格式影像，传统 Pandas 等工具无法直接渲染，导致大量非结构化数据被忽略。\n\n### 使用 meerkat 后\n- **零代码全景浏览**：仅需几行代码即可将本地路径的影像与 CSV 标签无缝整合，直接在浏览器中生成可滚动的“图像 + 文本”交互画廊。\n- **智能语义检索**：内置 CLIP 等模型引擎，支持用自然语言（如“模糊的左肺结节”）瞬间筛选并排序相关样本，精准定位失败案例。\n- **闭环即时标注**：在可视化界面中直接高亮错误样本、修改标签或添加备注，更改实时同步回内存对象，无需中断工作流导出数据。\n- **全格式原生支持**：直接渲染 DICOM 影像、PDF 报告甚至视频帧，让团队能基于完整的原始多模态数据进行决策，不再遗漏关键信息。\n\nmeerkat 将原本耗时数天的数据清洗与探索过程压缩至小时级，让开发者能专注于模型逻辑而非数据搬运。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FHazyResearch_meerkat_93765c1e.gif","HazyResearch","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FHazyResearch_5f558f19.png","We are a CS research group led by Prof. Chris Ré.",null,"contact.hazy@gmail.com","https:\u002F\u002Fcs.stanford.edu\u002Fpeople\u002Fchrismre\u002F","https:\u002F\u002Fgithub.com\u002FHazyResearch",[80,84,88,92,96,100,103,107,110],{"name":81,"color":82,"percentage":83},"Python","#3572A5",69.8,{"name":85,"color":86,"percentage":87},"Svelte","#ff3e00",27.3,{"name":89,"color":90,"percentage":91},"JavaScript","#f1e05a",1.6,{"name":93,"color":94,"percentage":95},"TypeScript","#3178c6",0.9,{"name":97,"color":98,"percentage":99},"Jinja","#a52a22",0.1,{"name":101,"color":102,"percentage":99},"Makefile","#427819",{"name":104,"color":105,"percentage":106},"HTML","#e34c26",0,{"name":108,"color":109,"percentage":106},"Batchfile","#C1F12E",{"name":111,"color":112,"percentage":106},"CSS","#663399",851,43,"2026-03-17T08:05:33","Apache-2.0","未说明","非必需。若需使用 GPU 功能，需安装支持 GPU 的 PyTorch（具体显卡型号、显存及 CUDA 版本未在文档中指定，需参考 PyTorch 官方指南）。",{"notes":120,"python":117,"dependencies":121},"该工具主要通过 pip 安装 meerkat-ml 包使用。核心设计原则包括低开销和零拷贝集成，支持与 Pandas、Arrow、HF Datasets 等现有数据抽象层无缝对接。若涉及音频处理等特定功能，需额外安装可选依赖（如 torchaudio）。文档未明确列出具体的 Python 版本或最低内存要求，建议参考其官方快速入门文档获取最新环境配置细节。",[122,123,124,125,126,127,128,129],"meerkat-ml","torch (可选，用于 GPU 支持)","torchaudio (可选，用于音频处理)","pandas (支持零拷贝集成)","pyarrow (支持零拷贝集成)","datasets (Hugging Face, 支持零拷贝集成)","ibis (支持零拷贝集成)","plotly (用于可视化组件)",[16,131,14],"其他",[133,134,135,136,137],"ml","data-science","foundation-models","machine-learning","pandas","2026-03-27T02:49:30.150509","2026-04-19T03:06:38.744295",[141,146,151,156,161,166,171],{"id":142,"question_zh":143,"answer_zh":144,"source_url":145},41570,"为什么在 Jupyter Notebook 或浏览器中看不到 Meerkat 的 GUI 界面，只显示 Logo？","这通常是因为端口未正确转发。如果您在远程环境（如云服务器）的 Notebook 中运行，需要同时转发 API 端口（默认 5000）和前端端口（默认 8000）。此外，如果在浏览器中访问，请确保 URL 包含正确的参数，例如应访问 `http:\u002F\u002Flocalhost:8001\u002F?id=gallery` 而不是 `http:\u002F\u002Flocalhost:8001\u002F`。","https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fissues\u002F359",{"id":147,"question_zh":148,"answer_zh":149,"source_url":150},41571,"导入 Meerkat 时出现 'typing 模块没有 Literal' 的错误怎么办？","这是一个已修复的版本兼容性问题。请升级 Meerkat 到最新版本以解决该问题，运行命令：`pip install --upgrade meerkat-ml`。升级后，代码将自动使用正确的 `typing_extensions` 模块。","https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fissues\u002F283",{"id":152,"question_zh":153,"answer_zh":154,"source_url":155},41572,"运行演示代码时遇到 'No such file or directory' 错误（特别是关于 .openai 密钥文件）如何解决？","该问题通常由缺失配置文件引起，维护者已在后续版本中修复。如果遇到此错误，请确保您已按照文档正确设置了环境变量（如 `OPENAI_API_KEY`），并尝试升级到最新版本的 Meerkat。如果是旧版本问题，可以通过手动创建缺失的目录或文件作为临时变通方案，但推荐直接升级库。","https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fissues\u002F360",{"id":157,"question_zh":158,"answer_zh":159,"source_url":160},41573,"数据集下载中断后，重试 `mk.datasets.get` 时报错找不到文件怎么办？","如果数据集下载被中断，缓存文件可能损坏导致重试失败。解决方法是强制重新下载数据集，请在代码中添加 `download_mode='force'` 参数，例如：`mk.dataset.get('imagenette', download_mode='force')`。这将忽略损坏的缓存并重新完整下载。","https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fissues\u002F311",{"id":162,"question_zh":163,"answer_zh":164,"source_url":165},41574,"运行 `mk demo` 命令时提示找不到文件或版本不匹配怎么办？","`mk demo` 命令在某些情况下可能默认拉取完整版本的数据集而非轻量版，导致路径错误或下载问题。建议添加 `--copy` 标志将演示脚本复制到本地，然后检查并手动运行脚本。例如：先运行 `mk demo --run tutorial-image-gallery --copy`，然后使用 `mk run` 运行生成的脚本，或者直接在代码中指定版本：`mk.get(\"imagenette\", version=\"160px\")`。如果问题依旧，可以尝试删除本地缓存目录（如 `~\u002F.meerkat\u002Fdatasets\u002Fimagenette\u002F`）后重试。","https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fissues\u002F285",{"id":167,"question_zh":168,"answer_zh":169,"source_url":170},41575,"文档首页的博客文章链接无法打开是怎么回事？","这是文档中的链接地址错误。正确的博客文章地址应该是 `https:\u002F\u002Fhazyresearch.stanford.edu\u002Fblog\u002F2023-03-01-meerkat`。如果您在文档页面点击链接无效，请直接访问上述正确网址。","https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fissues\u002F313",{"id":172,"question_zh":173,"answer_zh":174,"source_url":175},41576,"使用 `from_pandas` 转换经过过滤的 Pandas DataFrame 时出现索引错误怎么办？","当 Pandas DataFrame 经过过滤操作后，其索引可能不再连续，这会导致 Meerkat 的 `from_pandas` 方法报错。建议在转换前对 DataFrame 调用 `reset_index(drop=True)` 以重置索引，确保索引是连续整数。例如：`df_filtered = df[df[\"a\"] \u003C 12].reset_index(drop=True)`，然后再执行 `mk.DataPanel.from_pandas(df_filtered)`。","https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fissues\u002F212",[177,182,187,192,197,202,207,212,217,222,227,232,236,240],{"id":178,"version":179,"summary_zh":180,"released_at":181},333558,"v0.4.11","## 变更内容\n* 在 linting CI 中固定 Jupyter 版本为 8.12，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F337 中完成  \n* 为 Python 3.8 安装了 `ipython=8.13`，尽管该版本不受支持，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F338 中完成  \n* 注释掉 Ray 测试（临时修复），由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F336 中完成  \n* 添加对 Carbon 图标及额外 props 的支持，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F335 中完成  \n* 更新 package-lock 文件，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F334 中完成  \n* 添加 mk 构建步骤，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F339 中完成  \n* 使用 bumpversion 工具更新版本号，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F340 中完成  \n* 自动化 PyPI 发布流程，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F341 中完成  \n* 更新 Autopush CI 配置，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F342 中完成  \n* 在 bumpversion 的新增文件中添加 package-lock 文件，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F343 中完成  \n* [bumpversion] v0.4.10a1，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F344 中完成  \n* 调试 autobuild 流程，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F347 中完成  \n* [bumpversion] v0.4.10a2，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F348 中完成  \n* 修复 publish.yml 中的 Git 标签问题，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F350 中完成  \n* [bumpversion] v0.4.10a3，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F351 中完成  \n* [bumpversion] v0.4.10a4，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F352 中完成  \n* 添加 GTSDB 和 STSD 数据集，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F354 中完成  \n* 更新 mk.search 以兼容 PyTorch 和 NumPy，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F355 中完成  \n* 更新 README.md，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F357 中完成  \n* 添加 MRI 扰动接口，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F358 中完成  \n* [bumpversion] v0.4.11，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F361 中完成  \n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fcompare\u002Fv0.4.9...v0.4.11","2023-06-01T05:20:07",{"id":183,"version":184,"summary_zh":185,"released_at":186},333559,"v0.4.9","## 变更内容\n* 添加对 Hugging Face 的上传\u002F下载支持，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F327 中完成\n* 添加图像标注组件，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F329 中完成\n* 在 SAM 示例中添加点标记功能，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F330 中完成\n* 从艺术数据集中移除损坏的记录，由 @sandkoan 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F328 中完成\n* 版本号升级至 v0.4.9，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F331 中完成\n\n## 新贡献者\n* @sandkoan 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F328 中完成了首次贡献\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fcompare\u002Fv0.4.8...v0.4.9","2023-04-27T02:20:25",{"id":188,"version":189,"summary_zh":190,"released_at":191},333560,"v0.4.8","## 变更内容\n* Medimg 格式化工具，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F319 中实现\n* Dean\u002Fplotly，由 @dastratakos 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F321 中实现\n* 修复 CellInfo 缺失的 bug，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F324 中修复\n* App\u002Ftogether，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F325 中实现\n* bumpversion\u002Fv0.4.8，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F326 中完成\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fcompare\u002Fv0.4.7...v0.4.8","2023-04-19T19:37:33",{"id":193,"version":194,"summary_zh":195,"released_at":196},333561,"v0.4.7","## 变更内容\n* 由 @krandiash 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F312 中更新依赖锁文件\n* 由 @krandiash 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F315 中修复博客链接\n* 由 @krandiash 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F314 中更新依赖包和索引\n* 由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F317 中添加 Pathfinder 数据集\n* 由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F318 中执行版本号升级：v0.4.7\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fcompare\u002Fv0.4.6...v0.4.7","2023-04-19T19:36:49",{"id":198,"version":199,"summary_zh":200,"released_at":201},333562,"v0.4.6","## 变更内容\n* 由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F304 中清理音频笔记本\n* 由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F307 中添加对音频\u002F图像列推理的 Hugging Face 支持\n* 由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F306 中添加对多维医学图像的初步支持\n* 由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F308 中添加 SIIM CXR 数据集\n* 由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F309 中修复\u002F快速填充最大 token 数\n* bumpversion：v0.4.5 -> v0.4.6，由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F310 中完成\n\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fcompare\u002Fv0.4.5...v0.4.6","2023-03-22T04:55:09",{"id":203,"version":204,"summary_zh":205,"released_at":206},333563,"v0.4.5","## 变更内容\n* 由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F301 中优化了 DataFrame 的构建\n* 由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F300 中添加了对 IPython 高度的自动推断支持\n* 由 @ad12 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F302 中为 Flash Fill 添加了最大令牌数选项\n* 由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fpull\u002F303 中添加了音频演示\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fcompare\u002Fv0.4.4...v0.4.5","2023-03-12T19:18:44",{"id":208,"version":209,"summary_zh":210,"released_at":211},333564,"v0.4.2","**完整更新日志**: https:\u002F\u002Fgithub.com\u002FHazyResearch\u002Fmeerkat\u002Fcompare\u002Fv0.2.4...v0.4.2","2023-03-03T23:13:25",{"id":213,"version":214,"summary_zh":215,"released_at":216},333565,"v0.2.5","## 变更内容\n* 发布：v0.2.2，由 @krandiash 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F191 中完成\n* 发布：v0.2.3，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F200 中完成\n* Audioset 数据面板，由 @Priya2698 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F229 中实现\n* 修复旧数据面板缺少格式化器状态的问题，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F233 中完成\n* 将 AudioSet 数据面板改为关联型，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F235 中完成\n* 添加 coco、mir 和 pascal 数据集，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F239 中完成\n* 使数据面板中的列仅支持写入操作，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F240 中完成\n* 强制要求 pandas 列的索引连续，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F244 中完成\n* 修复 lazy loader 在使用 ray pickle 时失败的问题，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F245 中完成\n* 功能\u002F分组：basegroupby，由 @sam-randall 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F242 中实现\n* 重新组织数据集的实现，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F246 中完成\n* 添加对持久化配置的支持，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F247 中完成\n* 实现数据面板和列的排序功能，由 @hannahkim24 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F237 中完成\n* 添加 emb 模块，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F249 中完成\n* 重新组织 ops 代码，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F250 中完成\n* 添加 sample 功能，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F251 中完成\n* 添加多个 HAPI 数据集，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F252 中完成\n* 更新文档样式，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F253 中完成\n* 版本升级至 Release: vx.y.z，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F254 中完成\n\n## 新贡献者\n* @sam-randall 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F242 中完成了首次贡献\n* @hannahkim24 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F237 中完成了首次贡献\n\n**完整变更日志**：https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fcompare\u002Fv0.2.4...v0.2.5","2022-07-22T21:39:55",{"id":218,"version":219,"summary_zh":220,"released_at":221},333566,"v0.2.4","## 变更内容\n* 更新贡献指南，以支持新的开发主分支结构，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F203 中完成\n* 为 ColumnIOMixin._read_data 添加 `args` 和 `kwargs` 参数，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F204 中完成\n* 修复 `from_huggingface` 方法并添加测试用例，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F205 中完成\n* 小幅修复，由 @khaledsaab 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F206 中完成\n* 为 ImageColumn 添加下载器，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F207 中完成\n* 移除默认添加索引的逻辑，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F208 中完成\n* 将 DEW 贡献项添加到注册表中，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F209 中完成\n* 捕获 `ConnectionResetError` 异常，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F210 中完成\n* 将 iNaturalist 数据集添加到贡献模块中，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F211 中完成\n* 修复 ArrayColumn 无法使用 JSON Lines 格式保存的问题，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F214 中完成\n* 更新文档并添加用户指南，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F215 中完成\n* 添加 Enron 邮件数据集的贡献模块，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F217 中完成\n* 修复 PIL 属性错误，该错误出现在列表和 Lambda 列表示中，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F218 中完成\n* 修复 mmap 路径相关 bug，由 @khaledsaab 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F219 中完成\n* 降低 PyTorch 的依赖版本上限，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F220 中完成\n* 修复子类化 `DataPanel._state_keys` 时出现的问题，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F224 中完成\n* 在 ArrowBlock 中使用多个切片代替 `pa.Table.take` 方法，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F226 中完成\n* 修复布尔列表无法进行索引的问题，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F227 中完成\n* 增加对 AudioColumn 的支持，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F222 中完成\n* 添加 Waterbirds 贡献模块，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F228 中完成\n* 添加关于索引和切片的指南，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F225 中完成\n* 文档和构建相关修复，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F230 中完成\n* 提升版本号，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F231 中完成\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fcompare\u002Fv0.2.3...v0.2.4","2022-02-17T21:40:22",{"id":223,"version":224,"summary_zh":225,"released_at":226},333567,"v0.2.3","## 变更内容\n* 发布：v0.2.1，由 @krandiash 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F171 中完成\n* 版本升级至 0.2.2，由 @krandiash 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F190 中完成\n* 删除 nn，由 @krandiash 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F192 中完成\n* 添加对 CIFAR10 数据集训练集和测试集的加载支持，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F193 中完成\n* 修复使用 Pandas Series 索引张量列时出现的问题，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F195 中完成\n* 更新 CIFAR10 数据集以同时支持测试集，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F196 中完成\n* 修复 base_dir 和 GCSImageColumn 的向后兼容性问题，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F197 中完成\n* 支持与 nn 的向后兼容性，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F198 中完成\n* 版本升级，由 @seyuboglu 在 https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F199 中完成\n\n\n**完整变更日志**: https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fcompare\u002Fv0.2.2...v0.2.3","2021-11-19T23:16:34",{"id":228,"version":229,"summary_zh":230,"released_at":231},333568,"v0.2.2","## What's Changed\r\n* Release: v0.2.0 by @krandiash in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F120\r\n* Callbacks by @Priya2698 in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F168\r\n* Add support for ArrowArrayColumns by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F173\r\n* Add dataset registry by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F176\r\n* Make logging initialization robust to permissions  by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F179\r\n* Fix datasets download bug by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F180\r\n* Add support for datasets.names and datasets.catalog by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F181\r\n* Update celeba download by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F183\r\n* Add support for base_dir in image column by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F184\r\n* Add meerkatloader for loading meerkat modules from yaml file by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F185\r\n* Fix issue where datapanel visualizations only show floats by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F186\r\n* Move readme assets by @seyuboglu in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F187\r\n* Update Spacy column  by @krandiash in https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fpull\u002F189\r\n\r\n\r\n**Full Changelog**: https:\u002F\u002Fgithub.com\u002Frobustness-gym\u002Fmeerkat\u002Fcompare\u002Fv0.2.1...v0.2.2","2021-11-12T22:09:05",{"id":233,"version":234,"summary_zh":75,"released_at":235},333569,"v0.2.1","2021-10-14T18:47:06",{"id":237,"version":238,"summary_zh":75,"released_at":239},333570,"v0.2.0","2021-08-10T23:05:57",{"id":241,"version":242,"summary_zh":75,"released_at":243},333571,"v0.1.0","2021-06-24T02:05:20"]