[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-fbdesignpro--sweetviz":3,"tool-fbdesignpro--sweetviz":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",149489,2,"2026-04-10T11:32:46",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",108322,"2026-04-10T11:39:34",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},6121,"gemini-cli","google-gemini\u002Fgemini-cli","gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。\n\n这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。\n\n它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。",100752,"2026-04-10T01:20:03",[52,13,15,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":32,"last_commit_at":59,"category_tags":60,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":75,"owner_location":75,"owner_email":75,"owner_twitter":75,"owner_website":76,"owner_url":77,"languages":78,"stars":91,"forks":92,"last_commit_at":93,"license":94,"difficulty_score":95,"env_os":96,"env_gpu":97,"env_ram":98,"env_deps":99,"category_tags":104,"github_topics":106,"view_count":32,"oss_zip_url":75,"oss_zip_packed_at":75,"status":17,"created_at":120,"updated_at":121,"faqs":122,"releases":152},6380,"fbdesignpro\u002Fsweetviz","sweetviz","Visualize and compare datasets, target values and associations, with one line of code.","Sweetviz 是一款专为 Python 设计的开源库，旨在帮助数据从业者仅需两行代码即可生成高信息密度的探索性数据分析（EDA）报告。它主要解决了传统数据分析中可视化流程繁琐、代码量大且难以快速对比不同数据集或目标变量特征的痛点。\n\n这款工具特别适合数据科学家、机器学习工程师以及需要快速理解数据分布的研究人员使用。无论是进行模型训练前的数据探查，还是对比训练集与测试集的差异，Sweetviz 都能通过自动生成独立的 HTML 交互式报告，让用户直观地洞察数据全貌。\n\n其核心技术亮点在于强大的自动化能力：它能智能推断数值型、分类型及文本型特征，无需手动配置；同时无缝整合了多种统计关联算法（如皮尔逊相关系数、不确定性系数等），以统一视角展示混合类型数据间的关系。此外，Sweetviz 擅长深入分析目标变量与其他特征的关联，并提供详尽的描述性统计摘要（包括缺失值、离群点、偏度等）。通过将复杂的统计逻辑封装在简洁的接口背后，Sweetviz 让数据初步分析变得高效而优雅。","![version](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002F2.3.2-blue.svg?label=version) ![updated](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FApril%204%2C%202026-green.svg?label=updated)\n\n### !!! April 2026 UPDATE !!! -  Version 2.3.2: Long-standing issues fixed\n\n---\n![Sweetviz Logo](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_93214899c751.png) \n\n_In-depth EDA **(target analysis, comparison, feature analysis, correlation)** in two lines of code!_\n\n![Features](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_33d4814b0292.png)\n\nSweetviz is an open-source Python library that generates beautiful, high-density visualizations to kickstart EDA (Exploratory Data Analysis) with just two lines of code. Output is a fully self-contained HTML application.\n\nThe system is built around quickly **visualizing target values** and **comparing datasets**. Its goal is to help quick analysis of target characteristics, training vs testing data, and other such data characterization tasks. \n\nUsage and parameters are described below, [you can also find an article describing its features in depth and see examples in action HERE](https:\u002F\u002Fmedium.com\u002Fdata-science\u002Fpowerful-eda-exploratory-data-analysis-in-just-two-lines-of-code-using-sweetviz-6c943d32f34).\n\n**Sweetviz development is still ongoing!** Please let me know if you run into any data, compatibility or install issues! Thank you for [reporting any BUGS in the issue tracking system here](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues), and I welcome your feedback and questions on usage\u002Ffeatures [in the brand-new GitHub \"Discussions\" tab right here!](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fdiscussions).\n\n## Examples & mentions\n[**Example HTML report** using the Titanic dataset](https:\u002F\u002Ffbdesignpro.github.io\u002Fsweetviz\u002Fexamples\u002FSWEETVIZ_REPORT.html)\n\n[**Example Notebook w\u002Fdocs** on Colab (Jupyter\u002Fother notebooks should also work)](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1-md6YEwcVGWVnQWTBirQSYQYgdNoeSWg?usp=sharing)\n\n[**Medium Article** describing its features in depth](https:\u002F\u002Fmedium.com\u002Fdata-science\u002Fpowerful-eda-exploratory-data-analysis-in-just-two-lines-of-code-using-sweetviz-6c943d32f34)\n\nKD Nugget articles:\n[![KDNuggets](https:\u002F\u002Fwww.kdnuggets.com\u002Fimages\u002Ftkb-2102-g.png)](https:\u002F\u002Fwww.kdnuggets.com\u002F2021\u002F02\u002Fpowerful-exploratory-data-analysis-sweetviz.html) [![KDNuggets](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_504a785cc9bd.png)](https:\u002F\u002Fwww.kdnuggets.com\u002F2021\u002F03\u002Fknow-your-data-much-faster-sweetviz-python-library.html)\n\n# Features\n- **Target analysis** \n  - Shows how a target value (e.g. \"Survived\" in the Titanic dataset) relates to other features\n- **Visualize and compare**\n  - Distinct datasets (e.g. training vs test data)\n  - Intra-set characteristics (e.g. male versus female)\n- **Mixed-type associations**\n  - Sweetviz integrates associations for numerical (Pearson's correlation), categorical (uncertainty coefficient) and categorical-numerical (correlation ratio) datatypes seamlessly, to provide maximum information for all data types.\n- **Type inference**\n  - Automatically detects numerical, categorical and text features, with optional manual overrides \n- **Summary information** \n  - Type, unique values, missing values, duplicate rows, most frequent values\n  - Numerical analysis: \n    - min\u002Fmax\u002Frange, quartiles, mean, mode, standard deviation, sum, median absolute deviation, coefficient of variation, kurtosis, skewness\n\n## New & notable\n- Version 2.2: Big compatibility update for python 3.7+ and numpy versions\n- Version 2.1: **Comet.ml** support\n- Version 2.0: **Jupyter, Colab & other notebook** support, report **scaling & vertical layout**  \n\n_(see below for docs on these features)_\n\n# Upgrading\nSome people have experienced mixed results behavior upgrading through `pip`. To update to the latest from an existing install, it is recommended to `pip uninstall sweetviz` first, then simply install.\n\n# Installation\nSweetviz currently supports Python 3.6+ and Pandas 0.25.3+. Reports are output using the base \"os\" module, so custom environments such as Google Colab which require custom file operations are not yet supported, although I am looking into a solution. \n## Using pip\nThe best way to install sweetviz (other than from source) is to use pip:\n```\npip install sweetviz\n```\n#### Installation issues & fixes\nIn some rare cases, users have reported errors such as `ModuleNotFoundError: No module named 'sweetviz'` and `AttributeError: module 'sweetviz' has no attribute 'analyze'`.\nIn those cases, we suggest the following:\n- Make sure none of your scripts are named `sweetviz.py`, as that interferes with the library itself. Delete or rename that script (and any associated `.pyc` files), and try again.\n- Try uninstalling the library using `pip uninstall sweetviz`, then reinstalling\n- The issue may stem from using multiple versions of Python, or from OS permissions. The following Stack Overflow articles have resolved many of these issues reported: [Article 1](https:\u002F\u002Fstackoverflow.com\u002Fquestions\u002F32680081\u002Fimporterror-after-successful-pip-installation\u002F32680082), [Article 2](https:\u002F\u002Fstackoverflow.com\u002Fquestions\u002F14295680\u002Funable-to-import-a-module-that-is-definitely-installed), [Article 3](https:\u002F\u002Fstackoverflow.com\u002Fquestions\u002F44528638\u002Fafter-pip-successful-installed-modulenotfounderror) \n- If all else fails, post a bug issue [here on github](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues). Thank you for taking the time, it may help resolve the issue for you and everyone else!\n# Basic Usage\nCreating a report is a quick 2-line process:\n1. Create a `DataframeReport` object using one of: `analyze()`, `compare()` or `compare_intra()`\n2. Use a `show_xxx()` function to render the report. You can now use either **html** or **notebook** report options, as well as scaling: (more info on these options below)\n\n![Report_Show_Options](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_9ad684564ffd.gif) \n\n## Step 1: Create the report\nThere are 3 main functions for creating reports:\n- analyze(...)\n- compare(...)\n- compare_intra(...)\n\n#### Analyzing a single dataframe (and its optional target feature)\nTo analyze a single dataframe, simply use the `analyze(...)` function, then the `show_html(...)` function:\n```\nimport sweetviz as sv\n\nmy_report = sv.analyze(my_dataframe)\nmy_report.show_html() # Default arguments will generate to \"SWEETVIZ_REPORT.html\"\n```\nWhen run, this will output a 1080p widescreen html app in your default browser:\n![Widescreen demo](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_762c48c7be2e.png)\n##### Optional arguments\nThe `analyze()` function can take multiple other arguments:\n```\nanalyze(source: Union[pd.DataFrame, Tuple[pd.DataFrame, str]],\n            target_feat: str = None,\n            feat_cfg: FeatureConfig = None,\n            pairwise_analysis: str = 'auto',\n            verbosity: str = 'default'):\n```\n- **source:** Either the data frame (as in the example) or a tuple containing the data frame and a name to show in the report. \ne.g. `my_df` or `[my_df, \"Training\"]`\n- **target_feat:** A string representing the name of the feature to be marked as \"target\". *Only BOOLEAN and NUMERICAL features can be targets for now.*\n- **feat_cfg:** A FeatureConfig object representing features to be skipped, or to be forced a certain type in the analysis. The arguments can either be a single string or list of strings. Parameters are `skip`, `force_cat`, `force_num` and `force_text`. The \"force_\" arguments override the built-in type detection. They can be constructed as follows:\n```\nfeature_config = sv.FeatureConfig(skip=\"PassengerId\", force_text=[\"Age\"])\n```\n- **verbosity:** **[NEW]** Can be set to `full`, `progress_only` (to only display the progress bar but not report generation messages) and `off` (fully quiet, except for errors or warnings). Default  verbosity can also be set in the INI override, under the \"General\" heading (see \"The Config file\" section below for details).\n- **pairwise_analysis:** Correlations and other associations can take quadratic time (n^2) to complete. The default setting (\"auto\") will run without warning until a data set contains \"association_auto_threshold\" features. Past that threshold, you need to explicitly pass the parameter `pairwise_analysis=\"on\"` (or `=\"off\"`) since processing that many features would take a long time. This parameter also covers the generation of the association graphs (based on [Drazen Zaric's concept](https:\u002F\u002Ftowardsdatascience.com\u002Fbetter-heatmaps-and-correlation-matrix-plots-in-python-41445d0f2bec)):\n\n![Pairwise sample](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_85d2ddb1a738.png)\n\n#### Comparing two dataframes (e.g. Test vs Training sets)\nTo compare two data sets, simply use the `compare()` function. Its parameters are the same as `analyze()`, except with an inserted second parameter to cover the comparison dataframe. It is recommended to use the [dataframe, \"name\"] format of parameters to better differentiate between the base and compared dataframes. (e.g. `[my_df, \"Train\"]` vs `my_df`)\n```\nmy_report = sv.compare([my_dataframe, \"Training Data\"], [test_df, \"Test Data\"], \"Survived\", feature_config)\n```\n#### Comparing two subsets of the same dataframe (e.g. Male vs Female)\nAnother way to get great insights is to use the comparison functionality to split your dataset into 2 sub-populations.\n\nSupport for this is built in through the `compare_intra()` function. This function takes a boolean series as one of the arguments, as well as an explicit \"name\" tuple for naming the (true, false) resulting datasets. Note that internally, this creates 2 separate dataframes to represent each resulting group. As such, it is more of a shorthand function of doing such processing manually.\n```\nmy_report = sv.compare_intra(my_dataframe, my_dataframe[\"Sex\"] == \"male\", [\"Male\", \"Female\"], \"Survived\", feature_config)\n```\n## Step 2: Show the report\nOnce you have created your report object (e.g. `my_report` in the examples above), simply pass it into one of the two `show' functions:\n\n### show_html()\n```\nshow_html(  filepath='SWEETVIZ_REPORT.html', \n            open_browser=True, \n            layout='widescreen', \n            scale=None)\n```            \n**show_html(...)** will create and save an HTML report at the given file path. There are options for:\n- **layout**: Either `'widescreen'` or `'vertical'`. The widescreen layout displays details on the right side of the screen, as the mouse goes over each feature. The new (as of 2.0) vertical layout is more compact horizontally and enables expanding each detail area upon clicking.\n- **scale**: Use a floating-point number (e.g. `scale = 0.8` or `None`) to scale the entire report. This is very useful to fit reports to any output.\n- **open_browser**: Enables the automatic opening of a web browser to show the report. Since under some circumstances this is not desired (or causes issues with some IDE's), you can disable it here.\n\n### show_notebook()\n```\nshow_notebook(  w=None, \n                h=None, \n                scale=None,\n                layout='widescreen',\n                filepath=None,\n                file_layout=None,\n                file_scale=None)\n```            \n**show_notebook(...)** is new as of 2.0 and will embed an IFRAME element showing the report right inside a notebook (e.g. Jupyter, Google Colab, etc.). \n\nNote that since notebooks are generally a more constrained visual environment, it is probably a good idea to use custom width\u002Fheight\u002Fscale values (`w`, `h`, `scale`) and even **set custom default values in an INI override** (see below). The options are:\n- **w** (width): Sets the width of the output _window_ for the report (the full report may not fit; use `layout` and\u002For `scale` for the report itself). Can be as a percentage string (`w=\"100%\"`) or number of pixels (`w=900`).\n- **h** (height): Sets the height of the output _window_ for the report. Can be as a number of pixels (`h=700`) or \"Full\" to stretch the window to be as tall as all the features (`h=\"Full\"`).\n- **scale**: Same as for `show_html()`, above.\n- **layout**: Same as for `show_html()`, above.\n- **filepath**: An OPTIONAL output HTML report.\n- **file_layout**: Layout for the OPTIONAL file output ONLY (same as `layout` for `show_html()`, above)\n- **file_scale**: Scale for the OPTIONAL file output ONLY (same as `scale` for `show_html()`, above)\n# Customizing defaults: the Config file\nThe package contains an INI file for configuration. You can override any setting by providing your own then calling this before creating a report:\n```\nsv.config_parser.read(\"Override.ini\")\n```\n**IMPORTANT #1:** it is best to load overrides **before any other command**, as many of the INI options are used in the report generation.  \n\n**IMPORTANT #2:** always **put the header line** (e.g. `[General]`) before a set of values in your override INI file, **otherwise your settings will be ignored**. See examples below. If setting multiple values, only include the `[General]` line once.\n\n\n### Most useful config overrides\nYou can look into the file `sweetviz_defaults.ini` for what can be overriden (warning: much of it is a work in progress and not well documented), but the most useful overrides are as follows.\n\n#### Default report layout, size\nOverride any of these (by putting them in your own INI, again do not forget the header), to avoid having to set them every time you do a \"show\" command:\n\n**Important**: note the double '%' if specifying a percentage\n```\n[Output_Defaults]\nhtml_layout = widescreen\nhtml_scale = 1.0\nnotebook_layout = vertical\nnotebook_scale = 0.9\nnotebook_width = 100%%\nnotebook_height = 700\n```\n\n##### Chinese, Japanse, Korean (CJK) character support\n```\n[General]\nuse_cjk_font = 1 \n```\n*\\*If setting multiple values for `[general]` only include the `[General]` line once*.\n\nWill switch the font in the graphs to use a CJK-compatible font. Although this font is not as compact, it will get rid of any warnings and \"unknown character\" symbols for these languages.\n##### Remove Sweetviz logo\n```\n[Layout]\nshow_logo = 0\n```\nWill remove the Sweetviz logo from the top of the page. \n\n##### Set default verbosity level\n```\n[General]\ndefault_verbosity = off \n```\n*\\*If setting multiple values for `[general]` only include the `[General]` line once*.\n\nCan be set to `full`, `progress_only` (to only display the progress bar but not report generation messages) and `off` (fully quiet, except for errors or warnings).\n\n# Correlation\u002FAssociation analysis\nA major source of insight and unique feature of Sweetviz' associations graph and analysis is that **it unifies in a single graph** (and detail views):\n - Numerical correlation (between numerical features)\n - Uncertainty coefficient (for categorical-categorical)\n - Correlation ratio (for categorical-numerical)\n![Pairwise sample](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_85d2ddb1a738.png)\n\n Squares represent categorical-featured-related variables and circles represent numerical-numerical correlations. Note that the trivial diagonal is left empty, for clarity.\n \nIMPORTANT: categorical-categorical associations (provided by the SQUARES showing the uncertainty coefficient) are ASSYMMETRICAL, meaning that each row represents **how much the row title (on the left) gives information on each column**. _For example, \"Sex\", \"Pclass\" and \"Fare\" are the elements that give the most information on \"Survived\"._ \n\nFor the Titanic dataset, this information is rather symmetrical but it is not always the case!\n\nCorrelations are also displayed in the detail section of each feature, with the target value highlighted when applicable. e.g.:\n\n![Associations detail](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_0594abd027d8.png)\n\nFinally, it is worth noting these correlation\u002Fassociation methods shouldn’t be taken as gospel as they make some assumptions on the underlying distribution of data and relationships. However they can be a _very_ useful starting point.\n\n# Comet.ml integration\nAs of 2.1, Sweetviz now fully integrates [Comet.ml](https:\u002F\u002Fwww.comet.ml). This means Sweetviz will **automatically log any reports generated** using `show_html()` and `show_notebook()` to your workspace, as long as your API key is set up correctly in your environment.\n\nAdditionally, you can also use the new function `report.log_comet(experiment_object)` to explicitly upload a report for a given experiment to your workspace.\n\nYou can see an example of a [Colab notebook](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1SK1I-gU6nLchesbMtFD9ZuzJHyzleFAr?usp=sharing) to generate the report, and its corresponding report in a [Comet.ml workspace](https:\u002F\u002Fwww.comet.ml\u002Ffbdesignpro\u002Fsweetviz-comet\u002Fd005158117c24924b07476887cd5ddfa?experiment-tab=html).\n\n## Comet report parameters\nYou can customize how the Sweetviz report looks in your Comet workspace by overriding the `[comet_ml_defaults]` section of configuration file. See above for more information on using the INI override.\n\nYou can choose to use either the `widescreen` (horizontal) or `vertical` layouts, as well as set your preferred scale, by putting the following in your override INI file:\n```\n[comet_ml_defaults]\nhtml_layout = vertical\nhtml_scale = 0.85\n```\n\n# Troubleshooting \u002F FAQ\n- **Installation issues**\n\nPlease see the \"Installation issues & fixes\" section at the top of this document\n- **Asian characters, \"RuntimeWarning: Glyph ### missing from current font\"**\n\nSee section above regarding CJK characters support. If you find the need for additional character types, definitely [post a request in the issue tracking system.](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues)\n\n- **...any other issues**\n\nDevelopment is ongoing so absolutely feel free to report any issues and\u002For suggestions [in the issue tracking system here](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues) or [in our forum (you should be able to log in with your Github account!)](https:\u002F\u002Fsweetviz.fbdesignpro.com)\n\n# Contribute\nThis is my first open-source project! I built it to be the most useful tool possible and help as many people as possible with their data science work. If it is useful to you, your contribution is more than welcome and can take many forms:\n### 1. Spread the word!\nA STAR here on GitHub, and a Twitter or Instagram post are the easiest contribution and can potentially help grow this project tremendously! If you find this project useful, these quick actions from you would mean a lot and could go a long way. \n\nKaggle notebooks\u002Fposts, Medium articles, YouTube video tutorials and other content take more time but will help all the more!\n\n### 2. Report bugs & issues\nI expect there to be many quirks once the project is used by more and more people with a variety of new (& \"unclean\") data. If you found a bug, please [open a new issue here](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues).\n\n### 3. Suggest and discuss usage\u002Ffeatures\nTo make Sweetviz as useful as possible we need to hear what you would like it to do, or what it could do better! [Head on to our Discourse server and post your suggestions there; no login required!](https:\u002F\u002Fsweetviz.fbdesignpro.com).\n\n### 4. Contribute to the development\nI definitely welcome the help I can get on this project, simply get in touch on the issue tracker and\u002For our Discourse forum. \n\nPlease note that after a hectic development period, the code itself right now needs a bit of cleanup. :)\n\n# Special thanks & related materials\n### Contributors\n**A very special thanks to everyone who have contributed on Github, through reports, feedback and commits!** I want to give a special shout out to **Frank Male** who has been of tremendous help for fixing issues and setting up the new build pipeline for 2.2.0.\n\n[![Contributors](https:\u002F\u002Fcontrib.rocks\u002Fimage?repo=fbdesignpro\u002Fsweetviz)](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fgraphs\u002Fcontributors)\n\nMade with [contrib.rocks](https:\u002F\u002Fcontrib.rocks).\n### Related materials\nI want Sweetviz to be a hub of the best of what's out there, a way to get the most valuable information and visualization, without reinventing the wheel.\n\nAs such, I want to point some of those great resources that were inspiring and integrated into Sweetviz:\n- [Pandas-Profiling](https:\u002F\u002Fgithub.com\u002Fpandas-profiling\u002Fpandas-profiling) was the original inspiration for this project. Some of its type-detection code was included in Sweetviz.\n- [Shaked Zychlinski: The Search for Categorical Correlation](https:\u002F\u002Ftowardsdatascience.com\u002Fthe-search-for-categorical-correlation-a1cf7f1888c9) is a great article about different types of variable interactions that was the basis of that analysis in Sweetviz.\n- [Drazen Zaric: Better Heatmaps and Correlation Matrix Plots in Python](https:\u002F\u002Ftowardsdatascience.com\u002Fbetter-heatmaps-and-correlation-matrix-plots-in-python-41445d0f2bec) was the basis for our association graphs.\n\n","![version](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002F2.3.2-blue.svg?label=version) ![updated](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FApril%204%2C%202026-green.svg?label=updated)\n\n### !!! 2026年4月更新 !!! - 版本 2.3.2：长期存在的问题已修复\n\n---\n![Sweetviz Logo](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_93214899c751.png) \n\n_只需两行代码，即可进行深入的探索性数据分析（目标分析、比较、特征分析、相关性分析）！_\n\n![Features](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_33d4814b0292.png)\n\nSweetviz 是一个开源的 Python 库，只需两行代码就能生成精美且信息密集的可视化图表，从而快速启动探索性数据分析 (EDA)。输出结果是一个完全自包含的 HTML 应用程序。\n\n该系统的核心功能是快速**可视化目标值**和**比较数据集**。它的目标是帮助用户快速分析目标变量的特征、训练数据与测试数据之间的差异，以及其他类似的数据特性分析任务。\n\n使用方法和参数说明如下，[您也可以在此处找到一篇详细介绍其功能并展示实际示例的文章](https:\u002F\u002Fmedium.com\u002Fdata-science\u002Fpowerful-eda-exploratory-data-analysis-in-just-two-lines-of-code-using-sweetviz-6c943d32f34)。\n\n**Sweetviz 的开发仍在继续！** 如果您在使用过程中遇到任何数据、兼容性或安装问题，请随时告知我！感谢您在 [此处的问题跟踪系统中报告任何 BUG](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues)，我也非常欢迎您在全新的 GitHub “Discussions” 标签页中提出关于使用方法和功能的反馈与疑问！[在这里查看讨论区](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fdiscussions)。\n\n## 示例与引用\n[**使用泰坦尼克号数据集的 HTML 报告示例**](https:\u002F\u002Ffbdesignpro.github.io\u002Fsweetviz\u002Fexamples\u002FSWEETVIZ_REPORT.html)\n\n[**带有文档的 Colab 笔记本示例**（Jupyter 或其他笔记本也应适用）](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1-md6YEwcVGWVnQWTBirQSYQYgdNoeSWg?usp=sharing)\n\n[**Medium 文章**详细介绍了其功能](https:\u002F\u002Fmedium.com\u002Fdata-science\u002Fpowerful-eda-exploratory-data-analysis-in-just-two-lines-of-code-using-sweetviz-6c943d32f34)\n\nKD Nugget 文章：\n[![KDNuggets](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_c1966c0596e5.png)](https:\u002F\u002Fwww.kdnuggets.com\u002F2021\u002F02\u002Fpowerful-exploratory-data-analysis-sweetviz.html) [![KDNuggets](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_504a785cc9bd.png)](https:\u002F\u002Fwww.kdnuggets.com\u002F2021\u002F03\u002Fknow-your-data-much-faster-sweetviz-python-library.html)\n\n# 功能\n- **目标分析**\n  - 展示目标变量（例如泰坦尼克号数据集中的“Survived”）与其他特征之间的关系。\n- **可视化与比较**\n  - 不同数据集（例如训练数据与测试数据）\n  - 同一数据集中不同子集的特征（例如男性与女性）\n- **混合类型关联**\n  - Sweetviz 能够无缝整合数值型（皮尔逊相关系数）、类别型（不确定性系数）以及类别-数值混合型（相关比率）等多种数据类型的关联分析，为所有数据类型提供尽可能全面的信息。\n- **类型推断**\n  - 自动检测数值型、类别型和文本型特征，并支持手动覆盖。\n- **汇总信息**\n  - 类型、唯一值、缺失值、重复行、最常见值。\n  - 数值分析：\n    - 最小值\u002F最大值\u002F范围、四分位数、均值、众数、标准差、总和、中位数绝对偏差、变异系数、峰度、偏度。\n\n## 新增与亮点\n- 版本 2.2：针对 Python 3.7+ 和 NumPy 各版本的重大兼容性更新。\n- 版本 2.1：支持 **Comet.ml**。\n- 版本 2.0：支持 **Jupyter、Colab 及其他笔记本环境**，并优化了报告的 **缩放与垂直布局**。\n\n_（有关这些功能的详细文档请见下文）_\n\n# 升级\n有些人通过 `pip` 升级时遇到了一些不稳定的情况。为了从现有安装升级到最新版本，建议先运行 `pip uninstall sweetviz`，然后再重新安装。\n\n# 安装\nSweetviz 目前支持 Python 3.6 及以上版本，以及 Pandas 0.25.3 及以上版本。报告输出使用基础的 `os` 模块，因此像 Google Colab 这样需要自定义文件操作的环境目前尚不支持，不过我们正在寻找解决方案。\n## 使用 pip 安装\n安装 Sweetviz 的最佳方式（除了从源码安装外）是使用 pip：\n```\npip install sweetviz\n```\n#### 安装问题及解决方法\n在极少数情况下，用户报告了诸如 `ModuleNotFoundError: No module named 'sweetviz'` 和 `AttributeError: module 'sweetviz' has no attribute 'analyze'` 等错误。\n在这种情况下，我们建议采取以下措施：\n- 确保您的脚本中没有名为 `sweetviz.py` 的文件，因为这会干扰库的正常运行。删除或重命名该脚本（以及任何相关的 `.pyc` 文件），然后再次尝试。\n- 尝试使用 `pip uninstall sweetviz` 卸载库，然后再重新安装。\n- 问题可能源于同时使用多个 Python 版本，或者操作系统权限不足。以下 Stack Overflow 文章解决了许多此类问题：[文章 1](https:\u002F\u002Fstackoverflow.com\u002Fquestions\u002F32680081\u002Fimporterror-after-successful-pip-installation\u002F32680082)、[文章 2](https:\u002F\u002Fstackoverflow.com\u002Fquestions\u002F14295680\u002Funable-to-import-a-module-that-is-definitely-installed)、[文章 3](https:\u002F\u002Fstackoverflow.com\u002Fquestions\u002F44528638\u002Fafter-pip-successful-installed-modulenotfounderror)。\n- 如果以上方法都无效，请在 [GitHub 上提交一个问题](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues)。感谢您的耐心，这将有助于解决您和其他人的问题！\n# 基本用法\n创建报告的过程非常简单，只需两行代码：\n1. 使用 `analyze()`、`compare()` 或 `compare_intra()` 方法创建一个 `DataframeReport` 对象。\n2. 使用 `show_xxx()` 函数渲染报告。现在您可以选择 **HTML** 或 **笔记本** 报告格式，并调整缩放比例：（更多选项详情见下文）\n\n![Report_Show_Options](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_9ad684564ffd.gif)\n\n## 第 1 步：创建报告\n创建报告主要有 3 个函数：\n- analyze(...)\n- compare(...)\n- compare_intra(...)\n\n### 分析单个数据框（及其可选的目标特征）\n要分析单个数据框，只需使用 `analyze(...)` 函数，然后调用 `show_html(...)` 函数：\n```\nimport sweetviz as sv\n\nmy_report = sv.analyze(my_dataframe)\nmy_report.show_html() # 默认参数会生成到 \"SWEETVIZ_REPORT.html\"\n```\n运行后，这将在您的默认浏览器中输出一个 1080p 宽屏 HTML 应用程序：\n![宽屏演示](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_762c48c7be2e.png)\n##### 可选参数\n`analyze()` 函数可以接受多个其他参数：\n```\nanalyze(source: Union[pd.DataFrame, Tuple[pd.DataFrame, str]],\n            target_feat: str = None,\n            feat_cfg: FeatureConfig = None,\n            pairwise_analysis: str = 'auto',\n            verbosity: str = 'default'):\n```\n- **source:** 可以是数据框（如示例所示），也可以是一个包含数据框和要在报告中显示的名称的元组。\n例如：`my_df` 或 `[my_df, \"Training\"]`\n- **target_feat:** 一个字符串，表示被标记为“目标”的特征名称。*目前只有布尔型和数值型特征可以作为目标。*\n- **feat_cfg:** 一个 `FeatureConfig` 对象，用于指定在分析中需要跳过的特征，或强制指定为某种类型的特征。参数可以是单个字符串或字符串列表。参数包括 `skip`、`force_cat`、`force_num` 和 `force_text`。“force_”参数会覆盖内置的类型检测。可以这样构造：\n```\nfeature_config = sv.FeatureConfig(skip=\"PassengerId\", force_text=[\"Age\"])\n```\n- **verbosity:** **[新]** 可设置为 `full`、`progress_only`（仅显示进度条，不显示报告生成信息）和 `off`（完全静默，除错误或警告外）。默认的详细程度也可以在 INI 覆盖文件的“General”标题下设置（详情请参阅下方的“配置文件”部分）。\n- **pairwise_analysis:** 相关性和其他关联性分析可能需要二次时间复杂度（n^2）才能完成。默认设置（“auto”）会在数据集包含“association_auto_threshold”个特征之前无提示地运行。超过该阈值后，您需要显式传递参数 `pairwise_analysis=\"on\"`（或 `\"off\"`），因为处理如此多的特征将耗费大量时间。此参数还涵盖了关联图的生成（基于 [Drazen Zaric 的概念](https:\u002F\u002Ftowardsdatascience.com\u002Fbetter-heatmaps-and-correlation-matrix-plots-in-python-41445d0f2bec))：\n\n![成对样本](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_85d2ddb1a738.png)\n\n### 比较两个数据框（例如测试集与训练集）\n要比较两个数据集，只需使用 `compare()` 函数。其参数与 `analyze()` 相同，只是增加了一个用于覆盖比较数据框的第二个参数。建议使用 `[数据框, \"名称\"]` 格式的参数，以便更好地区分基准数据框和比较数据框。（例如：`[my_df, \"Train\"]` 与 `my_df`）\n```\nmy_report = sv.compare([my_dataframe, \"Training Data\"], [test_df, \"Test Data\"], \"Survived\", feature_config)\n```\n\n### 比较同一数据框中的两个子集（例如男性与女性）\n获取深刻洞察的另一种方法是使用比较功能将数据集拆分为两个子群体。\n\n为此提供了内置支持，即 `compare_intra()` 函数。该函数的一个参数是布尔系列，另一个参数是用于命名结果数据集（真、假）的显式“名称”元组。请注意，内部会创建两个独立的数据框来分别表示每个子组。因此，它更像是手动执行此类处理的一种快捷方式。\n```\nmy_report = sv.compare_intra(my_dataframe, my_dataframe[\"Sex\"] == \"male\", [\"Male\", \"Female\"], \"Survived\", feature_config)\n```\n\n## 第 2 步：展示报告\n一旦您创建了报告对象（例如上述示例中的 `my_report`），只需将其传递给以下两个 `show` 函数之一：\n\n### show_html()\n```\nshow_html(  filepath='SWEETVIZ_REPORT.html', \n            open_browser=True, \n            layout='widescreen', \n            scale=None)\n```            \n**show_html(...)** 会按照给定的文件路径创建并保存 HTML 报告。可选项包括：\n- **layout**: 可以是 `'widescreen'` 或 `'vertical'`。宽屏布局在鼠标悬停于每个特征时，会在屏幕右侧显示详细信息。2.0 版本新增的垂直布局在水平方向上更加紧凑，并允许通过单击展开每个详细信息区域。\n- **scale**: 使用浮点数（例如 `scale = 0.8` 或 `None`）来缩放整个报告。这对于使报告适应任何输出非常有用。\n- **open_browser**: 启用自动打开网页浏览器以显示报告的功能。由于在某些情况下可能不希望自动打开浏览器（或者会导致某些 IDE 出现问题），您可以在此处将其禁用。\n\n### show_notebook()\n```\nshow_notebook(  w=None, \n                h=None, \n                scale=None,\n                layout='widescreen',\n                filepath=None,\n                file_layout=None,\n                file_scale=None)\n```            \n**show_notebook(...)** 是 2.0 版本新增的功能，它会将一个 IFRAME 元素嵌入到笔记本中（例如 Jupyter、Google Colab 等），直接显示报告。\n\n请注意，由于笔记本环境通常视觉空间较为有限，因此最好使用自定义的宽度\u002F高度\u002F缩放值（`w`、`h`、`scale`），甚至可以在 INI 覆盖文件中**设置自定义默认值**（见下文）。可选项包括：\n- **w**（宽度）：设置报告输出窗口的宽度（完整报告可能无法完全显示；请使用 `layout` 和\u002F或 `scale` 来调整报告本身）。可以是百分比字符串（`w=\"100%\"`）或像素数（`w=900`）。\n- **h**（高度）：设置报告输出窗口的高度。可以是像素数（`h=700`）或“Full”，以使窗口高度与所有特征对齐（`h=\"Full\"`）。\n- **scale**：与上述 `show_html()` 中的缩放选项相同。\n- **layout**：与上述 `show_html()` 中的布局选项相同。\n- **filepath**：可选的输出 HTML 报告。\n- **file_layout**：仅针对可选文件输出的布局（与上述 `show_html()` 中的布局选项相同）。\n- **file_scale**：仅针对可选文件输出的缩放比例（与上述 `show_html()` 中的缩放选项相同）。\n# 自定义默认值：配置文件\n该软件包包含一个用于配置的 INI 文件。您可以通过提供自己的配置文件并在创建报告之前调用以下代码来覆盖任何设置：\n```\nsv.config_parser.read(\"Override.ini\")\n```\n**重要提示 #1：** 最好在执行任何其他命令之前加载覆盖配置，因为许多 INI 选项都会在报告生成过程中被使用。\n\n**重要提示 #2：** 在您的覆盖 INI 文件中，务必在一组数值之前**放置标题行**（例如 `[General]`），**否则您的设置将被忽略**。请参阅下面的示例。如果设置多个值，只需包含一次 `[General]` 行即可。\n\n### 最有用的配置覆盖\n您可以查看 `sweetviz_defaults.ini` 文件，了解哪些内容可以被覆盖（警告：其中许多内容仍在开发中，文档也不完善），但最有用的覆盖项如下。\n\n#### 默认报告布局和尺寸\n您可以覆盖以下任何一项（将其放入您自己的 INI 文件中，请勿忘记文件头），以避免每次执行 `show` 命令时都需手动设置：\n\n**重要提示**：如果指定百分比，请使用双百分号 `%%`。\n```\n[Output_Defaults]\nhtml_layout = widescreen\nhtml_scale = 1.0\nnotebook_layout = vertical\nnotebook_scale = 0.9\nnotebook_width = 100%%\nnotebook_height = 700\n```\n\n##### 中日韩（CJK）字符支持\n```\n[General]\nuse_cjk_font = 1 \n```\n*\\*如果为 `[general]` 设置多个值，只需包含一次 `[General]` 行*。\n\n这会将图表中的字体切换为支持 CJK 字符的字体。虽然这种字体可能不如其他字体紧凑，但它可以消除针对这些语言的所有警告和“未知字符”符号。\n\n##### 移除 Sweetviz 标志\n```\n[Layout]\nshow_logo = 0\n```\n这会移除页面顶部的 Sweetviz 标志。\n\n##### 设置默认详细程度\n```\n[General]\ndefault_verbosity = off \n```\n*\\*如果为 `[general]` 设置多个值，只需包含一次 `[General]` 行*。\n\n可设置为 `full`、`progress_only`（仅显示进度条，不显示报告生成信息）和 `off`（完全静默，仅显示错误或警告）。\n\n# 相关性\u002F关联性分析\nSweetviz 关联性图和分析的一大洞察来源及独特之处在于，它**将以下内容统一到一张图中**（以及详细视图中）：\n- 数值特征之间的数值相关性\n- 类别型与类别型特征之间的不确定性系数\n- 类别型与数值型特征之间的相关比率\n![成对示例](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_85d2ddb1a738.png)\n\n正方形代表类别型特征之间的关系，圆形代表数值型特征之间的相关性。请注意，为了清晰起见，主对角线留空。\n\n重要提示：由表示不确定性系数的正方形所展示的类别型与类别型特征之间的关联是**非对称的**，这意味着每一行代表的是**行标题（左侧）对每一列能提供多少信息**。_例如，“Sex”、“Pclass”和“Fare”是对“Survived”贡献最大的因素。_\n\n对于泰坦尼克号数据集而言，这些信息相对对称，但并非总是如此！\n\n相关性也会在每个特征的详细部分中显示，并在适用时突出显示目标值。例如：\n![关联性详情](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_readme_0594abd027d8.png)\n\n最后需要注意的是，这些相关性\u002F关联性方法不应被视为绝对真理，它们会对数据的底层分布和关系做出一些假设。然而，它们确实可以作为一个非常有用的起点。\n\n# Comet.ml 集成\n自 2.1 版本起，Sweetviz 现已全面集成 [Comet.ml](https:\u002F\u002Fwww.comet.ml)。这意味着只要您的环境正确设置了 API 密钥，Sweetviz 将会**自动记录使用 `show_html()` 和 `show_notebook()` 生成的所有报告**到您的工作区。\n\n此外，您还可以使用新函数 `report.log_comet(experiment_object)`，将特定实验的报告显式上传到您的工作区。\n\n您可以参阅一个 [Colab 笔记本](https:\u002F\u002Fcolab.research.google.com\u002Fdrive\u002F1SK1I-gU6nLchesbMtFD9ZuzJHyzleFAr?usp=sharing)，用于生成报告，以及其对应的 [Comet.ml 工作区报告](https:\u002F\u002Fwww.comet.ml\u002Ffbdesignpro\u002Fsweetviz-comet\u002Fd005158117c24924b07476887cd5ddfa?experiment-tab=html)。\n\n## Comet 报告参数\n您可以通过覆盖配置文件中的 `[comet_ml_defaults]` 部分，自定义 Sweetviz 报告在 Comet 工作区中的显示方式。有关使用 INI 覆盖的更多信息，请参阅上文。\n\n您可以选择使用 `widescreen`（横向）或 `vertical`（纵向）布局，并设置您偏好的缩放比例，只需将以下内容放入您的覆盖 INI 文件中：\n```\n[comet_ml_defaults]\nhtml_layout = vertical\nhtml_scale = 0.85\n```\n\n# 故障排除 \u002F 常见问题解答\n- **安装问题**\n\n请参阅本文档顶部的“安装问题及解决方法”部分。\n- **亚洲字符，“RuntimeWarning: 当前字体缺少符号 ###”**\n\n请参阅上述关于 CJK 字符支持的部分。如果您发现需要支持更多类型的字符，欢迎在[问题跟踪系统中提交请求](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues)。\n\n- **…其他问题**\n\n由于开发仍在进行中，欢迎您随时在[此处的问题跟踪系统](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues)或我们的[论坛](https:\u002F\u002Fsweetviz.fbdesignpro.com)中报告任何问题和建议（您应该可以使用 GitHub 账户登录！）。\n\n# 贡献\n这是我第一个开源项目！我构建它的目的是使其成为尽可能有用的工具，帮助更多人完成数据科学工作。如果它对您有所帮助，您的贡献将不胜感激，并且形式多样：\n### 1. 宣传推广！\n在 GitHub 上给个项目加一颗星，或者在 Twitter 或 Instagram 上发布一条动态，都是最简单的贡献方式，却有可能极大地推动项目的发展！如果您觉得这个项目有用，这些小小的行动将意义重大，并能产生深远的影响。\n\nKaggle 笔记本\u002F帖子、Medium 文章、YouTube 视频教程等需要更多时间，但效果会更好！\n\n### 2. 报告漏洞和问题\n随着越来越多的人使用该项目，并处理各种新的（甚至“脏”的）数据，预计会出现许多小问题。如果您发现了漏洞，请[在此处新建一个问题](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues)。\n\n### 3. 提供建议并讨论使用场景和功能\n为了让 Sweetviz 更加实用，我们需要了解您希望它实现什么功能，或者如何改进。[请前往我们的 Discourse 论坛发表您的建议；无需登录！](https:\u002F\u002Fsweetviz.fbdesignpro.com)。\n\n### 4. 参与开发\n我非常欢迎任何人在这项目上提供帮助，只需通过问题跟踪器和\u002F或我们的 Discourse 论坛与我联系即可。\n\n请注意，在经历了繁忙的开发期后，目前代码本身仍需进一步清理和完善。 :)\n\n# 特别致谢及相关资料\n### 贡献者\n**特别感谢所有在 GitHub 上通过报告、反馈和提交代码做出贡献的人！** 我要特别感谢 **Frank Male**，他在修复问题和搭建 2.2.0 的新构建流程方面给予了巨大帮助。\n\n[![贡献者](https:\u002F\u002Fcontrib.rocks\u002Fimage?repo=fbdesignpro\u002Fsweetviz)](https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fgraphs\u002Fcontributors)\n\n由 [contrib.rocks](https:\u002F\u002Fcontrib.rocks) 制作。\n\n### 相关资料\n我希望 Sweetviz 能成为一个汇聚业界最佳实践的中心，让人们无需从头开发就能获取最有价值的信息和可视化效果。\n\n为此，我想分享一些曾给予我灵感并被整合进 Sweetviz 的优秀资源：\n\n- [Pandas-Profiling](https:\u002F\u002Fgithub.com\u002Fpandas-profiling\u002Fpandas-profiling) 是本项目的最初灵感来源。其部分类型检测代码已被直接纳入 Sweetviz。\n- [Shaked Zychlinski: 寻找分类变量的相关性](https:\u002F\u002Ftowardsdatascience.com\u002Fthe-search-for-categorical-correlation-a1cf7f1888c9) 是一篇关于不同变量交互类型的精彩文章，也是 Sweetviz 中相关分析的基础。\n- [Drazen Zaric: 在 Python 中绘制更优秀的热力图与相关矩阵图](https:\u002F\u002Ftowardsdatascience.com\u002Fbetter-heatmaps-and-correlation-matrix-plots-in-python-41445d0f2bec) 则为我们设计关联图提供了重要参考。","# Sweetviz 快速上手指南\n\nSweetviz 是一个开源 Python 库，仅需两行代码即可生成美观、高密度的可视化报告，快速启动探索性数据分析（EDA）。它特别适用于分析目标变量特征、对比训练集与测试集，输出结果为独立的 HTML 文件或直接在 Notebook 中展示。\n\n## 环境准备\n\n*   **操作系统**：Windows, macOS, Linux\n*   **Python 版本**：3.6 及以上\n*   **核心依赖**：\n    *   Pandas >= 0.25.3\n    *   NumPy (兼容版本)\n*   **运行环境**：支持标准 Python 脚本、Jupyter Notebook 及 Google Colab。\n\n## 安装步骤\n\n推荐使用 `pip` 进行安装。为确保安装纯净，若之前安装过旧版本，建议先卸载再安装。\n\n```bash\n# 可选：如果之前安装过，建议先卸载以避免冲突\npip uninstall sweetviz\n\n# 安装最新版\npip install sweetviz\n```\n\n> **提示**：国内用户如遇下载缓慢，可添加国内镜像源加速安装：\n> ```bash\n> pip install sweetviz -i https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n## 基本使用\n\n生成报告只需两个步骤：**创建报告对象** 和 **渲染输出**。\n\n### 1. 最简单的单数据集分析\n\n假设你有一个名为 `df` 的 Pandas DataFrame，想要分析其中 `\"Survived\"` 列作为目标变量：\n\n```python\nimport sweetviz as sv\n\n# 步骤 1: 创建报告对象\n# target_feat 指定目标列名（仅支持数值型或布尔型）\nmy_report = sv.analyze(df, target_feat=\"Survived\")\n\n# 步骤 2: 生成并打开 HTML 报告\n# 默认生成 \"SWEETVIZ_REPORT.html\" 并在浏览器打开\nmy_report.show_html()\n```\n\n### 2. 对比两个数据集（如训练集 vs 测试集）\n\n```python\nimport sweetviz as sv\n\n# 对比训练集和测试集，建议为数据框指定名称以便区分\nmy_report = sv.compare(\n    [train_df, \"Training Data\"], \n    [test_df, \"Test Data\"], \n    target_feat=\"Survived\"\n)\n\nmy_report.show_html()\n```\n\n### 3. 在 Jupyter Notebook \u002F Colab 中直接展示\n\n如果你希望在 Notebook 单元格内直接查看报告，而非弹出浏览器：\n\n```python\nimport sweetviz as sv\n\nmy_report = sv.analyze(df, target_feat=\"Survived\")\n\n# 在 Notebook 中嵌入显示\n# w\u002Fh 可设置宽高，scale 可调整缩放比例\nmy_report.show_notebook(w=1000, h=800, scale=0.8)\n```\n\n### 关键参数说明\n\n*   **`target_feat`**: 指定需要重点分析的目标列（如预测标签）。\n*   **`layout`**: 在 `show_html` 或 `show_notebook` 中设置，可选 `'widescreen'` (宽屏，默认) 或 `'vertical'` (垂直紧凑布局)。\n*   **`scale`**: 浮点数，用于整体缩放报告大小（例如 `0.8` 缩小至 80%），适应不同屏幕。\n*   **`feat_cfg`**: 高级配置，可用于跳过某些列或强制指定列的数据类型（如将数值型强制视为分类别）。","某金融风控团队的数据科学家正在紧急分析新的信贷违约数据集，需要在半天内完成探索性数据分析（EDA）并向业务方汇报关键特征与目标变量（是否违约）的关系。\n\n### 没有 sweetviz 时\n- 分析师需手动编写大量 Matplotlib 或 Seaborn 代码来绘制每个特征的分布图，耗时且容易出错。\n- 对比训练集与测试集的数据分布差异时，只能凭感觉或分别画图目测，难以快速发现数据漂移问题。\n- 处理混合类型数据（如数值型收入与分类型职业）的相关性分析时，需分别计算皮尔逊系数或不确定的系数，流程繁琐。\n- 缺失值、异常值和基础统计信息分散在不同代码单元格中，缺乏统一的可视化概览，汇报材料制作效率极低。\n\n### 使用 sweetviz 后\n- 仅需两行代码即可自动生成包含所有特征分布、统计摘要及缺失值分析的高密度 HTML 报告，将数小时工作压缩至分钟级。\n- 利用内置的“数据集对比”功能，一键并排展示训练集与测试集在目标变量及各特征上的差异，迅速定位数据分布不一致处。\n- 自动识别数据类型并无缝集成数值、分类及混合类型的相关性分析，直观呈现各特征与“是否违约”目标的关联强度。\n- 生成的自包含 HTML 报告交互性强且美观，可直接发送给非技术背景的业务 stakeholders 进行审阅，无需额外美化排版。\n\nsweetviz 将原本枯燥冗长的数据探查过程转化为即时可视化的洞察，让团队能专注于策略制定而非代码调试。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Ffbdesignpro_sweetviz_33d4814b.png","fbdesignpro","Francois Bertrand","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Ffbdesignpro_d29bf42d.png",null,"https:\u002F\u002Fwww.fbdesignpro.com","https:\u002F\u002Fgithub.com\u002Ffbdesignpro",[79,83,87],{"name":80,"color":81,"percentage":82},"Python","#3572A5",70.1,{"name":84,"color":85,"percentage":86},"HTML","#e34c26",23.2,{"name":88,"color":89,"percentage":90},"JavaScript","#f1e05a",6.7,3091,288,"2026-04-10T14:30:45","MIT",1,"未说明 (基于 Python 标准库，通常支持 Linux, macOS, Windows)","不需要 GPU","未说明 (取决于处理的数据集大小)",{"notes":100,"python":101,"dependencies":102},"该工具生成独立的 HTML 报告。在 Google Colab 等需要自定义文件操作的特定环境中，原声支持可能受限（需使用 show_notebook 功能）。如果通过 pip 升级遇到问题，建议先卸载再安装。避免将脚本命名为 sweetviz.py 以防冲突。","3.6+",[103],"pandas>=0.25.3",[14,105,16],"其他",[107,108,109,110,111,112,113,114,115,116,117,118,119],"pandas-dataframe","eda","pandas","data-exploration","data-analysis","data-science","data-visualization","machine-learning","data-profiling","exploratory-data-analysis","statistics","exploration","python","2026-03-27T02:49:30.150509","2026-04-11T03:40:55.235680",[123,128,133,138,143,148],{"id":124,"question_zh":125,"answer_zh":126,"source_url":127},28870,"遇到 'ValueError: index must be monotonic increasing or decreasing' 错误怎么办？","这通常是由于升级不完整导致的。解决方案是彻底卸载并重新安装 sweetviz，而不仅仅是执行升级操作。请运行以下命令：\n1. pip uninstall sweetviz\n2. pip install sweetviz\n重新安装后问题通常即可解决。","https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues\u002F10",{"id":129,"question_zh":130,"answer_zh":131,"source_url":132},28871,"如何处理 'FloatingPointError: divide by zero encountered in true_divide' 或相关系数计算错误？","该错误通常发生在两个特征之间只有一行数据包含非空值（non-NaN）时，导致无法计算有效的相关系数。维护者已在 v2.0.8 版本中修复了此问题：现在会发出警告并将相关系数设为 1.0。如果您遇到此错误，请将 sweetviz 升级到最新版本（pip install --upgrade sweetviz）。此外，请检查数据中是否将空字符串误用作空值（nulls），建议在分析前清洗数据。","https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues\u002F52",{"id":134,"question_zh":135,"answer_zh":136,"source_url":137},28872,"遇到 'AttributeError: module 'numpy' has no attribute 'warnings'' 错误如何解决？","这通常是因为环境中安装的 sweetviz 版本过旧（如 2.1 版），与当前的 numpy 版本不兼容，尽管代码可能指向新版本。解决方法是确保在正确的虚拟环境中执行干净的重新安装：\n1. 确认当前激活的环境。\n2. 运行 pip uninstall sweetviz 卸载。\n3. 运行 pip install sweetviz 重新安装最新版本（建议 2.2+）。\n如果问题依旧，尝试创建一个新的虚拟环境并重新安装所有依赖。","https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues\u002F150",{"id":139,"question_zh":140,"answer_zh":141,"source_url":142},28873,"安装成功但运行时提示 'ModuleNotFoundError: No module named sweetviz' 怎么办？","这通常意味着包被安装到了不同的 Python 环境或路径中，而您当前运行的脚本使用的是另一个环境。解决方法包括：\n1. 检查 Python 路径：在终端运行 `which python` (Mac\u002FLinux) 或 `where python` (Windows) 确认当前环境。\n2. 在同一环境中重新安装：确保在安装和运行脚本时使用完全相同的解释器。\n3. 尝试创建全新的虚拟环境：\n   - python -m venv new_env\n   - source new_env\u002Fbin\u002Factivate (或 Windows 下的 new_env\\Scripts\\activate)\n   - pip install sweetviz\n有时简单地等待片刻或重启终端\u002FIDE 也能解决缓存问题。","https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues\u002F37",{"id":144,"question_zh":145,"answer_zh":146,"source_url":147},28874,"为什么整数特征（如值为 1 和 2）没有被当作分类变量处理？","Sweetviz 默认会根据基数（唯一值的数量）和数据类型自动推断特征类型。如果整数列的唯一值较少但仍被视为数值型，您可以使用 FeatureConfig 强制将其指定为分类变量。示例代码如下：\nimport sweetviz as sv\nfrom sweetviz import FeatureConfig\n\n# 强制将特定列设为分类类型\nmy_config = FeatureConfig(force_num=[], force_cat=['your_column_name'], force_text=[])\nreport = sv.analyze(df, feat_cfg=my_config)\n通过 force_cat 参数明确指定列名即可解决此问题。","https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fissues\u002F48",{"id":149,"question_zh":150,"answer_zh":151,"source_url":127},28875,"如何在 Jupyter Notebook 中直接显示报告而不是生成 HTML 文件？","在 Jupyter Notebook 中，调用 show_html() 方法时传入参数 inline=True 即可直接在单元格中渲染报告，而无需打开浏览器或保存文件。示例代码：\nimport sweetviz as sv\nreport = sv.analyze(df)\nreport.show_html(inline=True)\n注意：这需要您的 Jupyter 环境支持 HTML 渲染（大多数现代版本均支持）。",[153,158,163,168,173,178,183,188,193,198],{"id":154,"version":155,"summary_zh":156,"released_at":157},197701,"v2.3.2","## 变更内容\n* 修复：由 @gavindsouza 在 https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fpull\u002F176 中移除未使用的 distutils 导入。\n* 修复可见的弃用警告，即 pkg_resources 的弃用问题，由 @frank1010111 在 https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fpull\u002F178 中完成。\n* 修复 #185：减轻全局 NumPy 错误配置的影响。由 @smolenski9ld 在 https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fpull\u002F186 中完成。\n\n## 新贡献者\n* @gavindsouza 在 https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fpull\u002F176 中完成了首次贡献。\n* @smolenski9ld 在 https:\u002F\u002Fgithub.com\u002Ffbdesignpro\u002Fsweetviz\u002Fpull\u002F186 中完成了首次贡献。","2026-04-05T00:02:19",{"id":159,"version":160,"summary_zh":161,"released_at":162},197702,"v2.3.1","修复并增强了笔记本文件输出","2023-11-29T13:30:45",{"id":164,"version":165,"summary_zh":166,"released_at":167},197703,"v2.3.0","### 增加了详细输出级别，修复了多项长期存在的问题\r\n\r\n- **新增：** 用于控制**详细程度**的参数（full、progress_only、off）\r\n- **修复：** 由于分箱方式错误导致的直方图不准确问题（感谢 @troy46），修复 #116、#127\r\n- **修复：** 在某些情况下对分类序列的检测不正确的问题\r\n- **修复：** *is_categorical_dtype* 的弃用警告（感谢 @GegznaV），修复 #162\r\n","2023-11-16T14:04:33",{"id":169,"version":170,"summary_zh":171,"released_at":172},197704,"v2.2.1","重大兼容性更新：\n- 修复了与 Pandas 2.0+ 和 NumPy 1.24+ 的不兼容问题\n- 修复了多个弃用警告\n- 现在要求 Python 3.7 或更高版本\n- 更新为使用最新的发布流程","2023-08-26T11:31:52",{"id":174,"version":175,"summary_zh":176,"released_at":177},197705,"v2.1.4","此版本修复了与最新软件包相关的弃用警告。","2022-06-14T21:52:54",{"id":179,"version":180,"summary_zh":181,"released_at":182},197706,"v2.1.2","修复了在某些情况下 comet.ml 的问题。","2021-05-28T14:19:52",{"id":184,"version":185,"summary_zh":186,"released_at":187},197707,"2.1.1","包含 Comet.ml 集成，以及若干修复。","2021-05-27T17:35:45",{"id":189,"version":190,"summary_zh":191,"released_at":192},197708,"v2.0.9","在数值型特征的汇总中新增了“零值”数量的显示。","2021-02-26T17:36:35",{"id":194,"version":195,"summary_zh":196,"released_at":197},197709,"v2.0.7","新版本发布，新增 Jupyter\u002FColab 等笔记本集成，并带来大量提升使用体验的改进和问题修复。","2021-02-20T16:56:49",{"id":199,"version":200,"summary_zh":201,"released_at":202},197710,"v1.1.2","这是 Sweetviz 的首个正式发布版本！我们修复了大量稳定性问题，并新增了一些功能。完整更新日志请参阅变更记录。\n\n感谢所有提交修复和 bug 报告的贡献者。你们的帮助对提升这个库的质量至关重要，请大家继续支持！","2020-11-24T13:26:42"]