Cool-Fashion-Papers

629 109 困难 1 次阅读 3周前MIT图像其他开发框架

AI 解读由 AI 自动生成，仅供参考

Cool-Fashion-Papers 是一个专注于时尚与人工智能交叉领域的开源资源库，旨在汇集该方向最前沿的学术论文、数据集、行业会议及相关企业信息。它主要解决了时尚科技领域研究资料分散、难以系统性获取的痛点，为从业者提供了一个持续更新的一站式知识索引。

该资源库特别适合 AI 研究人员、计算机视觉开发者以及时尚科技公司的技术团队使用。无论是希望了解虚拟试衣最新算法的研究者，还是寻找训练数据的产品经理，都能在此快速定位所需内容。其核心亮点在于对文献进行了细致的分类整理，涵盖图像合成（如高保真虚拟试衣）、服装分类、个性化推荐及潮流预测等关键方向。列表中收录了包括 VITON-HD、CIT 在内的多个经典模型，并详细标注了论文出处、arXiv 编号及对应的代码项目链接。通过按时间顺序梳理技术演进路径，Cool-Fashion-Papers 不仅帮助用户高效追踪学术动态，也为复现先进算法和开展创新应用提供了坚实的资源基础。

使用场景

某时尚科技初创公司的算法团队正致力于研发一款高保真“虚拟试衣”功能，旨在让用户上传照片即可预览不同服装的上身效果。

没有 Cool-Fashion-Papers 时

检索效率低下：工程师需在 arXiv、Google Scholar 等多个平台分散搜索"Virtual Try-On"相关论文，耗时数天仍难以覆盖最新成果。
复现门槛过高：找到的论文往往缺乏对应的开源代码链接，或仓库已失效，导致算法验证和对比实验无法启动。
技术选型盲目：由于缺乏按任务（如合成、分类）分类的清晰指引，团队难以判断该采用基于 Flow 的模型还是 GAN 架构，容易选错技术路线。
资源碎片化：数据集、行业会议和相关公司信息散落在各处，难以形成完整的技术生态视图，阻碍了产品落地的整体规划。

使用 Cool-Fashion-Papers 后

一站式获取前沿成果：团队直接查阅按时间排序的论文列表，迅速锁定了 CVPR 2021 的 VITON-HD 和 DCTON 等高分辨率试衣最新方案。
代码复现零障碍：每个模型条目均附带官方 GitHub 链接（如 CIT、PF-AFN），开发人员当天即可拉取代码进行基线测试。
精准技术决策：借助清晰的目录分类（Synthesis/Classification 等），团队快速对比了不同模型在“姿态保持”和“细节生成”上的优劣，确定了最优架构。
生态资源整合：通过关联的数据集和公司板块，团队不仅找到了训练数据，还了解了竞品动态，加速了从研发到商业化的进程。

Cool-Fashion-Papers 将原本需要数周的文献调研与资源收集工作压缩至几小时，成为时尚 AI 领域开发者不可或缺的效率加速器。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库（Cool-Fashion-Papers）是一个时尚领域相关论文、数据集、会议和资源的列表合集，本身不是一个可独立运行的 AI 模型或软件工具，因此 README 中未包含具体的运行环境需求（如操作系统、GPU、内存、Python 版本或依赖库）。用户若需运行列表中提到的具体模型（如 VITON-HD, CIT 等），需前往各模型对应的独立项目链接查看其特定的环境配置要求。

python未说明

快速开始

时尚领域精选论文 👔👗🕶️🎩

时尚相关论文与资源（公司、数据集、会议、研讨会等）。

论文按 arXiv 初稿提交时间排序（如适用）。

欢迎提交 PR 或 Issue。

论文
- 合成
- 分类
- 推荐
- 预测
相关活动
数据集
公司
其他实用资源

论文

合成

模型	标题	发表	论文	链接
Pose with style	姿态风格化：基于条件 StyleGAN 的细节保留姿态引导图像合成	SIGGRAPH ASIA 2021	[2109.06166]	[project]
CIT	CIT：用于虚拟试穿的布料交互 Transformer	arXiv	[2104.05519]	[Amazingren / CIT]
VITON-HD	VITON-HD：基于错位感知归一化的高分辨率虚拟试穿	CVPR 2021	[2103.16874]	[shadow2496 / VITON-HD]
DCTON	解耦循环一致性实现高度逼真的虚拟试穿	CVPR 2021	[2103.09479]	[ChongjianGE / DCTON]
PF-AFN	无需解析器的虚拟试穿：通过蒸馏外观流实现	CVPR 2021	[2103.04559]	[geyuying / PF-AFN]
SieveNet	SieveNet：鲁棒的基于图像的虚拟试穿统一框架	WACV 2020	[2001.06265]
	细节至上：带细节雕刻的虚拟试穿	arXiv	[1912.06324]	[AIprogrammer / Down-to-the-Last-Detail-Virtual-Try-on-with-Detail-Carving]
ClothFlow	ClothFlow：基于流模型的着装人物生成	ICCV 2019	[paper]
FW-GAN	FW-GAN：面向视频虚拟试穿的流导航变形 GAN	ICCV 2019	[paper]
	使用任意姿势虚拟试穿新服装	MM 2019	[paper]	[project]
	生成穿着定制服装的高分辨率时尚模特图像	ICCVW 2019	[1908.08847]
Fashion++	Fashion++：用于提升穿搭效果的最小化编辑	ICCV 2019	[1904.09261]	[project]
MG-VTON	多姿态引导的虚拟试穿网络	arXiv	[1902.11026]
FiNet	兼容且多样化的时尚图像修复	ICCV 2019	[1902.01096]
M2E-Try On Net	M2E-Try On Net：从模特到大众的时尚	arXiv	[1811.08599]
FashionGAN	FashionGAN：使用条件生成对抗网络展示你的时尚设计	CG Forum 2018	[paper]
PIVTONS	PIVTONS：具有条件图像补全功能的姿态不变虚拟试鞋	ACCV 2018	[paper]	[project]
SwapNet	SwapNet：基于图像的服装转移	ECCV 2018	[paper]	[andrewjong / SwapNet]
FiLMedGAN	基于语言指导和特征变换的时尚图像操控	ECCVW 2018	[1808.04000]
CP-VITON	致力于保持特征的基于图像的虚拟试穿网络	ECCV 2018	[1807.07688]	[sergeywong / cp-vton]
	在 GAN 中解耦多个条件输入	ECCVW 2018	[1806.07819]	[zalandoresearch / disentangling_conditional_gans]
DesIGN	DesIGN：来自生成网络的设计灵感	ECCVW 2018	[1804.00921]
VITON	VITON：基于图像的虚拟试穿网络	CVPR 2018	[1711.08447]	[xthan / VITON]
DVBPR	基于生成式图像模型的视觉感知时尚推荐与设计	ICDM 2017	[1711.02231]	[kang205 / DVBPR]
FashionGAN	成为你自己的 Prada：具有结构一致性的时尚合成。	ICCV 2017	[1710.07346]	[project]
CAGAN	条件类比 GAN：在人物图像上交换时尚单品	ICCVW 2017	[1709.04695]

分类

模型	标题	发表	论文	链接
DeepFashion2	DeepFashion2：服装图像检测、姿态估计、分割和重识别的多功能基准	CVPR 2019	[1901.07973]	[switchablenorms / DeepFashion2]
	品牌 > 标志：时尚品牌的视觉分析	ECCVW 2018	[1810.09941]
BCRNN	用于时尚关键点检测和服装类别分类的注意力时尚语法网络	CVPR 2018	[paper]
	Studio2Shop：从工作室拍摄到时尚商品	ICPRAM 2018	[1807.00556]
FashionBrain	FashionBrain项目：理解欧洲时尚数据宇宙的愿景	KDDW 2017	[1710.09788]	[project]
	自动的空间感知时尚概念发现	ICCV 2017	[1708.01311]	[xthan / fashion-200k]
DFA	野外时尚关键点检测	ECCV 2016	[1608.03049]	[liuziwei7 / fashion-landmarks]
FashionNet	DeepFashion：通过丰富的标注支持鲁棒的服装识别与检索	CVPR 2016	[paper]	[project]

模型	标题	发表	论文	链接
	用于时尚搭配的半监督视觉表示学习	RecSys 2021	[2109.08052]
POG	POG：阿里巴巴iFashion中的个性化穿搭生成	KDD 2019	[1905.01866]
	基于美学的服装推荐	WWW 2018	[1809.05822]
CRAFT	CRAFT：利用对抗性特征转换器进行互补推荐	ECCVW 2018	[1804.10871]
	学习类型感知嵌入以实现时尚搭配	ECCV 2018	[1803.09196]
NeuroStylist	NeuroStylist：用于服装搭配的神经网络兼容性建模	MM 2017	[paper]
	深度跨领域时尚推荐	RecSys 2017	[paper]
	基于LSTM的动态客户模型用于时尚推荐	RecSys 2017	[1708.07347]
	使用双向LSTM学习时尚搭配	MM 2017	[1707.05691]	[xthan / polyvore]
	时尚DNA：融合内容与销售数据以进行推荐和商品映射	KDD 2016	[1609.02489]

预测

模型	标题	发表	论文
Style Quotient	理解时尚度：是什么驱动了某种风格的销售？	KDDW 2018	[1806.11424]
Sales Potential	销售潜力：建模时尚产品视觉美学的可销售性	KDDW 2017	[paper]
	时尚前沿：预测时尚中的视觉风格	ICCV 2017	[1705.06394]

数据集

Fashionpedia [网站]
DeepFashion2数据集 [网站]
DeepFashion数据集 [网站]
FashionGen [网站]
FashionAI [Tianchi]
TaobaoClothMatch [Tianchi]
Fashion-MNIST [zalandoresearch/fashion-mnist]
Fashion IQ [网站]

企业

名称	成立年份	信息	新闻
Myntra	2007	预测、合成	[2017.11 livemint]
阿里巴巴图像和美	2009	识别	[2018.7 FashionAI]
STITCH FIX、BLOG	2011	个性化	[2018.5 Forbes]
Heuritech	2013	预测、识别	[2019.1 Fashnerd]
[Yi+] (http://www.dressplus.cn/home)	2014	识别	[2018.8 融资]
MALONG TECHNOLOGIES	2014	识别	[2018.7 Forbes]
syte	2015	识别	[2018.12 与 farfetch 合作]
GrokStyle（2019.2 被 Facebook 收购）	2015	搜索	[2019.2 被 Facebook 收购]
Zalando Research	2016	研究	[2016.10 成立]
MatchU 码尚	2016	建模	[2018.12 融资]
mode.ai	2016	识别、NLP、搜索	[2018.5 TechRepublic]
Markable.AI	2016	识别、搜索	[2018.7 journal sentinel]
衣呼 YIHU (TOZI)	2017	3D 建模	[2018.9 融资]
macty.eu	2017	识别、搜索、推荐、NLP	[2018.12 START IT]
极睿 infimind	2017
知衣 zhiyi	2018
glitch-ai	2019	AI 设计	[2019.6 新闻]
深尚科技 StylingAI	2019	AI 设计	[2020.1 新闻]

其他有用资源

Cool-Fashion-Papers 快速上手指南

Cool-Fashion-Papers 并非一个单一的代码库或可执行工具，而是一个时尚领域 AI 论文、数据集、相关会议及公司的精选资源列表。它旨在为研究人员和开发者提供该领域的最新进展索引。

因此，本指南将指导你如何获取该资源列表，并演示如何利用列表中的信息快速启动一个典型的时尚 AI 项目（以虚拟试穿模型为例）。

环境准备

由于本项目是资源索引，无需安装特定的主程序。但若要运行列表中引用的具体模型（如 VITON-HD, CIT 等），通常需要以下通用环境：

操作系统: Linux (推荐 Ubuntu 18.04/20.04) 或 macOS
Python: 3.7 或更高版本
深度学习框架: PyTorch (大多数时尚生成模型基于此)
硬件: 建议使用支持 CUDA 的 NVIDIA GPU (显存建议 8GB 以上，高分辨率模型需 16GB+)
依赖管理: pip 或 conda

安装步骤

1. 获取资源列表

首先，克隆该仓库到本地以浏览完整的论文和代码链接：

git clone https://github.com/sergeywong/cool-fashion-papers.git
cd cool-fashion-papers

2. 选择并安装具体模型

在 README.md 的 Papers 部分找到你感兴趣的模型（例如 VITON-HD），点击其对应的 GitHub 链接进入项目主页。

以 VITON-HD (高分辨率虚拟试穿) 为例，安装步骤如下：

# 克隆具体模型代码库
git clone https://github.com/shadow2496/VITON-HD.git
cd VITON-HD

# 创建虚拟环境 (推荐)
conda create -n viton-hd python=3.8
conda activate viton-hd

# 安装 PyTorch (根据官方推荐版本，此处以 CUDA 11.1 为例)
# 国内用户推荐使用清华源加速
pip install torch==1.9.0+cu111 torchvision==0.10.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

(注：不同模型的具体依赖请参考各自仓库的 requirements.txt)

基本使用

由于 Cool-Fashion-Papers 本身是索引，"使用"它意味着利用它找到工具并运行。以下是基于列表中 Synthesis (图像合成) 类别的典型工作流示例。

示例：运行虚拟试穿 (Virtual Try-On)

假设你已按照上述步骤安装了 VITON-HD，以下是推理测试的基本流程：

准备数据：下载预训练模型和数据集（通常在模型主页提供链接）。
执行推理：

# 进入项目目录
cd VITON-HD

# 运行测试脚本 (参数需根据具体模型文档调整)
python test.py --dataroot ./dataset/examples --name viton_hd --stage 2 --which_model_netG latest

如何探索更多资源

你可以直接在本地查看 README.md 文件，利用目录结构快速定位需求：

图像生成/试穿: 查看 Papers -> Synthesis 章节（包含 VITON, CP-VTON, SwapNet 等）。
分类与检测: 查看 Papers -> Classification 章节（包含 DeepFashion2, FashionLandmark 等）。
推荐系统: 查看 Papers -> Recommendation 章节。
数据集下载: 查看 Datasets 章节，获取 Fashionpedia, DeepFashion 等数据源的官方链接。
学术会议: 查看 Related Events 章节，追踪 KDD, CVPR, ICCV 等会议上的时尚专题研讨会。

通过该列表，你可以直接跳转到对应论文的 arXiv 链接阅读细节，或跳转到 GitHub 链接获取源码。

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 140.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|昨天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架