awesome-3d-reconstruction-papers

908 64 非常简单 1 次阅读 4天前其他

AI 解读由 AI 自动生成，仅供参考

awesome-3d-reconstruction-papers 是一个专注于深度学习时代 3D 重建领域的论文精选合集。它致力于解决研究人员和开发者在面对海量学术文献时，难以快速定位高质量、分类清晰的研究成果的痛点。

该资源将复杂的 3D 重建技术体系化地梳理为对象级（单视图、多视图、无监督）、场景级、神经表面表示以及综述等多个维度。其独特亮点在于不仅罗列论文标题，还详细标注了每篇研究采用的几何表示方法（如点云、网格、体素等）、发表会议（如 CVPR、ICCV、NeurIPS）以及对应的项目主页或开源代码链接。这种结构化的整理方式，极大地降低了追踪前沿算法复现细节的门槛。

无论是希望快速了解领域全貌的初学者，还是需要寻找特定技术路线参考的资深研究员，亦或是正在探索 3D 视觉落地的工程师，都能从中高效获取所需信息。通过持续更新的社区贡献，awesome-3d-reconstruction-papers 已成为连接理论与工程实践的重要桥梁，帮助用户在 3D 重建的探索之路上少走弯路。

使用场景

某自动驾驶初创公司的算法团队正致力于提升车辆对道路障碍物的感知能力，计划引入最新的单目 3D 重建技术，以便仅通过车载摄像头就能精准还原前方车辆的立体结构。

没有 awesome-3d-reconstruction-papers 时

文献检索如大海捞针：研究人员需在 Google Scholar 和 arXiv 上手动筛选海量论文，难以区分哪些是真正针对“单视图物体级重建”的前沿成果，极易遗漏关键研究。
复现成本高昂且盲目：找到论文后，往往发现官方未开源代码或链接失效，团队不得不花费数周时间尝试复现基础模型，却不知已有成熟的开源项目（如 PointSetGeneration 或 AtlasNet）可直接参考。
技术选型缺乏全局视野：由于缺乏系统分类，团队难以快速对比体素（Voxel）、点云（Point Cloud）和网格（Mesh）等不同表示方法在特定场景下的优劣，导致技术路线决策缓慢且可能存在偏差。
前沿动态跟进滞后：深度学习领域迭代极快，人工追踪最新会议（如 CVPR、ICCV）的 3D 重建论文效率低下，容易错失能显著提升精度的新架构。

使用 awesome-3d-reconstruction-papers 后

精准定位核心资源：团队直接查阅"Object-level -> Single-view"分类表，瞬间锁定近五年顶会中所有相关论文，并一键获取对应的代码仓库或项目主页，将调研时间从数周缩短至数小时。
高效验证与复用：借助列表中提供的成熟代码链接（如 SurfNet 或 Image2Mesh），工程师能快速搭建基线系统进行测试，避免了重复造轮子，将精力集中在针对驾驶场景的优化上。
科学决策技术路线：通过表格清晰对比不同论文的“表示类型”和“发表 venue"，团队迅速评估出适合实时性要求的点云生成方案，制定了更稳健的开发路径。
同步学术最前沿：依托该清单的持续更新机制，团队能即时掌握神经表面重建等新兴方向，确保技术方案始终处于行业领先地位。

awesome-3d-reconstruction-papers 将分散的学术成果转化为结构化的工程资产，极大降低了 3D 视觉技术的落地门槛与研发周期。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个论文列表合集（Awesome List），而非单个可执行的软件工具。它收录了多篇关于 3D 重建的学术论文及其对应的外部代码仓库链接。因此，本仓库本身没有特定的运行环境、GPU、内存或依赖库需求。若要运行列表中提到的具体算法，需访问各论文对应的独立项目链接，并参考其各自的安装说明。

python未说明

awesome-3d-reconstruction-papers hero image

快速开始

优秀的3D重建论文

深度学习时代下的3D重建论文合集。欢迎贡献 :)

论文	表示形式	会议/期刊	项目/代码
基于单张图像的3D物体重建点云生成网络	点云	CVPR 2017	代码
SurfNet：利用深度残差网络生成3D形状表面	网格	CVPR 2017	代码
OctNet：在高分辨率下学习深度3D表示	体素	CVPR 2017	代码
重新思考重投影：闭合单张图像姿态感知形状重建的闭环	体素	ICCV 2017	/
MarrNet：通过2.5D草图进行3D形状重建	体素	NIPS 2017	项目
用于3D物体重建的层次化表面预测	体素	3DV 2017	代码
Image2Mesh：单张图像3D重建的学习框架	网格	ACCV 2018	代码
为密集3D物体重建学习高效的点云生成	点云	AAAI 2018	项目
纸浆工艺方法用于学习3D表面生成	网格	CVPR 2018	项目
像素、体素和视角：单视图3D物体形状预测的形状表示研究	通用	CVPR 2018	项目
Im2Struct：从单张RGB图像恢复3D形状结构	部件	CVPR 2018	代码
套娃网络：通过嵌套形状层预测3D几何	体素	CVPR 2018	代码
多视图一致性作为学习形状和姿态预测的监督信号	体素	CVPR 2018	项目
利用变形向量场进行高效密集点云物体重建	点云	ECCV 2018	/
GAL：用于单视图3D物体重建的几何对抗损失	点云	ECCV 2018	/
从图像集合中学习特定类别的网格重建	网格	ECCV 2018	项目
学习单视图3D补全和重建的形状先验	体素	ECCV 2018	/
在有限姿态监督下学习单视图3D重建	体素	ECCV 2018	代码
Pixel2Mesh：从单张RGB图像生成3D网格模型	网格	ECCV 2018	代码
残差MeshNet：学习对网格进行变形以实现单视图3D重建	网格	3DV 2018	/
学习从未见过的类别中重建形状	通用	NIPS 2018	项目
多视图轮廓与深度分解用于高分辨率3D物体表示	体素	NIPS 2018	代码
MVPNet：用于从单张图像重建3D物体的多视图点回归网络	点云	AAAI 2019	项目
带有视觉壳嵌入的深度单视图3D物体重建	体素	AAAI 2019	代码
占用网络：在函数空间中学习3D重建	隐式	CVPR 2019	代码
学习用于生成式形状建模的隐式场	隐式	CVPR 2019	项目
基于骨架桥接的深度学习方法，用于从单张RGB图像生成复杂拓扑的网格	网格	CVPR 2019	代码
单视图3D重建网络学到了什么？	通用	CVPR 2019	代码
深度水平集：用于3D形状推断的隐式表面表示	隐式	arXiv 2019	/
通过拓扑修改网络从单张RGB图像进行深度网格重建	网格	ICCV 2019	代码
用于形状表示的深度元函数	隐式	ICCV 2019	代码
GraphX卷积用于2D到3D转换中的点云变形	点云	ICCV 2019	代码
Pix2Vox：上下文感知的单视图和多视图图像3D重建	体素	ICCV 2019	代码
领域自适应的单视图3D重建	体素	ICCV 2019	代码
通过先验知识实现单张图像3D重建的少样本泛化	体素	ICCV 2019	代码
DISN：高质量单视图3D重建的深度隐式表面网络	隐式	NIPS 2019	代码
Front2Back：通过前后预测进行单视图3D形状重建	网格	CVPR 2020	代码
BSP-Net：通过二叉空间分割生成紧凑网格	网格	CVPR 2020	项目
单视图3D预测的高度和直立性不变性	点云	CVPR 2020	代码
特征空间中的隐式函数用于3D形状重建和补全	隐式	CVPR 2020	项目
无监督学习可能对称的可变形3D物体，来自野外图像	网格	CVPR 2020	项目
CvxNet：可学习的凸分解	原始	CVPR 2020	项目
深度局部形状：学习用于精细3D重建的局部SDF先验	隐式	ECCV 2020	代码
具有组合先验的少样本单视图3D物体重建	体素	ECCV 2020	代码
GSIR：可泛化的3D形状解释和重建	体素	ECCV 2020	/
DR-KFS：用于3D形状重建的可微分视觉相似度度量	网格	ECCV 2020	/
基于语义一致性的自监督单视图3D重建	网格	ECCV 2020	项目
无关键点的形状和视点	网格	ECCV 2020	项目
瓢虫：用于具有对称性的深度隐式场3D重建的准蒙特卡洛采样	网格	ECCV 2020	代码
学习用于3D重建的可变形四面体网格	网格	NIPS 2020	项目
SDF-SRN：从静态图像学习有符号距离3D物体重建	隐式	NIPS 2020	项目
UCLID-Net：在对象空间中进行单视图重建	网格	NIPS 2020	代码
Pix2Vox++：多尺度上下文感知的单张和多张图像3D物体重建	体素	IJCV 2020	代码
D2IM-Net：从单张图像学习细节解耦的隐式场	隐式	CVPR 2021	代码
NeRD：神经3D反射对称检测器	/	CVPR 2021	代码
通过学习局部和全局形状先验的层级结构来促进单视图3D重建的泛化	隐式	CVPR 2021	代码
基于内存中形状先验的单视图3D物体重建	体素	CVPR 2021	项目
隐式表面表示作为神经网络中的层	隐式	ICCV 2021	/
Ray-ONet：从单张RGB图像高效重建3D	隐式	BMVC 2021	项目
学习带有梯度方向对齐的锚定无符号距离函数，用于单视图服装重建	隐式	ICCV 2021	代码
几何粒度感知的像素到网格	网格	ICCV 2021	/
Sketch2Mesh：从草图重建和编辑3D形状	网格	ICCV 2021	代码
3DIAS：使用隐式代数曲面进行3D形状重建	原始	ICCV 2021	项目
单视图3D重建网络中重建与识别的数据分散视角	点云	3DV 2021	代码
从单张图像重建新颖物体形状	隐式	3DV 2021	项目
AutoSDF：用于3D补全、重建和生成的形状先验	隐式	CVPR 2022	项目
通过解耦属性流从2D图像进行3D形状重建	点云	CVPR 2022	代码
预训练、自训练、蒸馏：扩大3D重建规模的简单配方	隐式	CVPR 2022	项目
神经模板：拓扑感知的3D网格重建和解耦生成	混合	CVPR 2022	代码
SkeletonNet：一种保持拓扑结构的解决方案，用于学习从RGB图像重建物体表面的网格	网格	TPAMI 2022	代码
训练数据生成网络：通过双层优化进行形状重建	隐式	ICLR 2022	/
结构性因果3D重建	混合	ECCV 2022	/
具有记忆先验对比网络的少样本单视图3D重建	体素	ECCV 2022	/
通过原型形状先验进行半监督单视图3D重建	体素	ECCV 2022	/
具有高保真形状和纹理的单视图3D场景重建	隐式	3DV 2024	代码

多视角

论文	表示方式	会议/期刊	项目/代码
3D-R2N2：单视角与多视角三维物体重建的统一方法	体素	ECCV 2016	代码
基于多物体二维视图的三维形状推断	体素	3DV 2017	代码
用于密集三维物体重建的高效点云生成学习	点云	AAAI 2018	项目
面向多视角立体重建的条件式单视角形状生成	点云	CVPR 2019	代码
Pixel2Mesh++：通过形变实现多视角三维网格生成	网格	ICCV 2019	项目
用于学习特定类别形状重建的多视角聚合	点云	NIPS 2019	代码
Pix2Surf：从图像中学习物体的参数化三维曲面模型	片段	ECCV 2020	项目
基于Transformer的多视角三维重建	体素	ICCV 2021	/
3D-C2FT：用于多视角三维重建的粗细结合Transformer	体素	ACCV 2022	/
FvOR：针对少视角物体重建的鲁棒联合形状与姿态优化	隐式表示	CVPR 2022	代码
FOUND：利用合成数据进行表面形变时具有不确定法线的足部优化	网格	WACV 2024	代码

无监督

论文	表征	出版社	项目/代码
视角变换网络：无需3D监督的单视图3D物体重建	体素	NIPS 2016	代码
基于可微光线一致性的多视图监督单视图重建	体素	CVPR 2017	项目
重新思考重投影：闭合单张图像姿态感知形状重建的闭环	体素	ICCV 2017	/
从图像集合中学习特定类别的网格重建	网格	ECCV 2018	项目
在有限姿态监督下学习单视图3D重建	体素	ECCV 2018	代码
多视图一致性作为学习形状和姿态预测的监督信号	体素	CVPR 2018	项目
为单视图3D重建学习视图先验	网格	CVPR 2019	代码
走出柏拉图的洞穴：基于对抗渲染的3D形状	体素	ICCV 2019	项目
无需3D监督学习隐式曲面	隐式	NIPS 2019	/
使用基于插值的可微渲染器预测3D物体	网格	NIPS 2019	项目
从野外图像中无监督学习可能对称的可变形3D物体	网格	CVPR 2020	项目
利用2D数据学习纹理化3D网格生成	网格	CVPR 2020	代码
从未标注图像集合中隐式网格重建	网格	arXiv 2020	项目
无需关键点的形状与视点	网格	ECCV 2020	项目
通过语义一致性进行自监督单视图3D重建	网格	ECCV 2020	项目
SDF-SRN：从静态图像中学习带符号距离的3D物体重建	隐式	NIPS 2020	项目
野外货架监督下的网格预测	网格	CVPR 2021	项目
全面理解通用物体：建模、分割与重建	隐式	CVPR 2021	项目
从单张图像中自监督3D网格重建	网格	CVPR 2021	代码
单张图像纹理化3D模型的视图泛化	网格	CVPR 2021	项目
2D GAN是否了解3D形状？从2D图像GAN中无监督重建3D形状	网格	ICLR 2021	项目
图像GAN与可微渲染结合用于逆向图形和可解释的3D神经渲染	网格	ICLR 2021	项目
从图像集合中发现3D部件	网格	ICCV 2021	项目
学习用于细粒度识别的规范3D物体表示	网格	ICCV 2021	/
通过来自多张图像的无监督学习实现逼真的单视图3D物体重建	网格	ICCV 2021	代码
从真实世界图像中学习纹理化3D网格的生成模型	网格	ICCV 2021	代码
直击要点：基于对应关系的单目3D类别重建	网格	NIPS 2021	项目
面向拓扑的形变场用于单视图3D重建	隐式	CVPR 2022	项目
2D GAN与无监督单视图3D重建相遇	隐式	ECCV 2022	项目
通过GAN反演进行单目3D物体重建	网格	ECCV 2022	项目
与邻共享：基于跨实例一致性的单视图重建	网格	ECCV 2022	项目
通过自举辐射场反演从一张图像中获取形状、姿态和外观	隐式	CVPR 2023	代码
以五千种方式看一朵玫瑰	隐式	CVPR 2023	项目
ShapeClipper：通过几何和CLIP-based一致性从单视图图像中可扩展地学习3D形状	隐式	CVPR 2023	项目
SAOR：单视图关节物体重建	隐式	arXiv 2023	项目
从2D GAN数据中逐步学习3D重建网络	网格	arXiv 2023	项目

场景级

单视角

论文	表征方式	发表会议	项目/代码
IM2CAD	CAD	CVPR 2017	代码
3D-RCNN: 基于渲染与比较的实例级3D物体重建	先验	CVPR 2018	项目
从3D场景的2D图像中分解形状、姿态和布局	体素	CVPR 2018	项目
基于单张RGB图像的整体3D场景解析与重建	网格	ECCV 2018	项目
Mesh R-CNN	网格	ICCV 2019	代码
基于多层深度和极线变换器的3D场景重建	网格	ICCV 2019	项目
3D-RelNet: 用于3D预测的联合对象与关系网络	体素	ICCV 2019	项目
Total3DUnderstanding: 基于单张图像对室内场景的布局、物体姿态及网格重建进行联合建模	网格	CVPR 2020	项目
基于单视口的3D场景重建	体素	ECCV 2020	代码
CoReNet: 基于单张RGB图像的一致性3D场景重建	体素+隐式表示	ECCV 2020	代码
用于3D场景重建与分割的图像到体素模型转换	体素	ECCV 2020	代码
基于隐式表示的单张图像整体3D场景理解	隐式	CVPR 2021	项目
从点云到多物体3D重建	隐式	CVPR 2021	项目
学习从单张图像恢复3D场景形状	点云	CVPR 2021	代码
Patch2CAD: 基于补丁嵌入学习的野外场景形状检索	网格	ICCV 2021	/
基于单张RGB图像的全景式3D场景重建	体素	NIPS 2021	项目
基于体素的单张图像多物体3D检测与重建	隐式	NIPS 2021	项目
迈向高保真度的室内场景单视角整体重建	隐式	ECCV 2022	代码
3D-Former: 基于SDF的3D变换器的单目场景重建	隐式	ICLR 2023	项目
BUOL: 基于占用感知提升的自底向上框架，用于单张图像的全景式3D场景重建	隐式	CVPR 2023	代码

多视角

论文	表示方式	会议/期刊	项目/代码
MARMVS：减少匹配歧义的多视角立体视觉用于高效的大规模场景重建	点云	CVPR 2020	/
FroDO：从检测到3D物体	隐式表示	CVPR 2020	/
Associative3D：基于稀疏视图的体素重建	体素	ECCV 2020	项目
Atlas：从已知位姿图像端到端的3D场景重建	网格	ECCV 2020	项目
NeuralRecon：单目视频实时连贯的3D重建	网格	CVPR 2021	项目
TransformerFusion：使用Transformer的单目RGB场景重建	隐式表示	NIPS 2021	项目
无需3D监督学习3D物体形状与布局	网格	CVPR 2022	项目
用于3D场景重建的定向射线距离函数	隐式表示	ECCV 2022	项目
通过2D监督学习3D场景先验	网格	arXiv 2022	项目
FineRecon：深度感知的前馈网络用于精细的3D重建	隐式表示	arXiv 2023	代码
CVRecon：重新思考神经网络重建中的3D几何特征学习	隐式表示	arXiv 2023	项目
VisFusion：基于视频的可见性感知在线3D场景重建	隐式表示	CVPR 2023	项目

神经表面

多视角

论文	表示方法	出版社	项目/代码
SDFDiff：用于3D形状的符号距离场可微渲染	隐式	CVPR 2020	代码
可微体渲染：无需3D监督的学习隐式3D表示	隐式	CVPR 2020	代码
通过解耦几何与外观的多视图神经表面重建	隐式	NIPS 2020	项目
从野外视频中无监督学习3D物体类别	隐式	CVPR 2021	项目
神经光度图渲染	隐式	CVPR 2021	项目
等值点：使用混合表示优化神经隐式曲面	隐式	CVPR 2021	项目
为多视图表面重建学习符号距离场	隐式	ICCV 2021	代码
UNISURF：统一神经隐式曲面和辐射场以进行多视图重建	隐式	ICCV 2021	项目
NeuS：通过体积渲染学习神经隐式曲面以进行多视图重建	隐式	NIPS 2021	项目
NeRS：用于野外稀疏视图3D重建的神经反射曲面	隐式	NIPS 2021	项目
神经隐式曲面的体积渲染	隐式	ICCV 2021	非官方代码
NeuralWarp：通过补丁变形改进神经隐式曲面的几何形状	隐式	CVPR 2022	项目
基于曼哈顿世界假设的神经3D场景重建	隐式	CVPR 2022	项目
GenDR：一种通用的可微渲染器	网格	CVPR 2022	代码
NeRFusion：融合辐射场以进行大规模场景重建	隐式	CVPR 2022	项目
野外神经表面重建的关键正则化	隐式	CVPR 2022	/
利用神经延迟着色的多视图网格重建	网格	CVPR 2022	项目
可微立体视觉：使用可微渲染从多视图生成网格	网格	CVPR 2022	代码
SparseNeuS：从稀疏视图快速且可推广的神经表面重建	隐式	ECCV 2022	项目
对象组合式的神经隐式曲面	隐式	ECCV 2022	项目
SNeS：从不完整数据中学习可能对称的神经曲面	隐式	ECCV 2022	项目
野外的神经3D重建	隐式	SIGGRAPH 2022	项目
可微符号距离函数渲染	隐式	SIGGRAPH 2022	项目
通过重新参数化实现神经SDF的可微渲染	隐式	SIGGRAPH Asia 2022	项目
从原始点云逐步学习一致性感知的无符号距离函数	隐式	NIPS 2022	项目
Geo-Neus：用于多视图重建的几何一致神经隐式曲面学习	隐式	NIPS 2022	代码
MonoSDF：探索单目几何线索以进行神经隐式曲面重建	隐式	NIPS 2022	项目
HF-NeuS：利用高频细节改进表面重建	隐式	NIPS 2022	项目
恢复精细细节以进行神经隐式曲面重建	隐式	WACV 2022	代码
NeuRIS：利用法线先验进行室内场景的神经重建	隐式	ECCV 2022	项目
球面引导的神经隐式曲面训练	隐式	arXiv 2022	/
QFF：用于神经场表示的量化傅里叶特征	隐式	arXiv 2022	/
NeuS2：用于多视图重建的快速神经隐式曲面学习	隐式	arXiv 2022	项目
Voxurf：基于体素的高效且精确的神经表面重建	隐式	ICLR 2023	代码
PermutoSDF：利用排列晶格的隐式曲面进行快速多视图重建	隐式	CVPR 2023	项目
ShadowNeuS：通过阴影光线监督进行神经SDF重建	隐式	CVPR 2023	项目
NeuralUDF：学习无符号距离场以进行具有任意拓扑结构的表面多视图重建	隐式	CVPR 2023	项目
NeuDA：用于高保真隐式曲面重建的神经可变形锚点	隐式	CVPR 2023	项目
SparseFusion：提炼视图条件扩散以进行3D重建	隐式	CVPR 2023	项目
I$^2$-SDF：通过在神经SDF中进行光线追踪实现室内场景的内在重建与编辑	隐式	CVPR 2023	项目
NeAT：从多视图图像中学习具有任意拓扑结构的神经隐式曲面	隐式	CVPR 2023	项目
NeUDF：通过体积渲染学习神经无符号距离场	隐式	CVPR 2023	项目
通过水平集对齐提升神经符号距离函数的梯度一致性	隐式	CVPR 2023	代码
Neuralangelo：高保真神经表面重建	隐式	CVPR 2023	项目
VolRecon：用于可推广多视图重建的有符号射线距离函数体积渲染	隐式	CVPR 2023	项目
PET-NeuS：用于神经曲面的位置编码三平面	隐式	CVPR 2023	/
HR-NeuS：通过神经隐式曲面恢复高频表面几何	隐式	arXiv 2023	/
RICO：为室内组合式重建正则化不可观测的部分	隐式	arXiv 2023	/
使用Occ-SDF混合模型学习房间：将符号距离函数与占用率辅助场景表示相结合	隐式	arXiv 2023	/
NeUDF：从多视图图像中学习无符号距离场以重建非水密模型	隐式	arXiv 2023	/
S-VolSDF：神经隐式的稀疏多视图立体正则化	隐式	arXiv 2023	项目
VDN-NeRF：通过视依赖归一化解决形状-辐射模糊	隐式	arXiv 2023	/
FastMESH：基于六边形网格的神经渲染实现快速表面重建	网格	arXiv 2023	/
显式神经曲面：通过变形场学习连续几何	隐式	arXiv 2023	/

点云

论文	表示方式	会议/期刊	项目/代码
用于表面重建的深度几何先验	片段	CVPR 2019	代码
Scan2Mesh：从非结构化范围扫描到3D网格	网格	CVPR 2019	代码
用于3D网格重建的Meshlet先验	网格	CVPR 2020	代码
SSRNet：可扩展的3D表面重建网络	隐式	CVPR 2020	/
SAL：从原始数据中进行符号无关的形状学习	隐式	CVPR 2020	代码
用于形状学习的隐式几何正则化	隐式	ICML 2020	代码
基于预测的内外比引导的点云网格化	网格	ECCV 2020	代码
PointTriNet：3D点集的可学习三角剖分	网格	ECCV 2020	代码
Points2Surf：从点云片段中学习隐式曲面	隐式	ECCV 2020	代码
卷积占用网络	隐式	ECCV 2020	代码
带有周期性激活函数的隐式神经表示	隐式	NIPS 2020	项目
用于隐式函数学习的神经无符号距离场	隐式	NIPS 2020	代码
可微分的表面三角剖分	网格	TOG 2021	代码
SALD：带导数的符号无关学习	隐式	ICLR 2021	代码
用于3D重建的深度隐式移动最小二乘函数	隐式	CVPR 2021	代码
从原始点云中进行符号无关的表面自相似性隐式学习，用于形状建模和重建	隐式	CVPR 2021	/
用于网格重建的学习Delaunay曲面元素	网格	CVPR 2021	代码
神经样条：用无限宽的神经网络拟合3D曲面	隐式	CVPR 2021	代码
Neural-Pull：通过学习将空间拉向曲面来从点云中学习有符号距离函数	隐式	ICML 2021	代码
相变、距离函数与隐式神经表示	隐式	ICML 2021	/
Vis2Mesh：利用学习的虚拟视图可见性，高效地从大型场景的非结构化点云中重建网格	网格	ICCV 2021	代码
用于完整3D网格生成的深度混合自我先验	网格	ICCV 2021	项目
基于多尺度卷积核的自适应表面重建	网格	ICCV 2021	代码
SA-ConvONet：卷积占用网络的符号无关优化	隐式	ICCV 2021	代码
深度隐式曲面点预测网络	隐式	ICCV 2021	项目
形状即点：一种可微分的泊松求解器	网格	NIPS 2021	项目
AIR-Nets：基于注意力的局部条件隐式表示框架	隐式	3DV 2021	代码
使用Delaunay图神经网络进行可扩展的表面重建	网格	SGP 2021	代码
Neural-IMLS：从无方向点云中学习用于表面重建的隐式移动最小二乘法	隐式	arXiv 2021	项目
作为可学习内核的神经场用于3D重建	隐式	CVPR 2022	项目
POCO：用于表面重建的点卷积	隐式	CVPR 2022	代码
GIFS：用于通用形状表示的神经隐式函数	隐式	CVPR 2022	项目
利用表面先验对稀疏点云进行表面重建	隐式	CVPR 2022	代码
通过学习预测性上下文先验从点云中重建表面	隐式	CVPR 2022	代码
DiGS：用于无方向点云的散度引导型隐式神经表示	隐式	CVPR 2022	项目
VisCo网格：利用粘度和共面积网格进行表面重建	隐式	NIPS 2022	/
GenSDF：两阶段学习的可泛化有符号距离函数	隐式	NIPS 2022	项目
用于学习自适应体积形状表示的双八叉树图网络	隐式	SIGGRAPH 2022	代码
用于高质量表面重建的深度点云简化	隐式	arXiv 2022	/
RangeUDF：从3D点云中进行语义表面重建	隐式	arXiv 2022	代码
神经泊松：神经场的指示函数	隐式	arXiv 2022	/
GeoUDF：通过几何引导的距离表示从3D点云中重建表面	隐式	arXiv 2022	代码
CircNet：通过外心检测对3D点云进行网格化	网格	ICLR 2023	/
ALTO：用于隐式3D重建的交替潜在拓扑	隐式	CVPR 2023	项目
八叉树引导的无方向表面重建	隐式	CVPR 2023	项目
无需学习先验，仅从单个稀疏点云中无监督推断有符号距离函数	隐式	CVPR 2023	代码
神经向量场：通过显式学习实现隐式表示	隐式	CVPR 2023	代码
StEik：稳定神经有符号距离函数的优化并实现更精细的形状表示	隐式	arXiv 2023	/
通过噪声到噪声映射从噪声3D点云中学习有符号距离函数	隐式	ICML 2023	项目

RGB-D

论文	表示方法	会议/期刊	项目/代码
神经RGB-D表面重建	隐式	CVPR 2022	项目
BNV-Fusion：基于双层神经体积融合的稠密3D重建	隐式	CVPR 2022	代码
NICE-SLAM：用于SLAM的神经隐式可扩展编码	隐式	CVPR 2022	项目
ShAPO：用于多物体形状、外观和姿态优化的隐式表示	隐式	ECCV 2022	项目
CIRCLE：面向大规模室内场景的卷积隐式重建与补全	隐式	ECCV 2022	代码
单目RGB-D相机下动态场景的神经表面重建	隐式	NIPS 2022	项目
GO-Surf：用于快速、高保真RGB-D表面重建的神经特征网格优化	隐式	3DV 2022	项目
FastSurf：利用逐帧内在精炼和TSDF融合先验学习的快速神经RGB-D表面重建	隐式	arXiv 2023	项目
用于高保真RGB-D监督表面重建的动态体素网格优化	隐式	arXiv 2023	/
用于3D重建的多视角压缩编码	隐式	CVPR 2023	项目
MobileBrick：在移动设备上进行3D重建的乐高搭建	隐式	CVPR 2023	项目
TMO：利用可微渲染通过移动设备获取物体的纹理网格	网格	CVPR 2023	项目

综述

论文	会议/期刊
基于图像的3D物体重建：深度学习时代的现状与趋势	TPAMI 2019
视觉计算及其他领域的神经场	arXiv 2021
神经渲染的进展	EUROGRAPHICS 2022
点云表面重建：综述与基准测试	arXiv 2022
NeRF：3D视觉中的神经辐射场，全面综述	arXiv 2022
深度学习驱动的网格重建方法综述	arXiv 2023

awesome-3d-reconstruction-papers 快速上手指南

awesome-3d-reconstruction-papers 并非一个可直接运行的软件工具或代码库，而是一个精选的深度学习时代 3D 重建论文清单。它旨在帮助开发者快速定位特定任务（如单视图重建、多视图重建、神经表面表示等）的前沿研究、开源代码和项目主页。

本指南将指导你如何获取该列表，并如何利用它快速找到适合你项目的开源实现。

环境准备

由于这是一个文档资源库，无需安装复杂的深度学习环境即可浏览列表。但若要运行列表中链接的具体代码项目，通常需要以下基础环境：

操作系统: Linux (推荐 Ubuntu 18.04/20.04) 或 macOS
Python: 3.6 或更高版本
深度学习框架: 根据具体论文需求，通常需安装 PyTorch 或 TensorFlow
依赖管理: pip 或 conda
GPU: 大多数 3D 重建模型需要 NVIDIA GPU 及 CUDA 支持

提示：具体的版本要求（如 PyTorch 1.7+）需查看你选定的具体论文对应的 GitHub 仓库 README。

获取与使用步骤

1. 克隆仓库

首先，将该论文列表克隆到本地以便查阅。推荐使用国内镜像加速（如 Gitee 镜像或代理），若直接访问 GitHub 较慢，可尝试以下命令：

git clone https://github.com/YanchaoYang/awesome-3d-reconstruction-papers.git
cd awesome-3d-reconstruction-papers

如果 GitHub 访问受限，可在浏览器中直接访问其 GitHub 页面查看渲染后的 Markdown 表格，或使用国内代码托管平台的镜像（如有）。

2. 浏览与筛选

打开根目录下的 README.md 文件。该文件按任务类型进行了清晰分类：

Object-level (物体级): 包含单视图 (Single-view)、多视图 (Multi-view) 和无监督 (Unsupervised) 方法。
Scene-level (场景级): 针对更大规模场景的重建。
Neural-Surface (神经表面): 涵盖多视图、点云和 RGB-D 输入的隐式表面表示方法。
Survey (综述): 领域内的综述文章。

在表格中，你可以找到每篇论文的以下关键信息：

Paper: 论文标题及链接。
Representation: 3D 表示形式（如 Point Cloud, Mesh, Voxel, Implicit）。
Publisher: 发表会议/期刊及年份。
Project/Code: 指向官方项目主页或 GitHub 代码库的链接。

3. 运行具体项目示例

假设你对 单视图网格重建 感兴趣，在列表中找到 Pixel2Mesh (ECCV 2018)，点击其 Code 列的链接进入官方仓库。以下是基于该类项目通用的快速启动流程（以 Pixel2Mesh 为例）：

A. 创建虚拟环境并安装依赖

conda create -n p2m python=3.7
conda activate p2m
pip install torch torchvision tensorflow-gpu==1.15.0
# 进入克隆的具体项目目录后安装其余依赖
pip install -r requirements.txt

B. 下载预训练模型与数据

大多数项目会提供预训练权重。通常在项目页面的 "Usage" 部分有说明。

# 示例：下载预训练模型 (具体链接请参照对应项目的 README)
wget https://github.com/nywang16/Pixel2Mesh/releases/download/v1.0/pretrained_model.zip
unzip pretrained_model.zip

C. 执行推理测试

使用单张 RGB 图片生成 3D 网格：

python demo.py --input_path ./data/example.png --output_path ./results/output.obj --checkpoint ./pretrained_model/model.ckpt

下一步建议

复现研究：根据 README.md 中的分类，寻找与你当前数据集（如 ShapeNet, ScanNet）匹配的 SOTA 模型。
对比实验：利用列表中的 "Representation" 列，快速对比体素 (Voxel)、点云 (Point Cloud) 和隐式场 (Implicit) 不同表示方法的优劣。
贡献社区：如果你发现了新的相关论文，欢迎通过 Pull Request 向该仓库提交更新。

相似工具推荐

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85.3k|★★☆☆☆|今天

图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。

★ 79.9k|★☆☆☆☆|1周前

语言模型数据工具其他

cs-video-courses

cs-video-courses 是一个精心整理的计算机科学视频课程清单，旨在为自学者提供系统化的学习路径。它汇集了全球知名高校（如加州大学伯克利分校、新南威尔士大学等）的完整课程录像，涵盖从编程基础、数据结构与算法，到操作系统、分布式系统、数据库等核心领域，并深入延伸至人工智能、机器学习、量子计算及区块链等前沿方向。面对网络上零散且质量参差不齐的教学资源，cs-video-courses 解决了学习者难以找到成体系、高难度大学级别课程的痛点。该项目严格筛选内容，仅收录真正的大学层级课程，排除了碎片化的简短教程或商业广告，确保用户能接触到严谨的学术内容。这份清单特别适合希望夯实计算机基础的开发者、需要补充特定领域知识的研究人员，以及渴望像在校生一样系统学习计算机科学的自学者。其独特的技术亮点在于分类极其详尽，不仅包含传统的软件工程与网络安全，还细分了生成式 AI、大语言模型、计算生物学等新兴学科，并直接链接至官方视频播放列表，让用户能一站式获取高质量的教育资源，免费享受世界顶尖大学的课堂体验。

★ 79.8k|★☆☆☆☆|1周前

其他图像数据工具

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2周前

Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。

★ 75.9k|★★★☆☆|今天

语言模型图像开发框架

awesome-machine-learning

awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。

★ 72.1k|★☆☆☆☆|2周前

开发框架其他