[EN] MELON：无需初始姿态估计即可从少量图片重建3D物体

Google AI Blog · 2026 年 7 月 4 日 06:39 AI 辅助生成

Google Research 团队提出 MELON 技术，能在无相机初始姿态、无预训练数据的条件下，仅凭4-6张图片即可高精度重建物体的3D NeRF模型，解决了姿态未知下的“先有鸡还是先有蛋”难题。

#NeRF #姿态估计 #MELON #3D物体重建 #无监督学习

Google Research 团队提出 MELON 技术，能在无相机初始姿态、无预训练数据的条件下，仅凭4-6张图片即可高精度重建物体的3D NeRF模型，解决了姿态未知下的“先有鸡还是先有蛋”难题。

关键要点

MELON 通过轻量级CNN编码器实时回归相机姿态，无需预训练即可隐式正则化相似图片的位姿。
引入“模损失”（modulo loss）同时考虑物体的伪对称性，从多个候选视角中选择最优拟合，有效避免陷入局部最优。
该技术可无缝集成现有NeRF方法，在合成数据集上以最少视图达到当前最佳的重建精度。

MELON 简化了3D重建流程，摆脱了对初始姿态或大规模标注数据的依赖，对电商建模、自动驾驶等需要低成本3D感知的场景具有重要实用价值。

原文：Google AI Blog

原文：http://blog.research.google/2024/03/melon-reconstructing-3d-objects-from.html

本文由 AI 辅助生成，仅供参考。如有不准确之处，欢迎指正。