Google Research 团队提出 MELON 技术,能在无相机初始姿态、无预训练数据的条件下,仅凭4-6张图片即可高精度重建物体的3D NeRF模型,解决了姿态未知下的“先有鸡还是先有蛋”难题。
关键要点
- MELON 通过轻量级CNN编码器实时回归相机姿态,无需预训练即可隐式正则化相似图片的位姿。
- 引入“模损失”(modulo loss)同时考虑物体的伪对称性,从多个候选视角中选择最优拟合,有效避免陷入局部最优。
- 该技术可无缝集成现有NeRF方法,在合成数据集上以最少视图达到当前最佳的重建精度。
MELON 简化了3D重建流程,摆脱了对初始姿态或大规模标注数据的依赖,对电商建模、自动驾驶等需要低成本3D感知的场景具有重要实用价值。