[EN] MELON:无需初始姿态估计即可从少量图片重建3D物体

Google AI Blog · AI 辅助生成

Google Research 团队提出 MELON 技术,能在无相机初始姿态、无预训练数据的条件下,仅凭4-6张图片即可高精度重建物体的3D NeRF模型,解决了姿态未知下的“先有鸡还是先有蛋”难题。

Google Research 团队提出 MELON 技术,能在无相机初始姿态、无预训练数据的条件下,仅凭4-6张图片即可高精度重建物体的3D NeRF模型,解决了姿态未知下的“先有鸡还是先有蛋”难题。

关键要点

  • MELON 通过轻量级CNN编码器实时回归相机姿态,无需预训练即可隐式正则化相似图片的位姿。
  • 引入“模损失”(modulo loss)同时考虑物体的伪对称性,从多个候选视角中选择最优拟合,有效避免陷入局部最优。
  • 该技术可无缝集成现有NeRF方法,在合成数据集上以最少视图达到当前最佳的重建精度。

MELON 简化了3D重建流程,摆脱了对初始姿态或大规模标注数据的依赖,对电商建模、自动驾驶等需要低成本3D感知的场景具有重要实用价值。

原文:Google AI Blog

本文由 AI 辅助生成,仅供参考。如有不准确之处,欢迎指正。