[EN] MELON:无需初始姿态估计即可从少量图片重建3D物体
Google Research 团队提出 MELON 技术,能在无相机初始姿态、无预训练数据的条件下,仅凭4-6张图片即可高精度重建物体的3D NeRF模型,解决了姿态未知下的“先有鸡还是先有蛋”难题。
Google Research 团队提出 MELON 技术,能在无相机初始姿态、无预训练数据的条件下,仅凭4-6张图片即可高精度重建物体的3D NeRF模型,解决了姿态未知下的“先有鸡还是先有蛋”难题。
Google Research发布ScreenAI,一种基于PaLI架构并融合pix2struct灵活分块策略的5B参数视觉语言模型,专为理解用户界面与信息图表设计。通过自监督预训练和屏幕标注任务,ScreenAI在WebSRC、MoTIF、ChartQA等多项基准测试中达到或超越同规模模型的最优性能,同时发布了三个新数据集。
谷歌开源了AutoBNN,它结合了传统概率模型的可解释性与神经网络的可扩展性,自动化地发现可解释的时间序列预测模型,并提供高质量的不确定性估计。
Google Research发布基于扩散概率模型的生成式AI技术SEEDS,能以极低计算成本大规模生成天气预报集合,量化传统方法难以捕捉的极端天气不确定性,性能媲美甚至超越物理模型。
OpenAI通过Appia基金会参与构建高级AI的共享标准,支持评估框架、安全实践及全球合作。
OpenAI与博通发布定制AI芯片Jalapeño,专为大语言模型推理设计,旨在提升AI系统的性能、效率与扩展能力。
OpenAI 发布了下一代模型 GPT-5.6 Sol 的预览,该模型在编程、科学和网络安全领域拥有更强能力,并配备了其最先进的安全架构。
OpenAI的最新信号数据显示,ChatGPT在全球范围内的采用率正在增长,用户使用频率提高,探索更多功能,并在不同地区和语言中推动增长。