单图构建三维世界清华联合腾讯实现高保真3D生成只给一张图（单目视觉），能不能还原

量子位看科技 2025-06-13 16:42:12

单图构建三维世界清华联合腾讯实现高保真3D生成

只给一张图（单目视觉），能不能还原出一个完整的三维世界？

清华、腾讯联合提出了Scene Splatter，试图打破现有方法在三维一致性和细节恢复上的瓶颈。

现状是这样的：

- 主流三维生成模型（比如Hunyuan3D、Rodin-v1.5、Tripo-v2.5）大多只擅长单个物体的构建；

- 但一旦扩展到复杂场景，就会出现结构扭曲、几何缺失等问题，尤其在输入只有一张图的情况下更是“病态问题”。

Scene Splatter的关键突破在于：

1. 引入“动量引导”思想：

- 类似优化算法中的“动量”机制，把上一次生成的细节引入当前步骤；

- 首先用潜空间动量补细节，再用像素级动量补未知区域，实现高保真多视角视频生成。

2. 基于视频而非单图重建三维场景：

- 通过视频扩散模型“合成”出多个视角，再用这些视角做三维恢复；

- 大大提升了三维一致性和细节还原度。

3. 可泛化到任意相机轨迹：

- 不管是环绕、拉远还是旋转视角，Scene Splatter都能生成连贯、稳定的三维视频。

团队还通过消融实验验证了动量机制的必要性：缺了动量，PSNR和SSIM指标都有显著下降，说明场景一致性和生成质量都会受影响。

0 阅读：0

量子位看科技

感谢大家的关注

作者最新文章

1

无需训练让AI学会人类抽象思维会抽象的AI更会推理什么时候，AI能像人类那样搞抽

2

蔬菜打褪黑素能多放6天MIT给蔬菜打褪黑素往蔬菜里打褪黑素，能延长其保鲜期？没错

3

奥特曼透露AI硬件细节OpenAI的AI硬件可能要挂脖子上用OpenAI的神秘A

4

玄戒O1采用3nm制程玄戒O1首搭手机平板和手表小米自研SoC芯片玄戒O1终于揭

5

一图详解如何用大模型训练小模型一图详解三种蒸馏技术三人行，必有我师焉！模型也能通

6

AI天气预报击败传统预报系统AI天气预报成本小几个数量级天气虽难以操控，但距离精

7

系统设计宝藏资源架构师面试宝库“如何设计大型系统”？GitHub上Star数30

8

arXiv论文检索神器用自然语言搜arXiv论文arXiv Xplorer：ar

9

智元机器人招募合作伙伴智元灵犀X2机器人内心戏稚晖君打造的机器人“智元灵犀X2”

10

GPT4o登顶AI情感榜腾讯发布AI社交智能榜单AI不仅要聪明，还得“懂人心”。

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

这也太瘦了，门禁直接成了摆设

2

这中控屏幕看起来有点丑

3

一图解读：十款手机配置，各显神通，你更喜欢哪款？

4

姐那锤子是干啥使的，快说！

5

以前这样挂着一部手机那是相当时髦的

6

一个人躺在沙发上玩手机。

7

数据一出来，谁在裸泳一目了然6000元以上的手机iPhone哪是碾压，完全是

8

存一张美得很人山人海的（AI

9

关于华为Pura80全系芯片的真机实测已经出来了，确认为Mate70同款的麒麟9

10

华为Pura80将支持滤镜自定义全新长焦+一英寸镜皇+红枫原色影像，还有胶片、电

科技最新文章

1

不对劲，华为Mate70系列怎么了，好像用的人不多啊。相对而言，Pura70系列

2

没搞错吧？在同样台积电3nm的情况下，听说天玑9500性能可以比9400再提升3

3

今天去买手机，发现这里面的水很深。确定型号之后，我看到店员在拆封时，拿的不是

4

荣耀400等几款新机都已经开售，不过问题来了，选它还是华为nova14简单

5

联发科天玑9500芯片GB6跑分成绩曝光:单核3900+、多核11000+今

6

中国的战略手段牛的可怕！4年前，华为被美国制裁，我国本有机会利用稀土支持华为，

7

麒麟9020还是全新的芯片？答案已经揭晓了！设备信息清晰的显示，华为Pura

8

vivoXFold3发布会，6月25日19点，曝光的参数：骁龙8Gen3处

9

华为难道吸取了Mate70pro的深刻教训？！6月11日傍晚，我来到重庆万象城的

10

华为是真“霸气”，一场发布会下来愣是半个字不提麒麟，半个字不提性能，却又全是性能