李飞飞团队空间智能模型:一图变身交互式3D场景

李飞飞团队空间智能模型:一图变身交互式3D场景

空间智能的革命:一图变身交互式3D场景

人工智能领域顶尖学者李飞飞领衔的团队打造了一个划时代的 AI 产品——World Labs,它能够以单张静态图像为基础构建交互式 3D 场景。

突破性的技术

现有的 AI 工具仅能将照片转换为静态的 3D 模型和场景,而 World Labs 的技术能够生成可交互、可编辑的 3D 场景。这意味着用户可以进入任何一张图像,并以身临其境的方式探索它的三维空间。

World Labs 的系统通过浏览器实时渲染这些场景,用户可以通过键盘或鼠标控制移动和交互,自由探索场景的不同元素。通过可调节的滑块,用户可以操纵模拟景深和模拟推拉变焦,为场景增添层次感和真实感。

交互式体验

这款 AI 工具还支持调整摄像机位置和视野、更改物体颜色、创建聚光灯特效以及创建动态效果。这些交互方式让用户能够根据自己的喜好定制和探索场景。

世界模型的新范式

World Labs 的系统属于 "世界模型" 的新兴 AI 领域,能够模拟游戏和 3D 环境。与现有的世界模型不同,World Labs 的技术避免了伪影和一致性问题。

World Labs 解释说,预测像素与预测 3D 场景有许多优势。生成的场景更加持久,即使用户移开视线再回来,场景也不会改变。此外,用户可以实时控制和移动场景,近距离观察细节或探索远处的物体。

改变内容创作

World Labs 认为,生成三维内容将提升操控性和一致性,从而改变电影、游戏、模拟器和其他数字呈现形式的制作方式。用户可以更轻松地布置角色和精确控制镜头调度。

影响深远

这项突破性的技术已经在内容创作者中引起了轰动。埃里克·索洛里奥发现,这项技术完美地填补了他的创作过程中的空白,让角色布置和精确的镜头调度变得更容易。

World Labs 表示,目前展示的只是 "3D 原生生成式 AI 未来的一瞥",该工具仍有改进的空间。公司计划在 2025 年推出首款正式产品,其最终目标是赋予 AI 与人类相同的空间智能,从而带来前所未有的互动式体验。

原创文章,作者:讯知在线,如若转载,请注明出处:http://bbs.xzxci.cn/2024/12/06/28969.shtml

Like (0)
讯知在线讯知在线
Previous 2024年12月6日 上午2:33
Next 2024年12月6日 上午2:41

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注