李飞飞团队空间智能模型：一图变身交互式3D场景

讯知在线 • 2024年12月6日上午2:37 • 财经 • 0 views

空间智能的革命：一图变身交互式3D场景

人工智能领域顶尖学者李飞飞领衔的团队打造了一个划时代的 AI 产品——World Labs，它能够以单张静态图像为基础构建交互式 3D 场景。

突破性的技术

现有的 AI 工具仅能将照片转换为静态的 3D 模型和场景，而 World Labs 的技术能够生成可交互、可编辑的 3D 场景。这意味着用户可以进入任何一张图像，并以身临其境的方式探索它的三维空间。

World Labs 的系统通过浏览器实时渲染这些场景，用户可以通过键盘或鼠标控制移动和交互，自由探索场景的不同元素。通过可调节的滑块，用户可以操纵模拟景深和模拟推拉变焦，为场景增添层次感和真实感。

交互式体验

这款 AI 工具还支持调整摄像机位置和视野、更改物体颜色、创建聚光灯特效以及创建动态效果。这些交互方式让用户能够根据自己的喜好定制和探索场景。

世界模型的新范式

World Labs 的系统属于 "世界模型" 的新兴 AI 领域，能够模拟游戏和 3D 环境。与现有的世界模型不同，World Labs 的技术避免了伪影和一致性问题。

World Labs 解释说，预测像素与预测 3D 场景有许多优势。生成的场景更加持久，即使用户移开视线再回来，场景也不会改变。此外，用户可以实时控制和移动场景，近距离观察细节或探索远处的物体。

改变内容创作

World Labs 认为，生成三维内容将提升操控性和一致性，从而改变电影、游戏、模拟器和其他数字呈现形式的制作方式。用户可以更轻松地布置角色和精确控制镜头调度。

影响深远

这项突破性的技术已经在内容创作者中引起了轰动。埃里克·索洛里奥发现，这项技术完美地填补了他的创作过程中的空白，让角色布置和精确的镜头调度变得更容易。

World Labs 表示，目前展示的只是 "3D 原生生成式 AI 未来的一瞥"，该工具仍有改进的空间。公司计划在 2025 年推出首款正式产品，其最终目标是赋予 AI 与人类相同的空间智能，从而带来前所未有的互动式体验。

原创文章，作者：讯知在线，如若转载，请注明出处：http://bbs.xzxci.cn/2024/12/06/28969.shtml