空间智能的革命:一图变身交互式3D场景
人工智能领域顶尖学者李飞飞领衔的团队打造了一个划时代的 AI 产品——World Labs,它能够以单张静态图像为基础构建交互式 3D 场景。
突破性的技术
现有的 AI 工具仅能将照片转换为静态的 3D 模型和场景,而 World Labs 的技术能够生成可交互、可编辑的 3D 场景。这意味着用户可以进入任何一张图像,并以身临其境的方式探索它的三维空间。
World Labs 的系统通过浏览器实时渲染这些场景,用户可以通过键盘或鼠标控制移动和交互,自由探索场景的不同元素。通过可调节的滑块,用户可以操纵模拟景深和模拟推拉变焦,为场景增添层次感和真实感。
交互式体验
这款 AI 工具还支持调整摄像机位置和视野、更改物体颜色、创建聚光灯特效以及创建动态效果。这些交互方式让用户能够根据自己的喜好定制和探索场景。
世界模型的新范式
World Labs 的系统属于 "世界模型" 的新兴 AI 领域,能够模拟游戏和 3D 环境。与现有的世界模型不同,World Labs 的技术避免了伪影和一致性问题。
World Labs 解释说,预测像素与预测 3D 场景有许多优势。生成的场景更加持久,即使用户移开视线再回来,场景也不会改变。此外,用户可以实时控制和移动场景,近距离观察细节或探索远处的物体。
改变内容创作
World Labs 认为,生成三维内容将提升操控性和一致性,从而改变电影、游戏、模拟器和其他数字呈现形式的制作方式。用户可以更轻松地布置角色和精确控制镜头调度。
影响深远
这项突破性的技术已经在内容创作者中引起了轰动。埃里克·索洛里奥发现,这项技术完美地填补了他的创作过程中的空白,让角色布置和精确的镜头调度变得更容易。
World Labs 表示,目前展示的只是 "3D 原生生成式 AI 未来的一瞥",该工具仍有改进的空间。公司计划在 2025 年推出首款正式产品,其最终目标是赋予 AI 与人类相同的空间智能,从而带来前所未有的互动式体验。
原创文章,作者:讯知在线,如若转载,请注明出处:http://bbs.xzxci.cn/2024/12/06/28969.shtml