李飞飞空间智能突破！创新3D生成模型问世

讯知在线 • 2024年12月5日下午3:48 • 热点 • 0 views

李飞飞的空间智能突破：创新3D生成模型问世

作为AI领域的领先学者和影响力人物之一，斯坦福大学教授李飞飞及其初创公司World Labs在空间智能领域取得了重大突破，推出了一个能用单张静态图片生成交互式3D世界的AI产品。

World Labs的创新在于其生成的3D场景不仅具有沉浸感，还可以进行实时交互和修改。用户可以通过浏览器实时渲染这些场景，使用箭头键或键盘控制移动，并通过单击和拖动鼠标进行互动，自由探索场景中的每一个角落。

该AI工具配备了可调节的滑块，可控制模拟景深和模拟推拉变焦，为视觉体验增添层次感和真实感。此外，它还支持调整摄像机位置和视野、更改对象颜色、创建聚光灯特效，以及创建自动运行的动态效果。

World Labs的系统属于一个新兴的人工智能范畴，即“世界模型”，能够模拟游戏和3D环境。与现有的模型相比，World Labs的模型能够有效解决伪影和一致性问题。它通过预测3D场景而非像素来生成更加持久和一致的场景。

用户可以实时控制和移动场景，仔细观察花朵的细节，或窥探角落里露出的物体。World Labs指出，与传统的二维内容生成不同，三维内容的生成提高了操控性和一致性，有望改变电影、游戏、模拟器和物理世界的其他数字呈现形式的制作方式。

目前，World Labs已开放Waitlist候补名单申请，部分创作者已将其整合到现有的工作流程中。内容创作者埃里克·索洛里奥发现，这项技术完美地填补了创作过程中的空白，可以“让角色布置和精确的镜头调度变得更容易”。

尽管如此，World Labs仍强调，目前披露的只是“3D原生生成AI未来的一个缩影”。AI工具仍有改进的空间，例如用户的移动范围仍然受限，有时也会出现渲染错误。

World Labs于今年1月成立，由李飞飞和贾斯汀·约翰逊、克里斯托夫·拉斯纳和本·米尔登霍尔联合创立。公司已从包括AI大牛Geoffrey Hinton、Jeff Dean、谷歌前CEO Eric Schmidt在内的投资者处筹集了2.3亿美元的投资，估值超过10亿美元，计划在2025年推出首款正式产品。

李飞飞认为，“所有空间智能的生物所具备的行动能力，是与生俱来的。因为它能够将感知与行动进行关联。”她强调，要让AI超越当前的能力，需要的是“一个不仅仅能够看到、会说话的AI，而且是一个可以行动的AI。”

尽管World Labs的愿景与“元宇宙”概念有一些相似之处，但其创始人解释说，世界模型或能够填补元宇宙缺乏真正互动内容的空白，从而为空间智能的未来开启无限可能。

原创文章，作者：讯知在线，如若转载，请注明出处：http://bbs.xzxci.cn/2024/12/05/28630.shtml