李飞飞的空间智能突破:创新3D生成模型问世
作为AI领域的领先学者和影响力人物之一,斯坦福大学教授李飞飞及其初创公司World Labs在空间智能领域取得了重大突破,推出了一个能用单张静态图片生成交互式3D世界的AI产品。
World Labs的创新在于其生成的3D场景不仅具有沉浸感,还可以进行实时交互和修改。用户可以通过浏览器实时渲染这些场景,使用箭头键或键盘控制移动,并通过单击和拖动鼠标进行互动,自由探索场景中的每一个角落。
该AI工具配备了可调节的滑块,可控制模拟景深和模拟推拉变焦,为视觉体验增添层次感和真实感。此外,它还支持调整摄像机位置和视野、更改对象颜色、创建聚光灯特效,以及创建自动运行的动态效果。
World Labs的系统属于一个新兴的人工智能范畴,即“世界模型”,能够模拟游戏和3D环境。与现有的模型相比,World Labs的模型能够有效解决伪影和一致性问题。它通过预测3D场景而非像素来生成更加持久和一致的场景。
用户可以实时控制和移动场景,仔细观察花朵的细节,或窥探角落里露出的物体。World Labs指出,与传统的二维内容生成不同,三维内容的生成提高了操控性和一致性,有望改变电影、游戏、模拟器和物理世界的其他数字呈现形式的制作方式。
目前,World Labs已开放Waitlist候补名单申请,部分创作者已将其整合到现有的工作流程中。内容创作者埃里克·索洛里奥发现,这项技术完美地填补了创作过程中的空白,可以“让角色布置和精确的镜头调度变得更容易”。
尽管如此,World Labs仍强调,目前披露的只是“3D原生生成AI未来的一个缩影”。AI工具仍有改进的空间,例如用户的移动范围仍然受限,有时也会出现渲染错误。
World Labs于今年1月成立,由李飞飞和贾斯汀·约翰逊、克里斯托夫·拉斯纳和本·米尔登霍尔联合创立。公司已从包括AI大牛Geoffrey Hinton、Jeff Dean、谷歌前CEO Eric Schmidt在内的投资者处筹集了2.3亿美元的投资,估值超过10亿美元,计划在2025年推出首款正式产品。
李飞飞认为,“所有空间智能的生物所具备的行动能力,是与生俱来的。因为它能够将感知与行动进行关联。”她强调,要让AI超越当前的能力,需要的是“一个不仅仅能够看到、会说话的AI,而且是一个可以行动的AI。”
尽管World Labs的愿景与“元宇宙”概念有一些相似之处,但其创始人解释说,世界模型或能够填补元宇宙缺乏真正互动内容的空白,从而为空间智能的未来开启无限可能。
原创文章,作者:讯知在线,如若转载,请注明出处:http://bbs.xzxci.cn/2024/12/05/28630.shtml