李飞飞团队空间智能领域创新突破:首个模型生成交互式 3D 场景
AI 领域影响力最大的女性和华人之一,AI 学者、斯坦福大学教授李飞飞领导的初创公司 World Labs 公布了其第一个创业项目成果——能够用单张静态图片生成 3D 世界的 AI 产品。
这项创新突破标志着空间智能领域的一个重大里程碑。虽然已有众多 AI 工具可以将照片转换为 3D 模型和场景,但 World Labs 所生成场景的独特之处在于它们具有交互性和可修改性。
沉浸式交互体验
通过浏览器实时渲染,用户能够使用箭头键或键盘(WASD)键移动,并单击并拖动鼠标交互,自由探索这些 AI 生成的场景。该 AI 工具提供可操控的滑块来调节模拟景深(DoF)和模拟推拉变焦(dolly zoom),创造身临其境的视觉体验。
此外,该工具还支持调整摄像机的位置和视野、更改对象颜色、创建聚光灯特效,以及创建自动运行的动态效果。
突破传统模型限制
World Labs 的系统属于新兴的人工智能范畴“世界模型”,能够模拟游戏和 3D 环境。与大多数现有模型存在伪影和一致性问题不同,World Labs 的模型预测 3D 场景,具有场景持久、移动实时控制、放大缩小观察细节等优势。
从二维到三维的变革
World Labs 表示:“大多数生成式 AI 工具生成的都是图像或视频等二维内容。而生成三维内容能够提升操控性和一致性。这将改变我们制作电影、游戏、模拟器以及物理世界其他数字呈现形式的方式。”
广泛应用前景
这款 AI 工具已向公众开放了候补名单申请。一些创作者已经将其整合到现有的工作流程中,发现其完美填补了创作过程中的空白,例如角色布置和精确镜头调度。
未来展望
World Labs 正计划在 2025 年推出首款正式产品。李飞飞认为,空间智能对于 AI 的全面发展至关重要,能够将感知与行动联系起来。World Labs 的创新突破为元宇宙和虚拟世界的丰富互动内容提供了可能性,有望推动空间智能领域的发展。
团队背景
World Labs 由李飞飞、贾斯汀·约翰逊、克里斯托夫·拉斯纳和本·米尔登霍尔于 2023 年 1 月联合创立。三人在 AI 领域拥有丰富的经验,力求通过世界模型填补元宇宙中互动内容的空白。
原创文章,作者:讯知在线,如若转载,请注明出处:http://bbs.xzxci.cn/2024/12/04/27620.shtml