手机浏览器扫描二维码访问
自动驾驶汽车需要应对各种复杂路况,世界模型能帮助它提前“预判”可能出现的危险,做出更安全的决策。比如,当自动驾驶汽车遇到前方突然变道的车辆时,世界模型可以根据车辆的速度、距离以及周围环境信息,预测出可能的碰撞风险,并及时调整车速和行驶方向。
华为云的盘古世界模型在自动驾驶领域就有应用。输入首帧的行车场景,再加上行车控制信息和路网数据,它就可以生成每路摄像头的行车视频和激光雷达的点云,生成的视频与激光点云可以达到像素级的匹配。这就能够为智能驾驶生成大量的训练数据,从而不依赖于高成本的路采。并且它的生成能力可以达到30帧每秒的视频续写,已经应用到自动驾驶的软件仿真和硬件仿真的环境中,根据行车控制信息就可以实时生成左超车、右超车、刹车等不同驾驶行为的续写视频,供智能驾驶系统来训练。
这章没有结束,请点击下一页继续阅读!
(三)机器人领域:让机器人更“智能”地行动
机器人在执行任务时,需要理解周围环境并做出合理的动作。世界模型可以让机器人在虚拟环境中进行“试错学习”,提高在真实环境中的行动能力。比如,一个机器人要在杂乱的房间里寻找特定物品,有了世界模型,它可以先在虚拟环境里模拟寻找的过程,预测可能遇到的障碍和问题,再在真实环境中更高效地完成任务。
谷歌的Genie 3世界模型可以生成各种可控制动作、可玩的3D环境,还可以用于训练和评估具身agent。它能快速为AI agent创建丰富多样的环境,从而生成agent在训练期间未见过的评估任务。比如,Google DeepMind与游戏开发商合作开发的SIMA agent,被设计成通过遵循自然语言指令来完成一系列3D游戏世界中的任务,就可以在Genie 2合成的、未见过的环境执行指令,通过在虚拟环境中的训练,提升在真实世界中的行动能力。
(四)影视与元宇宙:提升内容创作效率
在影视制作和元宇宙场景搭建中,世界模型可以快速生成大规模动态场景,节省大量的人力和时间成本。比如,制作一部科幻电影,导演可以用世界模型快速生成外星世界的场景,包括地形、气候、生物等,而且这些场景可以根据剧情和角色的行动实时变化。在元宇宙中,用户也可以通过世界模型创建属于自己的个性化虚拟空间,实现更丰富的交互体验。
三、深入剖析:世界模型的技术原理是怎样的?
(一)多模态数据融合:让AI“全方位”感知世界
世界模型的核心之一是多模态数据融合,也就是把视觉、语言、音频、动作等多种数据整合在一起。比如,当我们看到一个人在说话,我们不仅能看到他的动作和表情(视觉信息),还能听到他说的话(音频信息),然后理解他的意图(语言信息)。世界模型也需要具备这样的能力,将不同模态的数据转化为统一的表示形式,让AI能够从多个角度理解世界。
以腾讯的混元3D世界模型为例,它引入了“世界一致视频扩散”与“长距离世界探索”两大核心机制,从一段文字、一张图生成一个初始场景,再根据用户设定的相机轨迹拓展新视角内容。这里就融合了文本和图像两种模态的数据,通过对这些数据的处理和融合,生成更加真实、连贯的虚拟场景。
(二)模拟与预测:在“脑海”中推演未来
世界模型还能够模拟世界的动态变化,并预测未来可能发生的事情。它通过学习大量的历史数据,掌握世界的运行规律,然后在面对新的情况时,能够在虚拟环境中模拟不同的行动方案,并预测每种方案可能产生的结果。
比如,在自动驾驶场景中,世界模型可以根据当前车辆的速度、位置、周围车辆的状态等信息,模拟未来几秒钟内可能出现的情况,如前方车辆突然刹车、行人突然横穿马路等,并提前规划出应对策略。谷歌的Genie 3就可以生成长达数分钟的一致世界,能够模拟各种物体的相互作用、角色动画、物理规律等,实现实时互动和高度一致化的生成,让用户在其中的行动能够得到合理的反馈和预测。
(三)强化学习:在“试错”中不断优化
强化学习是世界模型训练过程中的重要方法。简单来说,强化学习就是让AI在虚拟环境中不断尝试不同的行动,根据行动产生的结果获得奖励或惩罚,从而逐渐学会最优的行动策略。
此乃人类帝国的第三十个千年。在人类之主·帝皇的带领下,人类终于再次从母星离开,迈向冰冷而无情的宇宙。他们渴望收回失去的殖民地,也希望让那些受着痛苦折磨的人们回到帝皇的光辉之下。此时此刻,人类还对未来怀揣着美好的愿景。此时此刻,没人知道未来会发生什么。而故事,则开始于一个名为诺斯特拉莫的偏远星球之上。卡里尔·洛哈尔斯。你应该记住这个名字。(战锤同人。)...
有的人什么都不用做,你就会很爱他 章珣觉得,他和程澍之间发生的一切,和这世上所有讳莫如深的秘密一样,应当永远被关在那扇门里,即便很多年后他们再见面,亦不可露出一丝端倪,可这种单方面的想法,在看见程澍的车子停到楼下时又会削弱一些。 章珣贯会这样,趴在阳台的围栏上,看他下车,看他脱掉外套搭在臂弯里,看他一边埋头点烟一边朝里走,不久后密码锁的声音从门口传来,而程澍进门的第一句话总是简短的一声,“章珣。” ----------------- 程澍(艾斯伯格综合征患者)X章珣(依赖性超强) (看着冷淡实则超疼爱老婆的攻X依赖感超强但一直以为自己很独立的受) ----------------- tips 1.是一篇金主文,也是不用动脑子的恋爱文 2.破镜重圆(只破了一点哈哈),先做后爱,金主其实很温柔 3.推荐下我老婆的ABO文《心有陈疾》CP385212:臧白从二十岁那年开始,就反复做同一个噩梦,在那个梦里,他被胁迫在那个狭窄的隔间。疼痛、屈辱、恐惧和鲜血从那白瓷抽水箱上蔓延开来,刻进他的人生,让他永远残缺了一部分.........
一次受操控的穿越,把现实中的相关人物推到风口浪尖。老油条的胎光乍入褚照天的泥丸宫,凭职业穿越者的经验察觉到:大实业家褚慕勇这儿子是根恶棍,带着人见人恨,鬼见鬼愁的气场。褚照天一个多月前出车祸,撞隔离堆没撞赢,从动物人变成植物人。老油条不愿承担孽债,想开溜,可宿主的七窍已被法器堵住,老油条的爽灵、幽精、七魄相继入驻,......
《耀阳星》作者:幻龙文案:『参与穿越计划,查明辐射真相,赢取十亿奖金!』为了得到丰厚的奖金来改写命运,向璈在主办方的坑蒙拐骗下踏上了废土世界,并继承了原主留下的“丰厚”遗产:一张赏金猎人资格证,一辆重型基地车,还有……一个人?一个茫然无措的穿越者,一个手无缚鸡之力的纯花瓶,彼此互不信任的她们,被滚滚黄沙封锁在了这片危机四伏的土...
手滑炸掉全球互联网以后,江舟成为了人类历史上最恶劣的罪人,陷入了漫长的沉睡。而一百年后当他再度苏醒时,呈现在他眼前的,是一个交织着蛮荒与文明,充斥着控制与反抗的失控时代。深渊之中,无以计数的失控人工智能肆虐成灾;奥林匹斯之上,以神祇自居的超级企业睥睨凡众;基底现实之内,凡人们于苦难与疯狂间苦苦挣扎。但长夜已逝,黎明将至。当他从漫长的沉睡中醒来,人智革命的种子已然发芽。脑机接口、曼陀罗程序、调整深度、心智指数、伊卡洛斯症候、军用僵尸……在这黑暗时代终结的前夕,当有人问起江舟他究竟是谁的时候,他如是回答:“我是一,亦是众;我是开端,亦是终焉;你可以称呼我为悖论本身。我是第一深潜者、伊卡洛斯的重启者、诺德之地的看门人。我是破囚者、灯塔暴徒、摘下金枝之人,以及统御冥府的无面之神。我有着无数的身份,恰似风有着无数方向,凡人有着无数种死法。我的名字叫做——”“换句话说,整个组织其实只有你一个人?”“呃……是这样的。”...
林羽,一位纵横修仙界的大能,遭逢强敌围攻,意外穿越至现代都市。在这繁华却又隐藏无数暗涌的都市中,他本欲低调修炼,回归仙途,然而,四大家族的贪婪与霸道,神秘暗影会的邪恶阴谋,打破了他的平静。林羽以修仙者之姿,在都市中展露锋芒,他从黑拳组织的血腥泥沼中救出无辜,在与四大家族的明争暗斗里屡破诡计,于神秘遗迹探寻强大法宝,......