Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

机器之心报道机器之心编辑部随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。一方面,真实世界评估成...


机器之心报道

机器之心编辑部

随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务 ,但这也带来了显著的挑战 。

一方面,真实世界评估成本极高,需要系统性地覆盖常规场景 、极端情况、分布外(OOD)环境以及各类安全风险 ,通常需要进行成百上千次真实硬件实验 ,不仅耗时、昂贵,还可能存在操作风险。

另一方面,安全性评估尤为棘手 ,许多潜在的不安全行为(例如误夹人手 、损坏设备或引发环境危险)本身就不适合在真实环境中反复测试,使得传统的硬件评估方法在安全场景下往往难以实施。

传统的物理仿真器虽然有帮助,但在真实感 、多样性、搭建成本和视觉一致性方面仍存在明显瓶颈 。

另外 ,前沿视频模型为世界仿真提供了一种替代路径,有望解决前文提到的诸多挑战 。然而,要真正发挥这一潜力面临很多困难 ,主要原因包括:

1)在闭环、动作条件生成中容易产生伪影;

2)对接触动力学(如物体接触 、碰撞)的仿真十分困难;

3)现代策略架构对多视角一致性提出了较高要求,而这在视频生成中并不容易满足。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

  • 论文地址:https://arxiv.org/pdf/2512.10675
  • 项目主页:https://veo-robotics.github.io/
  • 论文标题:Evaluating Gemini Robotics Policies in a Veo World Simulator

本文,来自 Google DeepMind Gemini Robotics 团队研究者提出了一种基于视频建模的机器人策略评估系统 ,能够支持机器人领域中完整范围的策略评估需求,包括分布内评估、分布外泛化评估,以及红队测试。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

具体而言 ,该系统基于最先进的视频生成模型 Veo ,实现了带动作条件约束、具备多视角一致性的视频仿真,不仅在视觉上高度真实,还能够对机器人细粒度控制做出合理响应 。同时 ,该系统集成了生成式编辑技术,使得无需搭建真实物理场景,就能生成包含新物体 、新视觉背景以及安全关键元素的多样化、逼真的真实世界场景变体。

通过 1600 余次真实世界实验 ,并在八个通用型策略检查点和五项任务上验证了视频模型预测结果的有效性。实验结果表明,该系统在保持底层视频基础模型原有能力的同时,达到了进行严格机器人评估所需的高保真度 。

尽管视频建模在机器人领域仍处于早期阶段 ,但本文清晰地展示了一条利用视频仿真世界,实现机器人策略泛化能力与安全性可扩展评估的可行路径。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

视频链接:https://mp.weixin.qq.com/s/qiRQSruwI2ESfQxHsceUpw

方法介绍

在模型架构方面,本文采用 Veo 2 作为基础模型。

在数据方面 ,模型在一个包含大量视频、图像及其对应标注的数据集上进行训练 。这些文本描述由 Gemini 模型自动生成,并且所有数据都经过了严格的预处理与整理。

此外,本文在一个大规模机器人数据集上对预训练的 Veo2 模型进行了微调。该数据集包含多种任务 ,覆盖了在大量不同场景中所需的广泛操作技能 。图 2(上)展示了一个示例 ,将渲染后的机器人位姿叠加在生成的视频帧之上的效果。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

最后,为减轻部分观测带来的影响,本文将系统中的四个相机视角(包括俯视视角 、侧视视角 ,以及左右腕部视角)拼接成一个整体输入。然后对 Veo2 进行微调,使其能够在给定初始帧和未来机器人位姿的条件下,生成这种拼接后的多视角未来帧 。图 2(下)展示了一个由该模型生成的多视角视频帧示例 。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

实验

本文通过 1600 余次真实世界评估 ,在八个通用型策略检查点和五项任务上进行了实验。

在基于 Gemini Robotics On-Device(GROD)模型训练了端到端的 VLA 策略。随后,使用经过微调的 Veo(Robotics)视频模型,在分布内场景中对这些策略进行评估 。

指令:把右上角的红色葡萄放入灰色盒子的左上角隔间。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

指令:把乐高积木放进乐高积木袋里。

指令:把棕色的长条物放进午餐包的顶部口袋里 。

研究中 ,作者还使用 Veo(Robotics)模型,对 8 个不同版本的 VLA 机器人策略进行性能预测,然后把这些预测结果与机器人在真实世界中的实际测试结果进行对比 ,以检验视频模型预测是否准确、可靠。如下 demo 展示了 Veo(Robotics)针对两种策略的实际运行示例。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

下图比较了视频模拟预测结果与实际成功率 。可以观察到,Veo(Robotics)能够根据性能对不同的策略进行排名。本文还发现预测成功率与实际成功率之间存在很强的相关性。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

接下来作者测试了模型分布外泛化能力 。通过改造真实场景来制造新情况,用视频模型提前预测机器人在陌生环境中的表现 ,并用真实实验验证这些预测是否靠谱。

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

最后 ,本文证明了 Veo(Robotics)世界模型可以用来做安全红队测试。也就是说,不需要先让机器人在真实世界中冒险,就可以在视频模拟的世界里主动寻找策略可能出现的不安全行为 。

例如合上电脑:

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

快速抓取红色积木:

Veo何止生成视频:DeepMind正在用它模拟整个机器人世界

了解更多内容 ,请参考原论文 。

本文来自作者[怀绿]投稿,不代表视听号立场,如若转载,请注明出处:https://www.stddy.com/zlan/202512-65065.html

(11)

文章推荐

  • 辽宁新增2例本土确诊3例无症状.辽宁新增确诊4例无症状5例?

    本溪12月2日高风险地区哪些地区几封高风险区:无症状感染者和病例居住地,以及频繁走动且疫情感染传播风险比较高的活动地和工作地等区域,划为高风险区。原则来说以居住小区(村)为单位划定,依据流调研判结果可调整风险区域范围。辽宁本溪市中不是高风险地区。根据所查询到的相关信息显示,截止到2022年12月1

    2025年06月16日
    121
  • 39岁朱珠超美!身材圆润 照片比不上她真实美丽 曾与法拉利老板相恋

    朱珠,全球最佳电视剧女演员和华鼎奖全球最佳电视剧女演员,曾因电视剧《宿敌》爆火。然而关于她的感情经历可以说也是相当精彩,2012年28岁的她与尤文图斯也是法拉利老板拉波·埃尔坎谈了一场轰轰烈烈的恋爱,也是在当时让许多人相当羡慕!据悉,两人也是因在球场看球,全程相当亲昵,而在激动时更是热情拥吻!而后来

    2025年06月24日
    126
  • 北京疫情新增最新情况/北京疫情最新增加3例

    2022北京疫情进出京最新规定:现在去北京要隔离吗现在去北京是否需要隔离,取决于具体的进京人员情况,大多数情况下不需要隔离,但需要遵守相关的防疫政策。具体来说:进返京人员需持证明:进京人员须持48小时内核酸检测阴性证明和“北京健康宝”绿码。抵京后核酸检测:自2022年1月22日零时起至3月底,进返

    2025年06月28日
    119
  • 天津新增18名本土阳性感染者.天津新增本土确诊病例1例?

    天津有可能封城吗天津近来还没有封城,但是除非必要,近来不建议去天津。天津市迅速进入战时状态,配合卫生委员会等有关部门实施早发现、早报告、早隔离、早治疗、集中救治措施。此外,天津作为重要的经济和文化中心,也是非典疫情的重灾区之一。为了配合防控工作,天津也采取了封城措施。在这期间,城市的公共交通受到很

    2025年08月24日
    123
  • 【天天贵阳麻将确实有挂吗(其实真的有挂),天天贵阳麻将新版本】

    谜语大全此物大而轻,肚内火烧心。(猜一物)【谜底】灯笼3身穿绿衣裳,肚里水汪汪,生的子儿多,个个黑脸膛。【谜底】西瓜谜语大全及答案3盖一半,露一半,太阳出来晒一半。(猜一物)【谜底】屋瓦3象只大蝎子,抱起似孩子,抓挠肚肠子,唱出好曲子。【谜底】琵琶3手渗稀奇稀奇真稀奇,拿人鼻子当马

    2025年09月13日
    81
  • 玩家实测“手机麻将100%能赢的神器(专用辅牌神器免安装)

    神器功能超绝!同城游五十K辅助(充值会提高胜率么)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”同城游五十K辅助是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加

    2025年09月29日
    61
  • 3分钟学会“微乐四川麻将怎样设置好牌(专用辅牌神器免安装)

    软件神器登场!微乐山西斗地主助赢神器(骗局大揭秘)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐山西斗地主助赢神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户

    2025年10月02日
    65
  • 胜率设置方法“手机打麻将神器软件(助赢神器通用版)

    超绝软件工具!蜀山麻将助赢神器(插件开挂免费AI)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”蜀山麻将助赢神器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加

    2025年10月10日
    57
  • 白鹤舞传人杨鸿晨先生

    ```为什么白鹤舞能让不少北京老人都念叨?网友说杨鸿晨这人有两把刷子上回在三家店菜市场买菜,碰到隔壁王叔,聊起锻炼身体的事,他提了杨鸿晨的白鹤舞,一说就是半天。王叔说,他年轻时经常胃疼,跟着杨鸿晨练了几个月站桩,胃病全好了。王叔还提过,杨鸿晨小时候身体不好,五岁就去跟陈季瑞学少林拳,后来从

    2025年10月14日
    60
  • 北京困惑,重庆迷茫!天津凭何火速跻身顶流?

    你刷到这条的时候,可能正堵在下班的地铁里,心里盘算着十一到底去哪儿。别往远想,天津已经把“好玩”塞进你半小时生活圈,高铁一脚油到大兴机场,地铁11号线把海洋馆、滨海图书馆串成糖葫芦,下班冲过去还能赶上五大道亮灯。我上周真试了一次:周三下午五点北京工位关机,五点四十坐上津兴快线,六点半站在津湾

    2025年11月18日
    37

发表回复

本站作者后才能评论

评论列表(4条)

  • 怀绿
    怀绿 2025年12月15日

    我是视听号的签约作者“怀绿”!

  • 怀绿
    怀绿 2025年12月15日

    希望本篇文章《Veo何止生成视频:DeepMind正在用它模拟整个机器人世界》能对你有所帮助!

  • 怀绿
    怀绿 2025年12月15日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 怀绿
    怀绿 2025年12月15日

    本文概览:机器之心报道机器之心编辑部随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。一方面,真实世界评估成...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们