欢迎来到家居网链!
您的位置:首页 > 综合网链 > 综合新闻 >

王兴兴「炸裂」发言:对VLA持怀疑态度,数据并非最关键问题

2025-08-13 13:59:01    来源:家居网链网   
  】【打印】【关闭

今日(2025年8月9日),宇树科技创始人、CEO、CTO王兴兴在「2025世界机器人大会」的论坛上,发表了最新演讲。以下是RoboX整理出的部分关键演讲内容:

5a918adf8c13a0209070ba373bfe33ea.jpg

王兴兴表示,今年上半年,整个机器人行业非常火爆,再加上政策的支持,相关整机厂商及零部件厂商,平均每家企业至少有将近50%-100%的增长,这意味着需求端拉动了整个行业的发展。

在海外,特斯拉今年大概他们会发布他们第三代的特斯拉的人体机器人,同时包括英伟达、苹果, 等头部企业都在持续推动机器人领域的发展。

在此背景下,王兴兴分享了几个个人观点:

1、关于本体的误区

之所以机器人还没有大规模应用,并非因为硬件不够好或者成本比较高。他认为其实从技术层面或者AI角度来说,目前硬件是完全够用的,这也包括人形机器人和灵巧手。

关键问题在于量产,相关的工程问题非常多。

2、具身AI完全不够用

与硬件相比,更大的挑战,还是具身智能的AI完全不够用,这也是限制机器人尤其人形进行大规模应用的最大问题。

王兴兴认为,目前的智能体AI应用,感觉类似于ChatGPT出来前的1-3年左右。目前业界已经发现了类似的方向以及技术路线,但是还没人把它做出来。

而机器人的临界点应当达到什么程度?他表示,如果哪一天我们带一个人形机器人来到完全陌生的会场,和它说,帮忙把这瓶水带给某个观众,它可以流畅地完成;或者说「把这个房间整理一下」,它也能自己完成,那就差不多达到了临界点。

“如果快的话,未来的1-3年内还是很有可能实现的。最慢的话估计3-5年也可以实现,但是现在确实还没有达到这个效果。”

3、关键问题:数据还是模型?

之所以智能机器人还没达到应有水平,到底是模型的问题,还是数据的问题?王兴兴给出了独特答案:

“目前全球范围内,大家对于机器人数据问题的关注度,都有点太高了。现在最大的问题其实反而是模型。”

他认为,目前具身智能和机器人的模型架构不够好,也不够统一。

“在大语言模型领域,当有了足够多的好数据时,就能把模型训练得越来越好。但是在具身智能领域,会发现在很多情况下,数据采了却用不起来。大家对模型的关注目前是相对有点少,反而对数据关注有点太高了。”

4、对VLA模型持怀疑态度

“VLA是一个相对傻瓜式的架构,我个人对它还是抱一个比较怀疑的态度。”

王兴兴表示,VLA模型对于真实世界的交互,数据质量是不太够用的。有个简单的想法,是在VLA模型上加RL训练,但综合宇树长期的尝试来看,VLA+RL还是不够的,模型架构还得再升级和优化。

5、宇树的做法

去年,OpenAI发布了视频生成模型以后,行业内产生了一个想法——如果生成一个「整理房间」的视频,是不是能让视频生成模型直接去驱动一个机器人去执行?

去年,宇树就做了这个事情——利用预训练的机器人动作视频,去控制机器人仿照执行。他指出,目前谷歌的全新一代的视频生成模型,也是一个视频驱动的世界模型,同样想实现这样的效果。

“我觉得这个路线的方向,可能比VLA模型的收敛概率还大。但是我没有验证不敢打包票,目前该方法的问题就是,视频生成模型太考验视频生成质量了,导致对GPU的消耗有点大。但是对机器人来说,如果遇到并不需要很高精度的视频生成质量,还是可行的。”

6、机器人的Scaling law才刚开始

王兴兴指出,目前宇树等品牌的机器人,在跳舞、格斗等动作上,实现的效果还不错。但是要想进一步整体提升能力,还面临着一个很大的问题。

“目前,机器人领域的Scaling law,大家做得非常不好。举个最简单例子,如果我有一个新的舞蹈要去训练,那么每次加入新的动作,都要重新训练,而是从头开始训练,这是非常不好的。我们是希望我每做一个新训练的时候,是可以在之前的训练基础上去做AI训练的。”

他认为,做AI训练的时候,理论上应该训练速度越来越快,学习新技能的效果越来越好。但是全行业内目前还没人能做出来,这是非常值得做的一个方向。

因为这在语言模型上已得到过充分验证,但是在机器人的运动控制上面,大家才刚刚开始。

“在未来2-5年,最重要的还是端到端的具身智能AI模型,模型本身是非常最重要的。”

7、硬件工程优化

更低成本、更高寿命的硬件,哪怕对于已经发展100多年的汽车行业来说,如果要做一辆很好的汽车出来,工程量还是非常大的。

“对机器人行业来说,未来可能每年要生产几百万、几千万甚至几亿台的人形机器人。如果要大批量生产制造出来,它的工程量的挑战还是非常吓人的一件事情。”

8、算力部署的局限性

目前,在人形机器人上,或者在移动机器人本体上,没办法直接部署很大规模的算力。这是因为它的尺寸和电池都有限,它部署的算力功耗也是有限制的。

王兴兴称,在人形机上,最多只能部署峰值功耗约为100瓦的算力,且平时工作时算力只有几个手机的水平。但是,未来的机器人对于大规模算力的需求肯定是毋庸置疑的,而且可能会是分布式的算力。

因为,大家都希望机器人工作的通信延迟比较低。此时如果数据中心或者算力中心在异地,延迟实在是太大了。所以他认为,未来如果一座工厂里有100个机器人,也可以配备集群的分布式服务器,这样其安全性和通讯延时是可以接受的。

再比如,如果一个小区中每家每户都有机器人的时候,该小区也可以有分布式的集群。并且如果有一个新客户想买一台人形机器人的时候,他不需要给这部分算力的建设花钱,成本也会更低很多。

“我觉得分布式集群是未来在机器人领域非常重要的构成。”王兴兴说道。

9、全球共创的重要性

他认为,机器人领域是一个全球共创的过程,包括中国、美国的很多的大企业,大家在过去的很多年和当下,都做了很多贡献,也希望共同推动行业进步。

“在AI领域,没有一家大公司能保证只要有足够的人、有足够的资源,就能永远保持在AI领域领先。OpenAI和DeepSeek已经证明了AI的创新,永远伴随着一些随机性。所以很多情况下,需要每家公司或者每家高校都做出很多贡献,进行全球共创。”



专题策划更多>>
  • 行业首创!莫干山植物源释香板获得“行业首创”权威认证,引领家居生活香氛潮流

       当家居消费从“功能需求”转向“情绪价值”,... 【详细】

  • 权威认证!莫干山植物源抗菌抗病毒板全国销量第一!

       当健康成为家居消费的核心诉求,莫干山植物源... 【详细】

  • 云峰莫干山30年30人 | 魏威:聚力共生,以赤子心承两代业,凭新格局铸行业巅峰

       云峰莫干山「30年30人」,致敬每一位同行者!... 【详细】

  • 久盛“超稳王”发布:重构纯实木稳定性标准,引领品类全新升级

       2025年7月22日,久盛地板有限公司在广州举办超... 【详细】

  • ​喜报!云峰莫干山荣获浙江省第二十五届“科技兴林奖”科技创新类一等奖!

       在刚刚公布的浙江省第二十五届“科技兴林奖”... 【详细】

  • 
    关于我们 |  招聘英才 |  服务项目 |  联系我们 |  法律声明 |  网站地图 |  品牌链接
     |