首页 > 股市 > 正文

未来智造局丨“真机采集”难解具身之渴 AI还需补上最难的“物理课”

新华财经|2026年05月09日
阅读量:

尽管网络上充斥着各类外表炫酷的机器人视频,但当它们真正走向生产生活时,往往因为无法适应物理世界的不确定性而频频“罢工”。具身智能等典型物理AI应用,如何才能真正跨越虚实的鸿沟?近日,记者专访了松应科技创始人聂凯旋,探寻破局具身智能“数据困境”的“中国方案”。

85437aa7914e402a98efd8e195c258f0.jpeg

新华财经上海5月9日电(记者 杜康)在GTC 2026(2026年英伟达GPU技术大会)上,英伟达将机器人和“物理AI”放在核心位置。物理AI(Physical AI)未来或将是一个50万亿美元的巨大市场,但在这一宏伟蓝图铺开之前,行业必须回答一个前置问题——今天的AI,到底懂不懂物理世界的规律?

当人工智能的演进跨越了屏幕与文本的界限,试图将触角延伸至真实的物理世界时,挑战接踵而至。尽管网络上充斥着各类外表炫酷的机器人视频,但当它们真正走向生产生活时,往往因为无法适应物理世界的不确定性而频频“罢工”。具身智能等典型物理AI应用,如何才能真正跨越虚实的鸿沟?近日,记者专访了松应科技创始人聂凯旋,探寻破局具身智能“数据困境”的“中国方案”。

算一笔“数据账”:靠真机难解具身之渴

在人工智能的发展规律中,算力、算法与数据是公认的三大基石。大语言模型的爆发建立在互联网三十余年积累的海量高质量文本语料之上。但对于致力于在三维物理世界中作业的具身智能而言,“教材”却陷入了极度匮乏。

“很多人习惯用自动驾驶的经验来套用具身智能,这是个误区。”聂凯旋表示,自动驾驶虽然也面对复杂三维交通环境,但更多是在二维平面做“判断题”,例如判断前方有无障碍物,进而减速或变道;具身智能需要强交互,需要判断复杂三维空间中的材质、发力方式、物理反馈等,所需的数据维度呈指数级跃升。

据行业预估,要训练出一个能够真正掌握物理规律、具备较高泛化能力的通用物理AI模型,至少需要千亿乃至万亿级规模的庞大交互数据。然而,当前全球高质量的真实机器人交互数据总量只有数千万条,距离目标有着十万倍的巨大鸿沟。

为了填补缺口,国内近两年新建了上百个机器人数据采集中心,试图通过规模化真机操作来积累数据。但在聂凯旋看来,单纯依赖“真机采集”是一条走不通的低效路径。

聂凯旋给记者算了一笔账:受限于物理操作的固定耗时,一台机器人每天的有效数据采集量约在200条左右。即便全国有100个数据中心,每个中心千台级机器人满负荷运转,要完成万亿级数据的积累,理论上需要近100年时间。此外,由于各家机器人的硬件构型不同导致数据难以通用,加上训练场中存在大量缺乏泛化价值的同质化动作,数据的实际有效性还需大幅折算。

成本方面,真机的“硬件+场地+人力”成本相对固定,目前单条数据采集成本需要3至5元。相较而言,在仿真环境中,单条数据生产成本目前只有0.2至0.3元,且随着底层算力的成倍提升,未来合成数据的成本还将大幅下降。在此背景下,行业共识开始转向“以仿真合成数据为主,真机数据微调为辅”的虚实融合(Sim-to-Real)路线。

聂凯旋透露,在仿真系统中,录入十几条样本只需跑半小时就能生成500条仿真数据;将这些数据导入主流开源模型进行测试,机器人的首次任务成功率即可达到75%左右,试错总成本降至真机直训方案的百分之一。

给AI补上“物理课” 破解跨本体壁垒

成本之外,更为核心的技术壁垒,在于如何让虚拟世界的数据真实反映物理世界的规律。

“人类已知的物理维度已经超过60个。在物理世界里,很多力都是相互在作用。比如一杯水,里面有流体,当它移动时,又会受到重力或者摩擦力的作用。随着算力的持续增长,我们有能力处理更多维度的数据,对物理世界进行深度的建模。”

据悉,松应科技自主研发的ORCA物理AI系统,目前已能在仿真环境中采集超过20个维度的物理数据,包括光照、位置、重力、摩擦力、加速度、材质韧度等。“只有在力学层面实现了更高准确度的模拟,AI才有可能学会不同物理作用力会导致什么样的后果,从而保证训练出来的大脑具备可用性。”

聂凯旋还提到,在ORCA仿真环境里,光线、材质、重力等多物理场环境数据,电机、关节等本体交互数据,以及传感器模拟数据,会被以每秒30到60帧的颗粒度进行时间线切片与严密对齐。

“高频对齐是因为我们必须给AI提供足够充沛的‘因果关系数据链’。”聂凯旋介绍,AI只有在极细微的时间颗粒度下,明白“此刻的多维触发条件导致了怎样的物理后果”,才能超越对单一机型特定动作的死记硬背,真正将物理规律刻进骨子里。这是降低硬件差异影响、提升模型泛化能力的重要一步。

值得一提的是,合成数据已经具备一定跨本体迁移能力。复杂的作业场景决定了机器人不可能只有一种通用形态。然而,由于各家机器人的关节构型、传感器配置千差万别,导致在一台机器人上采集出的真机数据换到另一台形态迥异的机器人上往往直接失效。这是真机数据采集中的一大痛点。

如何打破不同本体构型的壁垒,让数据具备跨设备的通用能力?松应科技找到的一条解题路径是,不绑定单一机器人本体,而是向底层解耦,绑定传感器生态。

聂凯旋解释道,无论是触觉传感器、RGB相机还是激光雷达,本质上都涉及对环境信号的采集、处理与输出。松应科技通过接入并兼容上游传感器原厂的底层模型和算法,在仿真中尽可能还原真实传感器输出,从而降低虚拟与现实之间的感知误差。

零代码与开放共建 打造物理AI时代的“安卓生态”

在“物理AI”方面,英伟达已经推出了Omniverse平台,让机器人在虚拟工厂、虚拟仓库、虚拟道路中完成训练、测试和验证。ABB Robotics、KUKA等全球工业机器人厂商,以及一些主要人形机器人厂商,已经将Omniverse集成进虚拟调试方案。

如何在全球的物理AI竞争中占据一席之地?不同于巨头相对封闭的路线,松应科技选择了一条差异化的“开放兼容”策略。

一方面,在底层算力上,松应科技已与摩尔线程、沐曦、天数智芯、瀚博半导体等十余家国内算力企业建立合作,共同推进多元化国产芯片架构的适配。在应用端,松应的策略是进一步打破专业高墙,面向行业用户推出了轻量化的零代码开发者工具——ORCA Lab。

这款工具大幅精简了传统工业软件复杂的操作界面,可以在个人笔记本上即可流畅运行。用户只需输入自然语言指令,例如“安排一台机器人在现代化厨房中随机游走”,AI Agent便会自动拆解流程、生成代码,并一键调用资产引擎生成高保真3D场景,驱动机器人执行任务。

“通过提供低门槛的工具,我们在大幅降低行业试错成本的同时,也持续获取了海量真实场景的数据与需求。”聂凯旋表示。目前平台已积累逾10万个经过物理标定的3D模型资产及上千套涵盖多行业的完整场景。

据悉,目前宇树机器人、傅利叶智能、云深处,以及北京、上海人形机器人创新中心等主流型号,均已作为首批合作伙伴预置入ORCA Lab系统中。这意味着,一名毫无编程基础的用户,也能在专属的业务场景中轻松调用并训练一台机器人

“我们希望建起一座连接场景应用方与机器人原厂的桥梁。”聂凯旋描绘了松应科技的愿景。“随着千行百业热情的激发与应用场景的无限延展,在物理AI时代的基础设施上,一定会长出繁茂的生态。”

 

编辑:谈瑞

 

声明:新华财经(中国金融信息网)为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

传播矩阵