当前,智能阻大模型、商业多模态、化落具身智能等概念方兴未艾,行则发展智能化技术成为了各行各业头部企业的必至共识,玩家们各显神通,配天纷纷亮出看家法宝。观点机器人行业内更是具身涌现了一批在设施巡检、抢险救灾、智能阻家政服务等通用或垂直领域的商业应用成果。然而,化落在配天机器人CTO郭涛看来,行则真正的具身智能,需要具备多模态融合感知决策能力、泛化能力,任务成功率也尚待提升,从这些层面上来讲,具身智能商业落地还有很长一段路要走。
配天机器人作为国内工业机器人领域的头部厂商,也在具身智能领域进行了诸多探索。配天机器人于2023年发布了绎零机器人运动控制引擎,该技术将人工智能和传统控制技术深度融合,使机械臂习得高动态和拟人特性的控制策略网络,使机械臂更好地适应环境变化,以满足各类复杂任务的需求,大幅度提升了机械臂任务执行的精度、速度和泛化能力。通过本次探索,配天打通了具身智能应用的核心技术逻辑。
配天机器人CTO郭涛从具身智能的技术路线出发,分享了他对行业未来发展方向的洞察。以下为采访对话原文,有所修改。
实现具身智能,多模态融合感知决策和任务泛化能力是基础能力
Q:“您如何看待当前具身智能的发展水平?”
郭涛:“具身智能需要的是和物理世界实时交互、即时决策,进而处理泛化任务。将多模态做深度融合后,进行综合分析,这是处理泛化任务的基础。
而目前市面上的大模型应用中,只有图文大模型应用做到了双模态深度融合,其余应用还处于一个浅融合、浅应用的状态,数据量级也不够,还没有达到大模型的体量。大多是分别分析几种模态,再用小模型进行融合。比如AI摄像头融合激光雷达,二者本质上更像是一种模态,摄像头识别目标类别和位置,激光雷达识别目标位置,结合起来精度提升了,但远远达不到综合感知。多模态融合水平不够,数据量级不够,导致现在的一些所谓具身智能没有任务泛化能力,仅能处理同一条件下同一类型的任务,应用价值有限。”
从自动化到智能化,生产模式的变化倒逼技术升级
Q:“配天发展具身智能的驱动力有哪些?”
郭涛:“配天机器人作为国内最早做工业机器人的企业,历经多次技术变迁。这十年间是工业自动化和智能制造的时代。3C、汽车领域生产特点为大规模标准化,机器人在人工编程下重复同一件工作。当下,大规模同品类的生产场景的自动化普及率已经非常高,小规模定制化生产也成为了一种新趋势,这既是机器人企业发展的危机,也是转机。自动化时代繁琐复杂的人工编程示教模式效率低下、成本高企,已经无法满足新生产趋势的需要。生产模式的变化倒逼机器人厂商发展具身智能,只有扩展下游市场,才能将行业从盲目价格内卷的困境中解放出来,赢得更大的发展空间。可以说,智能生产、柔性生产的浪潮已经势不可挡。”
硬件上为移动机构和执行器深度结合,软件上采用端到端架构,或将是具身智能的终极形态
Q:“具身智能的终极形态将会是怎样的?”
早在2021年,配天机器人就瞄准了具身智能这个方向。彼时,具身智能还是一个不为人知的概念,直到大模型概念开始火爆,机器人行为大模型逐渐被业界熟知,配天的战略蓝图才逐步显现在公众视野中。郭涛认为,目前的具身智能,数据还没有到大模型的量级,但几亿参数是可以做到的,并且几亿参数也可以找到商业落地的突破口。
关于具身智能的终极形态,郭涛从硬件和软件两个层面分享了他的见解:
“在具身智能的发展的初级阶段,无论是协作机器人、扫地机器人还是自动驾驶,胳膊和腿是分家的,它们的特点是任务环境单一且尽量不和物理世界发生交互。现在已经出现了大量机械臂与移动平台结合的产品,但商业价值存疑,因为这类产品的机械臂能执行的任务非常有限。
具身智能的高级形态将会是机械臂和移动平台的深度结合,也就是移动能力和操作能力的深度融合。到那时,具身智能就会面对不断变化的环境和暴涨的任务量,这也是具身智能开始显现商业价值的阶段。
目前具身智能的架构主要有两种,一种为分层架构,一种为端到端架构。短期来看,商业落地的主力还将是分层架构。因为目前,端到端架构模式需要的算力还无法被满足,但是长期来看,端到端架构更智能、更泛化、更有想象空间,可能是具身智能的终极形态。”
格局未定,全生态共同分享万亿蛋糕
Q:“多领域玩家入场,具身智能未来的产业链结构将是怎样的?”
郭涛:“从产业链角度来讲,本体厂商具备硬件基础、物理运动控制技术优势,正跃跃欲试准备下场;网络通信厂商有算力优势,必然也会占领一席之地;本身做AI算法的学术机构也会分一杯羹。整个生态将会由多个领域的厂家共同打造,大家共同分享这块价值万亿的大蛋糕。
配天等本体厂商目前的优势主要体现在物理结构上。具身智能产品对硬件性能要求比较高,作为国内资深的本体厂商,配天对机器人的重量、爆发力、灵敏度、功耗等性能有极强的把控能力。当然,算力、末端执行器、传感器、感知决策都是未来热门的研究方向。”
小模型+机械臂,工业场景或将成为具身智能商业落地的最佳切入点?
Q:“具身智能商业落地的切入点将会是在哪里?”
郭涛:“目前,具身智能商业落地有一些制约因素,包括数据量不够、物理交互任务成功率不高等。大家对具身智能应用的想象大多在家用方面,但是家用场景是最需要机器人具备泛化能力的场景。”郭涛认为,具身智能的最先突破点还是在先进工业。在工业场景,具身智能只需要把一项任务做深做透,就能实现商业闭环。工业场景甚至不需要人形机器人,很多人形机器人瞄准的场景,如贴标、测试等,只用机械臂就能轻松搞定;另外,人形机器人的硬件可靠性没有达到商业化落地的状态。”
郭涛认为,在工业领域,具身智能的发展可以从机械臂+小模型这条路径出发,先解决一些具体应用场景的痛点难点,逐步去打通制造业全场景。
比如目前配天锚定的免示教焊接领域,与3C行业、汽车零部件行业大批量复制的生产模式不同,船舶制造、轨道交通、建筑钢构、航空航天等行业的焊接生产模式为多品种生产以及单品定制生产。在这种生产模式下,应用工业机器人的性价比极低。因为机器人示教程序重复利用率低,繁琐复杂的编程示教过程必然造成效率低下,而过于依赖人工又造成运营成本高企。应用具身智能,实现免示教焊接,能极大地释放以上行业的生产力。
由此延伸,具身智能技术可以打破场景对自动化的限制,自动化将延伸至工业生产的方方面面,工业机器人的市场体量会指数级增长。
对于人形机器人,郭涛认为轻量臂结合移动平台,打造能泛化的人形机器人,才能实现商业化落地。目前,配天既有免示教焊接机器人,又有轻量臂产品,二者都是基于绎零机器人运动控制引擎研发的。在郭涛看来,二者虽然工艺不同,但核心技术是相同的。