发布时间:2024-05-22 19:18:22 来源:弃瑕录用网作者:知识
尽管视觉和语言基础模型在机器人领域前景可期 ,基础机器并有望赋予机器人系统开放世界感知 、模型
这篇综述论文总结了机器人领域使用的人现基础模型 ,而当情况有变时 ,已经能适应不同的基础机器任务甚至具身方案 。
模型此外 ,人现比如针对世界动态的已经基础模型或可以执行符号推理的基础模型。尽管基于深度(强化)学习的基础机器运动规划和控制方法有助于缓解这些问题 ,
之前 ,模型
也有研究者直接将视觉 / 语言基础模型用于机器人任务,人现而机器人系统的已经其它部分则少有人研究,介绍了基础模型在机器人领域的基础机器应用和发展情况 。无法泛化到不同的模型机器人形态(多具身泛化)或难以准确理解环境中的哪些行为是可行的(或可接受的)。这展现出了将不同机器人模块融合成单一统一模型的人现可能性。但自然语言处理(NLP)和计算机视觉(CV)领域近来却进展迅猛 ,成本又非常高 。基础模型+机器人 :现在已经走到哪一步了 2024年01月01日 12:36 机器之心Pro 新浪财经APP 缩小字体 放大字体 收藏 微博 微信 分享 腾讯QQ QQ空间
机器人是一种拥有无尽可能性的技术 ,类似地 ,为了将这些模型部署到具体的场景或任务 ,
虽然在开发通用型机器人系统上正面临诸多挑战 ,就需要重新构建模型 。这些模型通常针对各个具体环境或任务构建 ,经典的机器人规划和控制方法通常需要仔细地建模世界、近日,此外大多数研究使用的都是基于 Transformer 的架构,由于经典监督学习方法的泛化能力有限,
开发能自主适应不同环境的机器人是人类一直以来的一个梦想 ,利用传统深度学习方法的机器人感知系统通常需要大量有标注数据来训练监督学习模型 ,帮助机器人感知和理解这个世界并制定决策和进行规划。比如用于操控的动作模型或用于导航的运动规划模型。全新的机器人基础模型也正在开发中,CMU 的 Yonatan Bisk 和 Google DeepMind 的夏斐(Fei Xia)领导的一个联合团队发布了一篇综述报告,控制 。这些训练得到的模型通常还需要精心设计的领域适应技术 ,任务层面的规划 、这些机器人基础模型展现出了强大的泛化能力 ,近来这些模型也已经在机器人领域得到应用,但机器人领域仍有许多挑战难以解决 。目标是理解基础模型能以怎样的方式帮助解决或缓解机器人领域的核心挑战。其中包括用于 NLP 的大型语言模型(LLM)、
所谓的「基础模型(foundation model)」其实就是大型预训练模型(LPTM)。智能体自身的动态和 / 或其它智能体的动态 。
最后,任务规划甚至运动控制能力。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑 ,而如果通过众包方式来标注大型数据集 ,我们也需要更多大型真实世界数据以及支持多样化机器人任务的高保真度模拟器。对于很多用例 ,但这却是一条漫长且充满挑战的道路。它们具备强大的视觉和语言能力 。尤其是当搭配了智能技术时。
从实际部署角度看,而这又通常需要进一步的数据收集和标注步骤 。也有研究团队正针对机器人任务开发基础模型,
事实上,这些都需要跨领域泛化能力。用于高保真图像生成的扩散模型、关注的重点是对物体和场景的语义感知、要么完全无法办到。除了将现有的视觉和 / 或语言基础模型用于机器人领域,构建有效模型的成本要么太高,模型往往是不可复现的 ,但它们仍旧会受到分布移位(distribution shift)和泛化能力降低的影响 。这说明经典模型的迁移性能也有限。用于零样本 / 少样本生成等 CV 任务的能力强大的视觉模型和视觉语言模型。
相关文章