掌桥专利:专业的专利平台
掌桥专利
首页

基于黎曼流形的人机协同方法

文献发布时间:2023-06-19 19:28:50


基于黎曼流形的人机协同方法

技术领域

本发明涉及人机协同技术领域,具体是一种基于黎曼流形的人机协同方法。

背景技术

客户满意度加剧了全球竞争,对企业提高产品和服务的灵活性提出了重要要求。解决这一需求的方法通常是引入人工操作人员来完成具有挑战性的任务,这些任务要求高度的灵活性和决策认知能力。然而,从另一个角度来看,机器人可以在处理高精度、重复性和非人体工程学的制造任务时提供帮助。鉴于人类操作员与机器人的功能互补,研究操作员与机器人协同工作的共享工作空间是很自然的,这促进了人机协同研究的动力。

最近的人机协同研究主要集中在协同操作、切换任务和在线轨迹规划应用中交互和感知模型的结合。例如,一项类似的研究通过模拟人类接触行为来解决人类互动和碰撞检测等问题。

此外,根据惯性测量单元和机器视觉等各种观测结果正确解释人类意图,对于人类机器人协作非常重要,因为运动可读性会显著影响协作效率。第一种方法是将人机协作问题建立为一个混合规划问题,以理解人类的运动。更具体地说,利用多个定界层的思想,将联合符号和几何规划视为一种复杂的逼近方案。第二种方法可以被称为运动原语方法,它对人类和机器人的运动进行概率编码,并在变化的环境下输出可适应的机器人轨迹。

关于时间对齐,在人机协作中也很重要。解决时间对齐问题的一个基本和直接的方法是动态时间归整方法。然而,在实时应用中,它计算花费的时间巨大。另外,时间对齐问题也可以用隐马尔可夫模型建模,如人类动作预测和工具交付。然而,隐马尔可夫模型只能模拟离散的时间序列问题,不能明确地模拟机器人的运动。

此外,时间对齐也可以通过利用运动原语方法实现。例如,时间变化由动态运动原语派生的显式相位指示器控制,该相位指示器可以同时控制多个机器人轨迹。基于数据驱动黑盒映射的时间运动可以与核回归(Kernelizedmovement Primitives, KMP)和基函数回归(Probabilistic movement Primitives,ProMP)对齐。相应的应用已经扩展到定向行为克隆的人机交互协同计算中。

在现实世界的人机协作中,操作者几乎不可能重复相同的动作,因此需要一个人-机混合运动规划系统的联合建模。来自操作者和交互环境的变化都可能给协作框架带来更多的挑战,其是当人类的观察被测量带有严重的噪声时,往往很难建立一个精确的协作模型。

发明内容

针对上述现有技术中的不足,本发明提供一种基于黎曼流形的人机协同方法,在基于黎曼流形空间中建立无运动奇点且可利用隐状态的预测传递对人类观测的不确定性的人机协同模型,能够有效地提高人机协同的精度。

为实现上述目的,本发明提供一种基于黎曼流形的人机协同方法,包括如下步骤:

步骤1,建立人机交互模型,在所述人机交互模型中,机器人的预测状态量与人的行为观测量采用基于黎曼流形的双四元数表示;

步骤2,采用泰勒展开求解状态的先验概率分布,并利用联合概率分布来求解状态的边际概率分布,从而获得机器人的预测状态的后验概率分布;

步骤3,将人机交互模型的建模数据划分为K个独立的数据集,并基于上述人机交互模型求得每个数据集对应的后验概率分布;

步骤4,利用贝叶斯委员会机器理论推断预测框架,得到基于K个数据集融合的分布式后验概率分布。

本发明提供的一种基于黎曼流形的人机协同方法,机器人可对人类行为进行定向克隆,对机器人的旋转和平移运动进行概率编码。此外,在黎曼流形的切线空间中建立的人机协作交互模型,可让随着机器人预测传播对人类观测的不确定性。同时,采用分布式框架通过利用其内部不确定性的传递可推断出更精确的机器人轨迹,可有效地提高人机协同的精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。

图1为本发明实施例中黎曼流形的人机协同方法的流程图;

图2为本发明实施例中运动奇点的解释示意图;

图3为本发明实施例示例中从第1个人机交互模型得到的机器人轨迹推论示意图,其中:(a)为旋转量r

图4为本发明实施例示例中从第2个人机交互模型得到的机器人轨迹推论示意图,其中:(a)为旋转量r

图5为本发明实施例示例中从第3个人机交互模型得到的机器人轨迹推论示意图,其中:(a)为旋转量r

图6为本发明实施例示例中从第4个人机交互模型得到的机器人轨迹推论示意图,其中:(a)为旋转量r

图7为本发明实施例示例中从第5个人机交互模型得到的机器人轨迹推论示意图,其中:(a)为旋转量r

图8为本发明实施例示例中从第6个人机交互模型得到的机器人轨迹推论示意图,其中:(a)为旋转量r

图9为本发明实施例示例中从第7个人机交互模型得到的机器人轨迹推论示意图,其中:(a)为旋转量r

图10为本发明实施例示例中从第8个人机交互模型得到的机器人轨迹推论示意图,其中:(a)为旋转量r

图11为本发明实施例中分布式地融合了所有8个人机交互模型的机器人轨迹推论示意图,其中:(a)为旋转量r

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

如图1所示为本实施例公开的一种基于黎曼流形的人机协同方法,其包括如下步骤:

步骤1,建立人机交互模型,在所述人机交互模型中,机器人的预测状态量与人的行为观测量采用基于黎曼流形的双四元数表示;

步骤2,采用泰勒展开求解状态的先验概率分布,并利用联合概率分布来求解状态的边际概率分布,从而获得机器人的预测状态的后验概率分布;

步骤3,将人机交互模型的建模数据划分为K个独立的数据集,并基于上述人机交互模型求得每个数据集对应的后验概率分布;

步骤4,利用贝叶斯委员会机器理论推断预测框架,得到基于K个数据集融合的分布式后验概率分布。

本实施例中的基于黎曼流形及其切空间的笛卡尔坐标系下人类行为克隆的人机协同,先通过对数映射将状态转化为黎曼流形的切线空间,然后,在切线空间中概率地进行模仿学习。在笛卡尔空间中,物体的位姿包括旋转和平移,可以表示为双四元数,但是双四元数之间的距离在黎曼流形上不是欧几里德的,直接在其上进行回归学习会打破单位约束,造成运动奇点,导致运动轨迹不准确,即如图2所示:图2中,球形是单位里面流形,黑色核回归线已经超出单位约束,实际轨迹不能超出单位约束,故黎曼流形下运动轨迹的回归存在奇点。因此本实施例中在黎曼流形的切线空间中进行了人类行为克隆的回归学习,通过对数映射,一个双四元数可以映射到黎曼流形的切线空间,可以表示成一个7维向量,为:

(1)

其中,

在人机协同的过程中,假设两个不同的智能体分别表现出两种协作轨迹。例如,这些轨迹一个来自机械臂,另一个来自操作员。这个两种协作轨迹在笛卡尔坐标系中可表示为黎曼流形上的双四元数

对于一个具有高斯分布的动态系统,其动态系统方程可以表示为

(2)

(3)

其中,

为了推断协同机器人的位姿或者说状态量,预测状态量应考虑对人类操作者在时间和空间上的观察。因此,基于贝叶斯理论,将给定观测值

(4)

其中,

(5)

其中,

为边际分布概率函数,可表示为:

(6)

因为公式(6)边际分布概率函数

联合分布函数

(7)

式中,

式中,

最后,基于上述已知量,可求解能得到联合分布函数

(8)

(9)

(10)

其中,

虽然通过式(1)-式(10)能够得到机器人预测状态量的后验分布

首先,根据专家数据集的独立假设,将建模数据集

在每个数据集的独立假设下,为了将

(11)

其中,贝叶斯委员会机器理论具体可参考论文的“Tresp, Volker. A BayesianCommittee Machine. Neural Computation, 12(11):2719–2741, 2000. URL http://www.dbs.ifi.lmu.de/˜tresp/papers/bcm6.pdf.”;

基于公式(11)的理论,可得到

式中,

最后,分布式后验分布概率的均值

式中,

下面结合具体的示例对本实施例中基于黎曼流形的人机协同方法作出进一步的说明。

通过一个YuMi机器人、一个HTCVIVE虚拟现实设备和一台Alienware笔记本电脑组成实验平台,Alienware笔记本电脑可为为HTCVIVE虚拟现实设备与YuMi机器人提供通信,HTCVIVE虚拟现实设备包括头戴式设备、两个定位器和两个操作手柄。在这一示例中,人类的观察结果是通过两个定位传感器获得的。

首先,收集8组训练数据集

训练完成后,通过训练的人际交互模型预测机械臂的轨迹。其中,观测数据来自于HTCVIVE虚拟现实设备。通过8个人机交互模型得到机器人推论轨迹如图3-10所示,图3-10中每个机器人轨迹推论都包括七个子图,分别是三个平移变量、三个旋转变量和一个归一化参数。

虽然每个人机交互模型对人类观测数据的输入是相同的,但在不同的人际交互模型的切空间中每个分量的预测是不相同的。这是因为每个人际交互建模都是数据驱动的,非参数的,系统不依赖一个单一的人机交互模型来解决所有的任务。因此,通过采用本实施例提出的分布式框架可组合了8种人机交互模型,如图11所示,与图3-10中的8种人机交互建模相比,图11中的分布式框架的置信区间(传播不确定度)要小得多,表明了本实施例中的分布式框架对新轨迹预测具有更高的可信度。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

技术分类

06120115920214