掌桥专利:专业的专利平台
掌桥专利
首页

一种基于关节角轨迹编码的机器人动作演示学习方法

文献发布时间:2023-06-19 19:28:50


一种基于关节角轨迹编码的机器人动作演示学习方法

技术领域

本发明涉及机器人动作演示学习技术领域,具体涉及一种基于关节角轨迹编码的机器人动作演示学习方法。

背景技术

随着智能制造与机器人行业的发展,机器人已被广泛应用到工业生产中。目前的工业产品逐步呈现出多品种、小批量、短周期的特征,传统机器人编程与调试需要花费较长时间,逐渐难以满足生产需求。演示学习成为解决传统机器人编程难题的常见方法,它是一种通过人的示范行为向机器人传递知识的新方式,使机器人能够从演示中学习动作,提升学习效率。

目前机器人动作演示学习方法主要有隐马尔可夫模型、高斯混合模型以及一些深度学习算法等,这些算法多用于对机器人末端轨迹进行建模,缺少对机器人的姿态控制,只能复现演示中的末端轨迹,无法对学习到的动作根据实际场景利用新的初始点与目标点进行泛化,灵活性较差。对于机器人各关节关节角变化轨迹的编码难点在于保证各个关节建模的同步性,导致建模困难。同时,这些方法大多数直接对从演示中获取的数据进行学习,未对演示数据进行处理,专家多次演示中演示时间、幅度不同导致机器人学习的动作质量较差,无法最大程度上复现专家演示动作。

因此本申请提出了一种利用专家对机器人末端进行拖动执行动作的非映射式演示方法,将演示期间机器人各关节的关节角变化轨迹作为演示数据,且提出一种演示数据处理方法获取理想演示轨迹,利用动态运动基元算法对机器人各关节的关节角理想演示轨迹进行编码,通过使用同一个正则系统保证建模同步性,最终输入各关节初始与目标关节角值泛化得到关节角变化曲线控制机器人执行动作,实现机器人从演示中学习动作。

发明内容

本部分的目的在于概述本发明的实施例的一些方面及简要介绍一些实施例。在本部分及本申请的说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

针对现有方法的不足,本发明提出了一种基于关节角轨迹编码的机器人动作演示学习方法。专家通过在机器人手动模式下拖动末端执行动作进行多次演示,通过与机器人通信获取期间各关节关节角数据作为演示数据,利用动态时间规整算法(Dynamic TimeWarping,DTW)、构造高斯混合模型(Gaussian Mixture Model,GMM)与高斯混合回归(Gaussian Mixture Regression,GMR)获得理想演示轨迹,利用动态运动基元算法(Dynamic Movement Primitives,DMP)对各关节理想演示轨迹进行编码实现机器人动作学习,通过输入各关节初始与目标关节角值泛化得到关节角变化曲线控制机器人执行动作。

本发明解决其技术问题所采用的技术方案是:一种基于关节角轨迹编码的机器人动作演示学习方法,包括以下步骤:步骤一:专家在机器人手动模式下拖动机器人末端多次执行演示动作,与机器人通信获取演示数据;步骤二:基于动态时间规整算法将各次演示的时间步进行对齐并拼接为一个序列;步骤三:基于高斯混合模型与高斯混合回归获取理想演示轨迹;步骤四:基于动态运动基元算法编码机器各关节理想演示轨迹;步骤五:基于动态运动基元算法输入初始与目标关节角数据泛化出关节角数据,以此控制机器人执行演示中的动作。

进一步地,步骤一包括:本发明的研究对象是具有多个独立旋转关节的机器人,专家在机器人手动模式下拖动机器人末端多次执行需要演示的动作,通过与机器人通信获取每次演示期间各关节的角度变化数据,将获取的机器人所有关节的关节角值与对应时间步作为此动作的一次演示的样本序列,将样本点定义为ξ

进一步地,步骤二包括:通过动态时间规整算法(DTW),将多次演示的样本序列中时间步最少的序列作为参考序列,根据参考序列与其他序列间关节角轨迹相似性获得时间步对应关系,将所有序列时间步对齐并拼接为一个序列。

进一步地,步骤三包括:将拼接后的演示数据构建高斯混合模型(GMM),将构建好的高斯混合模型由高斯混合回归(GMR)获得理想演示轨迹,具有K个高斯核的高斯混合模型概率密度公式可表示为:

式中ξ

进一步地,步骤四包括:为机器人每个关节建立一个动态运动基元算法(DMP),各个DMP使用同一正则系统保证同步,将各关节的理想演示轨迹编码为能够记录轨迹形状非线性项中高斯基函数的权重值。其中DMP公式可表示为:

式中:τ为调节收敛速度的时间常数,y为系统状态,

式中:y

进一步地,步骤五包括:向各个关节的DMP中输入实际需要的起始关节角值与目标关节角值,DMP根据学习演示轨迹得到的高斯基函数权重值泛化出各关节每个时间步的关节角值,控制机器人实现对演示动作的复现与泛化。

本发明的有益效果是,提出了一种基于关节角轨迹编码的机器人动作演示学习方法,利用拖动机器人末端的方式获取演示数据,演示方法非常简单,非专业人员也可以完成演示;提出利用动态时间规整算法、高斯混合模型与高斯混合回归对演示数据进行处理归纳出演示动作的关节轨迹变化特征,提升了数据质量;通过动态运动基元算法使得机器人通过编码各关节轨迹学习演示动作,并且能对动作进行泛化,对机器人的动作学习具有一定意义。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述性中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1为本发明流程图;

图2为本发明关节原始演示数据图;

图3为本发明动态时间规整算法处理数据图;

图4为本发明构造高斯混合模型与高斯混合回归处理数据图;

图5为本发明动态运动基元算法对轨迹复现与泛化数据图;

具体实施方式

下面结合附图和具体实施例对本发明的技术方案进行详细描述,但并不以此限定本申请的保护范围。

参照图1,一种基于关节角轨迹编码的机器人动作演示学习方法,包括以下步骤:步骤一:专家在机器人手动模式下拖动机器人末端多次执行演示动作,与机器人通信获取演示数据;步骤二:基于动态时间规整算法将各次演示的时间步进行对齐并拼接为一个序列;步骤三:基于高斯混合模型与高斯混合回归获取理想演示轨迹;步骤四:基于动态运动基元算法编码机器各关节理想演示轨迹;步骤五:基于动态运动基元算法输入初始与目标关节角数据泛化出关节角数据,以此控制机器人执行演示中的动作。

参照图2,步骤一包括:专家在机器人手动模式下拖动机器人末端执行演示动作10次,通过解析与机器人通信获取的数据包得到各次演示期间机器人各个关节的关节角变化数据,将获取的机器人所有关节的关节角值与对应时间步作为此动作的一个样本序列,将样本点定义为ξ

参照图2、图3,步骤二包括:将获取演示数据中的各次演示的样本序列中时间步最少的序列作为参考序列,其余序列作为测试序列利用动态时间规整算法(DTW)获取规整路径将时间步对齐;将时间步总数为U和V的样本序列为Q:{q

通过图2与图3对比,动态时间规整算法对齐时间步后各次演示的样本序列时间步总数一致,且在同一时间段内关节角变化趋势相似性很高。

参照图3、图4,步骤三包括:将拼接后的演示数据构造高斯核数目为K的高斯混合模型(GMM),K根据关节角变化复杂程度人为给定,变化越复杂K越大,对于图示关节角度变化选择K=4;构造的模型中包含各次演示样本点的分布信息,分布密集的位置说明出现在多次演示中,表示演示动作的重要特征,高斯混合模型的概率密度公式为:

式中:ξ

模型参数求解利用k-means算法获取模型参数初始值,通过期望最大化算法(EM)进行迭代直到收敛,构造好的高斯混合模型通过高斯混合回归(GMR)获取具有演示动作关节角变化特征且平滑的理想演示轨迹。

通过图2与图4对比理想示教曲线能够体现出多次演示中关节角变化的共同特征且非常平滑,提升了演示数据质量。

参照图4、图5,步骤四包括:通过动态运动基元算法(DMP)为机器人每个关节建立一个DMP,各个DMP使用同一正则系统保证同步,将各关节的理想演示轨迹编码为能够记录轨迹形状非线性项中高斯基函数的权重值。其中DMP公式可表示为:

式中:τ为调节收敛速度的时间常数,y为系统状态,

式中:y

式中:c

参照图5,步骤五包括:根据编码理想演示轨迹得到的各关节DMP的高斯基函数权重值ω

图5中recur曲线为对理想演示轨迹demo曲线的复现,goal1与goal2曲线分别为输入新目标点的DMP泛化曲线,显示了此方法的有效性,通过实际机械臂进行效果验证,机械臂能够成功学习演示动作,实现对动作的复现与泛化。

以上所述,仅为本发明的具体实施例,不能以其限定发明实施的范围,所以其等同组件的置换,或依本发明专利保护范围所作的等同变化与修饰,都应仍属于本专利涵盖的范畴。另外,本发明中的技术特征与技术特征之间、技术特征与技术方案之间、技术方案与技术方案之间均可以自由组合使用。

技术分类

06120115928040