掌桥专利:专业的专利平台
掌桥专利
首页

一种权重自适应调整的人-机器人融合决策方法

文献发布时间:2024-04-18 19:58:53


一种权重自适应调整的人-机器人融合决策方法

技术领域

本发明涉及一种权重自适应调整的人-机器人融合决策方法,属于人-机器人融合智能决策领域。

背景技术

人-机器人融合是指人类操作员与机器人自主控制器共同控制系统,介于操作员直接控制和机器人自主控制之间。操作员直接控制意味着操作员远程遥控机器人,系统中没有涉及机器人的自主能力。而机器人的自主控制是指机器人通过自己的感知决策来执行任务,不需要人为干涉。然而在现实世界中存在着诸多不确定性,目前的人工智能水平还不能实现机器人的完全自主化。

在早期的研究中,机器人的自主性大多是预先定义的,或者是根据特定的任务提前编码的,通过该方式赋予机器人自主能力的泛化性差,当面对复杂多样及诸多不确定性的作业环境,需要大量修改代码增加任务量。当前机器人的自主化水平大多是操作者手动调节控制,但自主水平在线调整是未来发展方向。这种自适应的调整方式可以使机器人更接近人类,有利于实现高效率的人机交互,是机器人从遥操作到全自主操作的必经之路。因此在面对非结构化环境时,如何能够自适应调整人-机器人的控制权重是一个十分迫切的需求。

发明内容

本发明提供了一种控制权重动态调整的人-机器人智能决策方法,通过该方法可以实现操作者和机器人控制权的在线调节以适应复杂多变的非结构化环境。

本发明为实现上述目的所采用的技术方案是:一种权重自适应调整的人-机器人融合决策方法,包括以下步骤:

避障模块通过激光传感器获取环境信息,并输出命令u

采用操作者行为熵得到量化后的工作负荷;

将环境信息和工作负荷作为共享控制器的输入,通过共享控制器输出共享控制权重;

机器人基于避障模块的输出命令u

所述避障模块通过激光雷达获取环境信息,并输出命令u

步骤1、通过激光传感器获取包含障碍物位置的环境信息,包括障碍物到机器人的距离和角度,并建立以机器人为中心的极坐标地图;

步骤2、对障碍物进行膨胀处理得到半径为r

步骤3、以机器人为圆心,创建动态窗口C

步骤4、根据不同的障碍物距离赋予不同的障碍物强度值,计算每个扇区内每个活动网格C

其中

1d

0d

式中,c

步骤5、VFH+算法中极障碍物密度的计算取每个扇区内所有活动网格障碍物强度最大值

其中,β

步骤6、通过障碍物强度最大值

步骤7、确定掩面极坐标直方图中所有开口的左边界k

对于窄开口,中间方向作为机器人运动的候选方向;

对于宽开口,存在多个候选方向;

在所有候选方向中,通过选择代价函数最小所对应的方向为最优方向,即机器人前进方向;

根据机器人前进方向和初始设定的自主控制器的速度值得到表征速度矢量的输出命令u

所述代价函数如下:

式中,Δ(*,*)是计算两个区间绝对角度差的函数,k

所述采用操作者行为熵得到量化后的工作负荷,包括以下步骤:

操作者的速度命令E(t):

σ是衰减权重,u

t时刻的估计误差:e(t)=u

取δ使得概率P{0≤e(t)<δ}=90%,并根据δ划分偏差值为9个区间;

对于操作者的线速度和角速度命令

p

所述将环境信息和工作负荷作为共享控制器的输入,通过共享控制器输出共享控制权重,包括以下步骤:

将机器人到障碍物距离、操作者工作负荷作为输入,通过模糊控制器将行为熵表征的工作负荷模糊为四个集合{S,MS,M,B},分别对应{无负荷,轻度负荷,中度负荷,重度负荷},机器人到障碍物距离的模糊为五个集合{S,MS,M,MB,B},分别对应{远,较远,中等,较近,近},输出机器人的控制权重系数ω的模糊子集为{S,MS,M,MB,B}。

所述生成安全速度命令u

分别为安全速度命令的线速度和角速度;ω为控制权重系数,/>

一种权重自适应调整的人-机器人融合决策系统,包括:

避障模块,用于通过激光传感器获取环境信息,并输出命令u

工作负荷量化模块,用于采用操作者行为熵得到量化后的工作负荷;

共享模糊控制器,用于将环境信息和工作负荷作为共享控制器的输入,通过共享控制器输出共享控制权重;

融合决策模块,用于机器人基于避障模块的输出命令u

本发明具有以下有益效果及优点:

1.本发明实现人机协同控制,将操作者和自主控制器系统的优势互补,控制精度变高,系统适应能力增强,并且可以提高执行任务效率。

2.本发明使用行为熵量化操作员工作负荷,与肌电信号特征测量法这种侵入式方法相比更简单易执行,与NASA-TLX量表这种事后主观法相比更实时客观。

3.本发明通过基于模糊规则设计控制权重调节器在线调整人-机器人控制权分配,在面对复杂多变的环境下及时做出正确判断并执行操作,综合考虑障碍物距离和操作员工作负荷,动态调整人机控制权重,保证操作的安全性,减轻操作员的工作负担。

4.本方法适用于在非结构化环境中,机器人在现场执行复杂操作,操作者在远程操控,避免将操作者暴露在危险或者有害的环境中,可以提高任务的执行效率,且控制精度更加准确,安全系数更高。

附图说明

图1本发明的系统框架图;

图2本发明的机器人自主避障模块图;

图3本发明的控制权重调节器图;

图4本发明的模糊规则表。

具体实施方式

下面结合附图及实施例对本发明做进一步的详细说明。

如图1所示,本方法将机器人通过激光雷达获取到的环境信息和操作者通过使用行为熵得到量化后的工作负荷作为共享控制器的输入,控制器将它们混合在一起,并输出共享控制权重。机器人基于改进的VFH+避障模块的输出命令u

图2是基于改进的VFH+避障模块。当机器人在活动窗口未检测到障碍物时,操作员的操作杆作为机器人参考行驶方向;在检测到障碍物时,会根据操作员的引导方向和障碍物位置信息,通过以下具体步骤进行避障操作:

步骤1通过激光传感器代替原方法中超声波传感器进行检测,获取到周围环境信息,也就是障碍物到机器人的距离和角度,建立以机器人为中心的极坐标地图。

步骤2对障碍物数据进行膨胀处理得到半径为r

步骤3以机器人为圆心,创建动态窗口C

步骤4将机器人周围障碍物进行量化,根据不同的障碍物距离赋予不同的障碍物强度值,计算每个活动网格C

其中

式中c

步骤5传统的VFH+算法通过求和的方式反映在直方图中,被挡住的与新方向选取无关的障碍物仍会被计算到极直方图中,然而在实际情况下,传感器只能获取障碍物的一面信息,且机器人对相同障碍物的反应可能会根据相应区域的探索速度而有所不同。为此,极障碍物密度的计算取该扇区内所有活动网格障碍物强度最大值

其中β

步骤6结合合适的障碍强度阈值τ

步骤7确定掩面极坐标直方图中所有开口的左右边界k

对于窄开口,选择中间方向作为机器人运动的候选方向;对于宽开口,有多个候选方向。在所有候选方向中,通过选择改进代价函数g(c)最小值获取最优方向。

式中Δ(*,*)是计算两个区间绝对角度差的函数,k

根据机器人前进方向和初始设定的自主控制器的速度值得到表征速度矢量的输出命令u

如图3所示,本方法的人机融合权重调节器设计为两个输入一个输出的模糊控制器。其中控制器的输入为机器人到障碍物距离d与操作者工作负荷等级D,输出为机器人在人机融合控制决策中的权重ω,操作员权重为(1-ω)。

首先通过使用行为熵作为可预测性的指标,以表征由脑力劳动任务引起操作者工作负荷增加。高工作负荷和不可预测的操作行为有关,随着操作工作量的增加,操作者很可能在执行任务时出现错误,这时候更倾向于用手柄控制的快速命令(操作者的线速度和角速度)来纠正错误。

为了检测出这些异常命令,用修正后的指数加权移动平均模型来估计该时刻操作者的速度命令E(t):

σ是衰减权重,u

在估计误差中使用行为熵H

p

当行为熵超出规定的阈值H

模糊规则表如图4所示。将行为熵反映的工作负荷模糊为四个集合{S,MS,M,B},分别对应{无负荷,轻度负荷,中度负荷,重度负荷},机器人到障碍物距离的模糊子集为{S,MS,M,MB,B},分别对应{远,较远,中等,较近,近},机器人的控制权重系数ω的模糊子集为{S,MS,M,MB,B}。机器人自主智能控制器的权重值表示机器人的自主水平,机器人自主控制器的权重越大,机器人的自主水平越高。当操作者工作负荷较小且距离障碍物较远时,操作员可以正常操作,此时机器人应尽可能小的介入操作任务中,机器人所占的控制权分配较少。随着操作员工作负荷的增加或者机器人距离障碍物越近时,机器人应更多介入到控制中,此时机器人的自主控制器的分配权重增加,对工作负荷高的操作者的误操作进行纠正或对近处障碍物实现避障操作。

机器人基于改进的VFH+避障模块的输出命令u

技术分类

06120116513639