掌桥专利:专业的专利平台
掌桥专利
首页

一种用于人决策预测的改进认知主导决策方法

文献发布时间:2024-04-18 19:52:40


一种用于人决策预测的改进认知主导决策方法

技术领域

本发明涉及一种用于人决策预测的改进认知主导决策方法,属于人决策理论技术领域。

背景技术

预测人的决策是工业生产、航空航天、经济管理等多个领域的重要需求。人的决策具有高度的复杂性,不仅受到各种外界因素的影响,包括:信息的完整程度、工作负荷情况、决策时间是否充足等,而且经验的丰富程度、认知差别、理性程度等人自身因素也会对决策产生重大影响。然而,这些外界因素和自身因素对人决策的作用规律非常复杂,同时,这些因素本身往往是很难量化或界定的。因此,要准确预测人的决策十分困难和复杂。目前的预测方法往往仅适用于某个特定的情景,在超出这个情景的预设条件后,方法的有效性将迅速丧失。认知主导决策方法是通过观察和分析大量人实际决策过程而得到的人决策预测方法,其对预测处在高工作负荷的决策者或者面临时间紧迫当前情景时,具有极高的性能。实验结果表明,在此情景下,超过95%的决策过程都与认知主导决策方法符合。即使在不满足上述条件的决策中,认知主导决策方法仍具有十分可观的预测性能。由于认知主导决策方法具有良好的预测性能,同时又具有很强的可扩展性,已成为人决策预测领域的热点,在军事指挥、消防救援、建筑疏散、汽车飞机驾驶等诸多领域展现出强大的应用潜力。

认知主导决策方法最初提出时仅是一个决策框架,通过描述的形式给出了人决策的各个步骤。虽然,后续大量研究者针对不同决策问题提出了方法的不同数学描述,形成了许多重要的可实践的认知主导决策方法,然而随着现实决策问题越来越复杂,认知主导方法的应用范围越来越大,现有的认知主导决策方法遭遇了以下亟待解决的问题:

(1)随着决策信息越来越丰富,人越来越多的遇到例如飞行高度、经纬度等具有连续特征的信息。根据认知主导决策方法的思想,这些决策信息将会以某种形式存储在记忆里,之后在遇到新情景的时候,将根据决策信息匹配记忆中类似的情景。针对连续信息,如何进行记忆存储以及如何根据连续信息匹配记忆中的情景更是尚未解决的难题。

(2)随着决策系统逐渐复杂,特别是建模多人当前情景的需求迅速增长,个人决策本身具备的不确定性经过复杂的传递过程将显著地影响系统的结果。如何在方法中考虑个人决策的不确定性是目前认知主导决策方法亟待解决的重要问题。

(3)随着生物学和心理学研究的深入,目前已有大量文献证实,频率/概率信息普遍存在人的记忆中,而这些频率/概率信息广泛影响着人的决策过程。认知主导决策方法的核心是通过匹配记忆中的类似情景来进行决策,而记忆是否融入这些频率/概率信息不仅影响整个决策过程,更重要的是将决定决策方法是否在机理层面符合人真实的决策过程。因此,如何获得这些概率/频率信息,这些信息又将以何种形式存入记忆中,并且在整个决策过程中这些信息将如何作用,是目前需要解决的难题。

公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域普通技术人员所公知的现有技术。

发明内容

本发明的目的在于克服现有技术中的不足,提供一种用于人决策预测的改进认知主导决策方法,一方面,预设的记忆模型能够有效存储连续的记忆信息,并能够根据当前情景中的连续信息匹配对应的原型;另一方面,本发明采用联合概率密度函数,具备模拟人决策不确定性的能力。

为达到上述目的,本发明是采用下述技术方案实现的:

本发明公布了一种用于人决策预测的改进认知主导决策方法,包括,

获取当前情景;

根据所述当前情景,基于预设的记忆模型进行特征识别,得到所述当前情景对应的记忆原型;

根据所述当前情景对应的记忆原型,进行记忆提取,得到记忆提取信息;

根据所述记忆提取信息,进行期望检查,得到检查通过的记忆提取信息;

根据所述检查通过的记忆提取信息,进行模拟行动,得到最终的决策行动;

其中,所述预设的记忆模型的构建方法如下:

构建基于概率密度函数的记忆结构;

获取历史事件信息;

根据所述记忆结构和历史事件信息,得到记忆模型。

进一步的,所述记忆结构表示为一系列联合概率密度函数:P

第i个概率密度函数P

其中,P

进一步的,所述记忆中保存的信息包括事件的特征、期望、相关线索、可能的目标和行动。

进一步的,根据所述记忆结构和历史事件信息,得到记忆模型,包括:

针对所述记忆结构中的所有原型,计算所述历史事件信息对应的概率密度,得到最大概率密度值;

响应于所述最大概率密度值大于或等于预设的概率密度值阈值时,则所述历史事件属于最大概率密度值对应的原型,更新所述最大概率密度值对应的原型,得到更新后的原型;

响应于所述最大概率密度值小于预设的概率密度值阈值时,则所述历史事件不属于记忆结构中任一个原型,构建新的原型;

根据所述更新后的原型和新的原型,得到记忆模型。

进一步的,所述更新后的原型的表达式如下:

其中,P

进一步的,所述构建新的原型的表达式如下:

其中,P

进一步的,根据所述当前情景,基于预设的记忆模型进行特征识别,得到所述当前情景对应的原型,包括:

针对预设的记忆模型中的所有原型,计算所述当前情景的边缘分布概率密度,得到最大的边缘分布概率密度值;其中,所述当前情景对应的原型即为最大的边缘分布概率密度值对应的原型;

所述边缘分布概率密度的表达式如下:

其中,P

进一步的,所述根据所述当前情景对应的记忆原型,进行记忆提取,得到记忆提取信息;进行记忆提取的表达式如下:

其中,P

进一步的,所述期望检查包括如下步骤:

根据所述记忆提取信息,得到当前情景对应的原型提取期望;

检查所述原型提取期望与当前情景的期望是否相符;

响应于所述原型提取期望为离散型,且所述原型提取期望与当前情景的期望相符,则得到检查通过的记忆提取信息,进入下一步骤;

响应于所述原型提取期望为离散型,且所述原型提取期望与当前情景的期望不相符,则重新获取当前情景的信息;

响应于所述原型提取期望为连续型,且所述当前情景的期望的概率密度值大于或等于预设的阈值,则得到检查通过的记忆提取信息,进入下一步骤;

响应于所述原型提取期望为连续型,且所述当前情景的期望的概率密度值小于预设的阈值,则重新获取当前情景的信息。

进一步的,根据所述检查通过的记忆提取信息,进行模拟行动,得到最终的决策行动,包括:

根据所述检查通过的记忆提取信息,得到当前情景对应的原型提取行动;

模拟所述原型提取行动的执行过程,得到模拟执行结果;

响应于所述模拟执行结果为可行结果,则所述原型提取行动为最终的决策执行行动;

响应于所述模拟执行结果为不可行结果,则重新从当前情景对应的原型中提取其他可能行动,重复以上步骤。

与现有技术相比,本发明所达到的有益效果:

本发明的一种用于人决策预测的改进认知主导决策方法,一方面,采用预设的记忆模型能够有效存储连续的记忆信息,并能够根据当前情景中的连续信息匹配对应的原型;另一方面,本发明采用联合概率密度函数,具备模拟人决策不确定性的能力。

本发明能够有效解决频率/概率信息的获取和存储问题,并能描述这些信息在决策过程中的作用。通过在记忆结构中存储联合概率密度函数的形式实现了频率/概率信息的存储问题。此外,记忆模型中的概率密度函数是通过拟合人经历的历史时间信息得到的,解决了频率/概率信息的获取问题。

附图说明

图1是一种用于人决策预测的改进认知主导决策方法的流程图;

图2是一种用于人决策预测的改进认知主导决策方法的模块图;

图3是人避障示意图;

图4是当前情景示意图;

图5是人的实际避障过程。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

实施例1

本实施例1公布了一种用于人决策预测的改进认知主导决策方法,包括,

获取当前情景;

根据当前情景,基于预设的记忆模型进行特征识别,得到当前情景对应的原型;

根据当前情景对应的原型,进行记忆提取,得到记忆提取信息;

根据记忆提取信息,进行期望检查,得到检查通过的记忆提取信息;

根据检查通过的记忆提取信息,进行模拟行动,得到最终的决策行动;

其中,预设的记忆模型的构建方法如下:

构建基于概率密度函数的记忆结构;

获取历史事件信息;

根据记忆结构和历史事件信息,得到记忆模型。本发明的技术构思为:一方面,采用预设的记忆模型能够有效存储连续的记忆信息,并能够根据当前情景中的连续信息匹配对应的原型;另一方面,本发明采用联合概率密度函数,具备模拟人决策不确定性的能力。

具体步骤如如图1和2所示:

步骤一:确定记忆结构。

确定记忆结构,即确定记忆何种存储的信息以及这些信息的存储形式。

本实施例中的记忆结构表示为一系列联合概率密度函数:P

第i个概率密度函数P

其中,P

步骤二:构建记忆模型。

构建记忆模型:将人所经历的事件中的信息按照特定的方式存入记忆结构中。

记忆是根据过去经历的事件来建立的,假设人经历了一次历史事件Ex,其中包含的历史事件信息为X

首先将历史事件信息X

响应于最大概率密度值大于或等于预设的概率密度值阈值时,即

更新的方法如式(3)所示:

其中,P

响应于最大概率密度值小于预设的概率密度值阈值时,即

其中,P

根据更新后的原型和新的原型,得到一个完整的记忆模型。

步骤三:基于特征的情景识别。

根据当前情景的特征,从记忆模型中识别所经历过的类似事件。

当面临一个新的情景时,情景识别的任务是判断其属于记忆模型中的哪一个原型。判断的方式是:基于预设的记忆模型,计算当前情景特征信息的边缘分布概率密度,得到最大的边缘分布概率密度值;其中,当前情景对应的原型即为最大的边缘分布概率密度值对应的原型。

首先,根据当前情景的特征向量F,计算如式(5)所示的联合分布概率密度。

其中,P

针对记忆模型中所有的原型计算式(5)中的概率密度,其中最大的边缘分布概率密度值所对应的原型即为当前情景所对应的原型。

步骤四:记忆提取。

记忆提取:根据所识别出的当前情景对应的记忆原型,从记忆中提取此类事件的信息,得到记忆提取信息,包括可能的目标、相关线索、期望、行动,用于解决当前情景中面临的问题。

若当前情景属于第i个原型P

其中,P

步骤五:期望检查。

根据记忆提取信息,得到当前情景对应的原型提取期望,检查原型提取期望是否和当前情景中的期望相违背。如果相违背,则认为当前情景识别有误,则需重新获取当前情景。若不违背,则得到检查通过的记忆提取信息,进行下一步。

为了检查所识别的记忆原型是否与当前情景匹配,需要检查当前情景对应的原型提取期望E是否与当前情景的期望E相符合。检查的方法是:

响应于原型提取期望E为离散型,且原型提取期望与当前情景的期望相符E=E,则得到检查通过的记忆提取信息,进入下一步骤;

响应于原型提取期望E为离散型,且原型提取期望与当前情景的期望不相符E≠E,则返回重新感知当前情景,获取特征信息,重新识别当前情景对应的原型;

如果原型提取期望E为连续型,则计算如式(8)所示的概率密度。

式中,W

响应于原型提取期望E为连续型,且当前情景的期望的概率密度值大于或等于预设的阈值

响应于原型提取期望E为连续型,且当前情景的期望的概率密度值小于预设的阈值

步骤六:模拟行动的执行。

根据检查通过的记忆提取信息,得到当前情景对应的原型提取行动;

模拟原型提取行动的执行过程,得到模拟执行结果;

响应于模拟执行结果为可行结果,则原型提取行动为最终的决策执行行动;

响应于模拟执行结果为不可行结果,则重新从当前情景对应原型中提取其他可能行动,重复以上步骤。

具体步骤如下:

根据感知得到的当前情景的特征F

提取下一可能行动的方法是,在确定特征F

式中,A

综上所述,首先,本专利提出的方法能够有效存储连续信息,并能够在面临新情景时根据当前情景中的连续信息匹配类似的情景。如式(1)所示,在本专利提出的记忆结构中,连续信息(包含在X中)是以概率密度函数的形式存储在记忆中。根据多参数概率密度拟合理论,式(1)所示的概率密度函数代表了一系列数据的共同特性,即代表了一系列类似事件的原型,符合人记忆的原理。因此,通过式(1)连续信息能够有效地存储在记忆中。

本专利提出的方法中,遭遇类似的情景后,模型将根据当前情景的特征F(包含连续信息),匹配记忆中的类似情景(原型)。匹配的方式通过计算式(5)所示的概率密度函数来实现。针对记忆中所有的原型计算式(5)中的概率密度,其中最大的概率密度所对应的原型即为当前情景所属的原型。在本专利提出的方法中,匹配的依据是概率密度的大小,而不是连续信息的直接对比。而概率密度作为连续信息接近程度的有效度量,能有效实现当前情景与记忆模型中类似情景的匹配。

其次,本专利提出的模型具备模拟人决策不确定性的能力。人决策的不确定性表现为,在多次面对类似的当前情景时,虽然大部决策结果可能类似,但仍可能出现差别很大的决策结果。在本专利提出的模型中,在成功识别记忆中类似的情景后,将根据式(7)所示的采样得到提取期望,相关线索,可能的目标,行动四类信息,其中行动是决策的结果。采样得到的行动虽然大部分都集中在概率密度大的区域,但仍有极小概率出现差别很大的结果。

最后,本专利提出的方法能够有效解决频率/概率信息的获取和存储问题,并能描述这些信息在决策过程中的作用。首先,本专利把记忆表示为一系列联合概率密度函数:P

依据记忆中存储的概率密度函数,随后依据式(5)所示的边缘概率密度函数实现情景识别。由于式(5)中的边缘概率密度函数是式(1)中联合概率密度函数的边缘分布,在情景识别过程中频率/概率信息将由联合概率密度函数传递到边缘概率密度函数中,并影响情景识别的结果。

在情景识别完成后,本发明将根据在记忆中识别到的原型P

实施例2

本实施例2提供了一种用于人避障决策的改进认知主导决策方法,记忆保存的信息既有连续参数也有离散参数。该实施例将说明,该发明能有效处理连续信息。如图3所示,人以恒定的速度V=2m/s向前行驶,前方距离为R的地方有一直径为D的障碍物,人通过改变速度方向,使新速度V′在原速度的基础上旋转一个角度θ,以避开障碍物。

步骤(一)确定记忆结构。

记忆结构由k个联合概率密度函数P

其中,X代表记忆中保存的信息,X

X中保存的信息如果是连续的(如,机器人与障碍物的距离,障碍物的大小,人与障碍物相遇的时间,速度方向旋转角度),其可以直接用式(1)构建记忆;如果X中保存的信息是离散的(如,从人的角度看,障碍物在人的上方还是下方;人将可能直接从障碍物上方通过,下方通过,或者相撞;机器人成功避开障碍物),由于式(1)是根据连续变量的联合概率密度函数定义的,所以离散信息需要映射到连续域才能用式(1)构建记忆结构。以“从机器人角度看,障碍物在机器人上方还是下方”这一离散参数为例,在离散域中,P∈{0,1},映射到连续域后,P∈{-∞,∞},但在事件中P的取值只能是0或1。

表1记忆中保存的信息

步骤(二)记忆构建。

记忆模型是根据过去经历的事件来建立的,此处假设过去已经经历过50次事件(如表2所示),记忆模型将根据此50次事件来构建。如果经历的事件越多,人避障的经验越丰富,避障的性能(成功率和效率)越高。由于构建认知主导决策模型的目的是使机器人具有自主避障能力,因此我们仅选取成功避障的事件(G=1)进行记忆构建。

表2所经历的50次事件中的信息

/>

/>

记忆模型构建的方式是,按照表2中事件的序号,将事件逐一存入记忆结构中。以下以前3条记忆的存储过程为例。首先,针对第1次事件,由于目前记忆没有任何原型,将直接构建式(3)所示的新原型。

其中,W如式(2)所示,X

针对第3次事件,X

据此方法,对每一次事件进行处理,处理完50次事件后就完成了记忆模型的构建。

步骤(三)基于特征的情景识别。假设当前面临一个新的情景,如图4所示,该情景的特征是F=[R PD]=[29.5014.3],识别该情景属于哪个原型,应该针对所有的原型P

在本例中,

步骤(四)记忆提取。根据情景识别的结果,需要从第15个原型提取期望,相关线索,可能的目标,行动四类信息。提取的方式是采样如式(7)所示的联合概率密度函数。

在本实施例2中,第15个原型仅包含3个事件的信息,因此,n=3。这三个事件分别对应表2中的第26,36和50次事件。采用拒绝采样,可以提取出期望E=1,相关线索T=10.5,可能的目标G=1,行动θ=-20.6。

步骤(五)期望检查。如图4所示,可以得到当前情景的期望

步骤(六)模拟行动的执行。人在当前情景中模拟行动θ=-20.6的执行,发现人能够成功避障。因此,直接执行该行动,该行动的执行结果如图5所示。由图5的结果可见,本发明能成功实现人的避障。本实施例说明了,人避障经验十分缺乏的情况下(在识别得到的第15个原型中仅有3个事件),仍能有效地实现人的避障。

以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术分类

06120116331719