掌桥专利:专业的专利平台
掌桥专利
首页

基于图神经网络的偏好学习的综合决策方法、系统及介质

文献发布时间:2024-04-18 19:59:31


基于图神经网络的偏好学习的综合决策方法、系统及介质

技术领域

本发明涉及综合决策分析技术领域,具体涉及一种基于图神经网络的偏好学习方法、系统及介质。

背景技术

决策是人们为了完成某项任务或追求某个目标而从若干个可行方案中进行比较、判断、评估并选择最优方案的过程,是人类最基本的活动之一。随着互联网技术的发展,借助大量的知识信息和数据信息,使得现有的决策逐渐走向自动化与智能化,其中以偏好学习为代表的机器学习方法已逐渐成为智能化决策领域的研究重点。偏好学习是一种基于观察到的偏好信息的分类方法,从监督学习的角度来看,偏好学习训练一组对标签或其他项目有偏好的项目,并预测所有项目的偏好。通常,预测的偏好关系需要形成一个总的顺序,因此,偏好学习的本质与综合决策相同,都是从最优到最差排序有限的备选方案,并选择较优的方案。

现有的偏好学习方法通常可以分为参数化方法和非参数化方法,参数化方法利用参数化得分函数从训练数据中学习函数的参数,其训练速度较快但是表达能力较弱;非参数化方法定义了得分函数的分布,并直接从训练数据中学习得分函数质,其表达能力较强但是计算成本较高。对于大多数较为复杂的决策场景,其包含的决策示例及相关的决策数据规模较大,参数化偏好学习方法的优势更加明显,关于此类方法的研究也较为丰富。如非线性的RankSVM方法,其应用支持向量机(SVM)来提高点击数据的搜索精度,得分函数主要通过最小化方案对之间的距离来学习,这将偏好学习问题形式化为约束优化问题;线性的RankNet方法使用概率成本函数来学习得分函数,并基于评分函数预测方案偏好的概率,得分函数可以是关于参数可微的任何模型,这意味着概率损失函数不是特定于固定的机器学习模型。而如RankNet这样的偏好学习方法强烈依赖于排名函数已知的假设,在实际情况下这种假设往往是不现实的,并可能导致错误的排名。

图上的偏好学习可以看作是对图中的节点进行排序,相关的方法可以分为基于图的拓扑结构和深度学习两大类。基于拓扑的方法性能在不同的数据集之间可能存在显著差异,因为它们不涉及从示例中学习来进行排序,而深度学习方法大多基于固有的图结构对节点进行排序,节点之间的关系有时代表竞争或协作,而不是偏好,从而会影响偏好预测。如果偏好学习中的方案被建模为图的节点,方案之间的偏好关系被建模为图的边,并且使用GNN提取方案特征,则参数化偏好学习方法的性能可以在GNN的作用下得到提高,且可以解决综合决策时产生较多无效偏好信息的难题。

因此,如何在图结构上进行偏好学习以及如何借助GNN的表达能力去提高参数化偏好学习方法的表达能力是目前亟待解决的问题。

发明内容

为解决现有技术中存在的不足,本发明提供一种基于图神经网络的偏好学习的综合决策方法、系统及介质,包括偏好关系图构造、偏好关系预测和方案偏好排序三个阶段,通过将决策问题映射到图结构中,利用图神经网络的表达能力去提高参数化偏好学习方法的性能,在提升排序预测性能的同时保证了综合决策过程的可解释性,得到的决策结果更加可靠且可信。

本发明第一方面公开了一种基于图神经网络的偏好学习的综合决策方法,包括下述步骤:

S1:对决策问题中的数据进行预处理,其中决策问题由备选方案及评估准则构成,得到带有特征表示的决策方案信息;

S2:将步骤S1获得的决策方案信息映射至图结构中,并根据所述决策方案间的偏好关系构造偏好关系有向图,其中所述有向图上节点表示方案,边表示方案间的偏好关系;

S3:利用多层感知机模型获取所述偏好关系有向图上的方案偏好特征,同时利用图神经网络的表达能力挖掘图上的方案偏好数据,所述方案偏好数据为成对的方案;

S4:将步骤S3中得到的所述成对的方案输入至对比器神经网络,输出每个所述方案的偏好得分,并修正相关的正不一致偏好;

S5:根据方案的偏好得分进行排序,得到决策问题的最终结果,排序最靠前的方案则为问题的最优方案。

根据本发明第一方面的方法,所述步骤S1中对决策问题中的数据进行预处理包括:去除重复数据、处理缺失值和异常值,进行数据转换和标准化。

根据本发明第一方面的方法,所述步骤S2中所述方案间的偏好关系的是是由方案对的偏好监督信息大小来决定,所述节点的特征值为所述备选方案的评估准则评价值。

根据本发明第一方面的方法,所述步骤S3中利用多层感知机模型获取所述偏好关系有向图上的方案偏好特征包括下述步骤:

S31:对偏好关系有向图上的节点的邻居进行随机采样,每一跳抽样的邻居数不多于聚合层数;

S32:生成图上节点的嵌入表示,具体为先聚合二跳邻居的特征,生成一跳邻居的嵌入表示,再聚合一跳的嵌入表示,生成节点的嵌入表示;

S33:将步骤S32中节点的嵌入表示输入全连接网络得到节点的特征值,并输入多层感知机中;

S34:所述多层感知机输出的相邻节点特征值经过非线性转换,得到图上边的特征表示。

根据本发明第一方面的方法,所述步骤S4包括下述步骤:

S41:对偏好关系有向图上的节点数据按照所属类别进行两两比较,并构造方案对;

S42:将所述方案对输入至三层结构且无偏的对比器神经网络中,输出所述方案对中对应的节点对中两节点的偏好概率;

S43:采用非线性变换将所述两节点偏好概率转换成每个节点的偏好得分。

根据本发明第一方面的方法,所述步骤S3中,利用图神经网络获取偏好关系图上的边特征,其主要根据邻居聚合的机制对图上的节点邻居进行采样和聚合以此获得节点特征,邻居聚合的表达式为:

式中σ为sigmoid函数,‖表示对特征做连接,

根据本发明第一方面的方法,所述步骤S4中,对比器神经网络可满足传递性、对称性和自反性,其中,对于输入

其中w

鉴于f的反对称性质,则

即p(x,y)=-p(y,x),同理,自反性即

根据本发明第一方面的方法,所述步骤S4中,对比器神经网络基于概率排序框架,其输出方案对(x,y)的偏好分数并预测方案x优于方案y的概率,在计算概率损失C

其中L

本发明第二方面公开了一种基于图神经网络的偏好学习的综合决策系统,包括计算机设备,该计算机设备用以执行第一方面所述的基于图神经网络的偏好学习的综合决策方法的步骤。

本发明第三方面公开了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,以实现第一方面所述的基于图神经网络的偏好学习的综合决策方法。

综上,本发明提出的方案具备如下技术效果:该方法通过将决策问题映射到图结构中,利用图神经网络的表达能力去提高参数化偏好学习方法的性能,其包括偏好关系图构造、偏好关系预测和方案偏好排序三个阶段。在偏好关系图构造阶段,决策问题的决策方案与决策准则分别被转换为偏好关系图的节点及其节点特征,然后根据方案的不同类别构造偏好关系图的边,偏好关系图的边代表已知的各方案间偏好关系;在偏好关系预测阶段,备选方案的偏好关系预测转换为偏好关系图的边分类,另外通过构造多层感知机模型来获取偏好图上的边特征,并借助图神经网络的表达能力挖掘图上的偏好信息;在方案偏好排序阶段,对比器神经网络接收成对备选方案的偏好,神经网络的结构使得备选方案的偏好数据以偏好得分形式输出,根据偏好得分对全部备选方案进行排序,排序越靠前的方案则越适用于决策选择。解决了现有技术中在进行综合决策时产生较多无效的偏好信息的问题,利用图神经网络的表达能力挖掘图上的偏好信息,帮助决策者更加科学地建立偏好关系,减少主观性对决策结果的影响,并在提升排序预测性能的同时保证了综合决策过程的可解释性,得到的决策结果更加可靠且可信。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明中各发明内容间的关系图;

图2为本发明的实施例提供的偏好学习方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提出一种基于图神经网络的偏好学习的综合决策方法,该方法包括偏好关系图构造、偏好关系预测和方案偏好排序三个阶段。在第一阶段,方案间的偏好关系被映射到图结构上,并据此构建一个偏好关系图;在第二阶段,借助图神经网络的表达能力挖掘偏好关系图上的偏好信息以此得到偏好关系的特征表示;在第三阶段,使用对比器神经网络判断每个方案的偏好得分,并根据得分对方案的偏好进行排序。

如图1所示,本发明可分解为三个部分,包括(1)偏好关系图构造、(2)偏好关系预测、(3)方案偏好排序,各个组成部分间的关系如图1所示。其中,(1)偏好关系图构造主要用来将综合决策问题映射至图结构上,使方案偏好排序问题转换为图的边分类问题;(2)偏好关系预测主要用来预测(1)所构造的偏好关系图上的方案类别,并确定各方案综合的偏好数据信息;(3)方案偏好排序接收(2)的成对备选方案偏好信息,并通过对比器神经网络对全部备选方案的偏好得分进行评估,以此获得备选方案的排序与决策结果。

本发明的基于图神经网络的偏好学习方法包含5个具体的流程,如图2所示为本发明公开实施例的示意图。本实施例提供一种偏好学习方法并用于综合决策,具体包括以下步骤:

S1:对决策问题中的数据进行预处理,其中一般的决策问题多由备选方案(对象)及评估准则(特征)构成,得到带有特征表示的决策方案信息。

首先对综合决策问题中的决策数据进行预处理(S1),决策问题的表现形式多为备选方案(方案)及评估准则(特征)的组合,备选方案代表了可能的解决方案,而评估准则则是用于衡量这些方案的特征,通过将评估准则应用于备选方案,可以得到带有特征表示的决策方案偏好信息。

进一步的,所述S1中,决策问题的表示形式为X={x

由于评估准则的量纲不同,故评估要统一量纲,即需要对决策数据进行标准化处理:

其中,x

需要说明的是,本实施例中决策者需要对决策数据进行整理和清洗,以确保数据的准确性和一致性,包括去除重复数据、处理缺失值和异常值,以及进行数据转换和标准化。通过这些步骤,可以提高决策数据的质量,并为后续的决策分析提供可靠的基础。另外,决策者还需要对评估准则进行区分和统一量纲处理,评估准则可以是各种指标和因素,如成本、效益、风险、可行性等,决策者可以根据自己的需求和决策目标为每个准则分配相应的权重,并将这些评估准则应用于备选方案。通过预处理和评估,决策者获得的决策方案则包含特征表示信息,这些信息可以帮助决策者更好地理解备选方案的优劣势,并在不同评估准则下做出权衡和比较。预处理后得到的决策方案信息形式如下表:

表1预处理后的决策方案方案偏好信息形式

其中每一行表示每一个备选方案,第一列表示该方案的类别(决策相关度),数字越大,类别越优,方案越相关,第二列开始是每个方案的特征向量。

S2:将决策方案信息映射至图结构中,并根据方案间的偏好关系构造偏好关系有向图,其中图上节点表示方案,边表示方案间的偏好关系。

其次基于S1的决策数据,将决策方案信息映射至图结构中,并根据方案间的偏好关系构造偏好关系有向图(S2),图上的每个节点代表一个方案,边则表示方案之间的偏好关系,通过构建偏好关系有向图,可以更清晰地了解不同方案之间的优劣关系。

所述S2中构造偏好关系图G=(V,E)中节点V为备选方案集X中的选项,边E为备选方案间的偏好关系,其中偏好关系的判断是由方案对的偏好监督信息大小来决定,节点的特征值为备选方案的评估准则评价值。这里引入图的关键是将偏好决策任务映射到图域,此时的决策任务也可以看作是一个二分类任务。例如,要对两个备选方案之间的偏好关系进行分类,如果方案a优于方案b,则分类结果为1,否则为0,故如果(v

S3:设计多层感知机模型获取偏好关系有向图上的方案偏好特征,同时利用图神经网络的表达能力挖掘图上的偏好信息。

为了获取偏好关系有向图上的方案偏好特征,设计多层感知机模型(S3),其可以通过学习S2所构造的图上节点之间的关系,获取每个方案的偏好特征,同时利用图神经网络的表达能力来挖掘图上的偏好信息,进一步提升模型的性能和准确度。

需要说明的是,本实施例中的多层感知机模型由多个神经网络层组成,每个层都包含多个神经元,偏好关系图中的每个节点表示为多层感知机模型的输入,并通过模型的前向传播过程来获取每个方案的偏好特征。通过多层感知机模型的训练过程,可以调整权重和偏置参数,使模型能够学习到图上节点之间的关系,并捕捉到方案的偏好特征。此外,为了进一步提升模型性能和准确度,将图神经网络与多层感知机模型相结合,可以充分利用图上节点之间的连接关系,挖掘更丰富的偏好信息。图神经网络的设计可以考虑节点的邻居信息和节点自身的特征,通过聚合节点的邻居信息,可以获得更全局的图上偏好关系表达。同时,可以利用节点自身的特征向量来丰富模型对方案的理解和表示能力。

所述S3中通过将偏好关系图上节点间的区别送入多层感知机中,并以此获取偏好关系图上各边的特征:

h

其中h

其中

其中L

在某些偏好学习场景中,决策者可能只对特定条件下的特定方案偏好关系感兴趣,而不是对所有方案进行排名。因此,在预测偏好关系时,需要根据特定的偏好条件选择偏好关系图中的方案节点,并创建m个不同的偏好关系子图G

可以理解为第k个偏好关系子图中边uv的真实类别。

S4:将S3中得到的成对方案偏好数据输入至对比器神经网络,输出每个方案的偏好得分,并修正相关的正不一致偏好。

基于S3,获取成对方案偏好数据,并将其输入对比器神经网络中(S4),该网络可以输出每个方案的偏好得分,并对相关的正不一致偏好进行修正,通过对比器神经网络的运算,可以更全面地评估每个方案的优劣。

需要说明的是,本实施例中对比器神经网络通过共享权重来处理两个方案之间的对比,并学习它们之间的相似度或差异度,通过对比器神经网络的学习过程,可以获得每个方案的偏好得分,根据得分的大小可以对方案进行排序或分类,以便决策者更好地进行决策分析和比较。此外,对比器神经网络还可以检测和修正可能存在的偏好不一致情况,例如如果两个方案之间存在明显的不一致偏好,对比器神经网络可以通过调整得分来修正这种不一致性,从而提高决策的准确性和一致性。对比器神经网络的设计和训练需要充分考虑决策者的偏好和决策问题的特点,因此在应用S4之前,需要确保对比器神经网络的架构和参数设置与决策问题的需求相匹配,并且经过充分的训练和验证。

所述S4中构造对比器神经网络的目的是实现备选方案一致且唯一的排名,其以偏好数据作为输入,以备选方案的偏好得分作为输出。具体地,偏好数据被转换成成对得分的矩阵,然后训练对比器神经网络以最小化成对排序损失,这确保了对比器神经网络的输出分数反映真实的成对偏好,在每次训练迭代之后,基于对比器神经网络的输出更新分数,并重复该过程直到收敛。对比器神经网络基于概率排序框架,其输出方案对(x,y)的偏好分数并预测方案x优于方案y的概率,在计算概率损失C

其中L

进一步的,为提高训练效率并同时执行多个最优任务,本发明采用联合训练方法来训练S3和S4中的损失函数。故本发明的基于图神经网络的偏好学习方法总损失函数可以表示为

L

其中0<α,β<1表示不同阶段任务的重要性。

S5:根据方案的偏好得分进行排序,得到决策问题的最终遴选结果,排序最靠前的方案则为问题的最优方案。

根据S4得出的方案偏好得分对全部备选方案进行排序,获得决策问题的最终遴选结果(S5),排序最靠前的方案被认为是问题的最优方案,因为它在考虑了所有备选方案和评估准则的基础上,具有最高的偏好得分,这个排序过程能够帮助决策者做出准确、合理的决策。

需要说明的是,本实施例中通过S5的排序过程,决策者可以更好地理解备选方案之间的优劣关系,并将这些信息用于决策。排名靠前的方案通常具有更高的偏好得分,这意味着它们在满足各项评估准则的要求上更出色。因此,决策者可以有针对性地关注排名靠前的方案,并更加深入地研究其特点和潜在影响。这个排序过程为决策者提供了一个直观的参考,使他们能够更加全面地了解备选方案的优劣,并在做出决策时更具有信心。决策者可以根据方案的偏好得分,结合自身的经验和知识,权衡各个因素,选择最符合需求和目标的方案。此外,S5阶段的排序结果并非绝对的最优解决方案,而是在考虑了所有备选方案和评估准则的基础上,根据当前的决策需求所得出的一个较为理想的选择。决策问题的复杂性和主观性意味着没有一个通用的、绝对的最优方案,因此决策者在使用S5的结果时,仍然需要结合自身的判断和实际情况做出最终的决策。

此外,本发明实施例还提供了一种基于图神经网络的偏好学习的综合决策系统,包括计算机设备,该计算机设备用以执行第一方面所述的基于图神经网络的偏好学习的综合决策方法的步骤。

本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,以实现第一方面所述的基于图神经网络的偏好学习的综合决策方法。

综上,本发明提供了一种基于图神经网络的偏好学习的综合决策方法,该方法通过应用图神经网络来提高基于参数化偏好学习的综合决策过程。通过该方法可以解决现有技术中产生大量无效偏好信息的问题,并提高排序预测性能,同时保证了综合决策结果具有可解释性,因此得到的决策结果更加可靠、可信,为综合决策提供了有力的支持。这一方法的应用具有广泛的潜力,可以在各种决策场景中发挥作用,帮助决策者做出准确、合理的决策。

请注意,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 一种建筑幕墙气密性检测装置
  • 一种建筑幕墙保温性能检测装置
  • 一种传感检测模块及建筑幕墙结构安全检测系统
  • 一种建筑幕墙工程检测装置及检测方法
  • 一种用于建筑装饰工程的幕墙抗风压检测装置
技术分类

06120116523580