掌桥专利:专业的专利平台
掌桥专利
首页

一种工业互联网环境下面向生产要素的服务推荐方法

文献发布时间:2023-06-19 18:35:48



技术领域

本发明主要涉及工业互联网服务推荐方法,具体是一种参考并量化了历史协作关系的针对工业互联网复合服务的服务推荐方法。

背景技术

随着分布式计算、人工智能、物联网、大数据等新型IT技术的不断发展,制造资源可从物理世界感知并被共享到信息世界。在新一代信息技术与制造技术深度融合的背景下,在工业数字化、网络化、智能化转型需求的带动下,以人、机、物等各生产要素全面互联、全面感知、智能优化、安全稳固为特征的工业互联网应运而生。在工业互联网环境下,制造企业将制造资源虚拟化为各种制造服务,并交付给工业互联网平台。随着服务型制造模式的出现,工业互联网平台可配置所需的生产要素服务来完成复杂的生产流程。这些生产要素服务在本发明中统称为制造服务。工业互联网平台可有效地帮助制造业用户或普通用户获得所需的制造服务并组装起来执行需要完成的复杂制造任务。随着越来越多的制造企业加入到工业互联网平台中,越来越多的制造服务发布到平台,使得制造服务的选择变得困难。因此,使用恰当的方法为用户的生产过程需求推荐合适的制造服务组合对提高工业互联网平台的服务推荐效率和服务质量起到至关重要的作用,也是解决服务选择问题的有效途径。

数据挖掘是一种新型的基于大数据的技术,其目的是从人工短时间内无法处理的数据量中挖掘有价值的信息。而在工业互联网平台上协作较好的复合服务将更有希望被成功调用并成为历史数据中的频繁项。因此针对频繁项的数据挖掘能够发现和推荐高度协作的服务组合。在评估服务组合的性能时,由于存在多维的QoS指标,一些制造任务有许多并列的解决方案,这些方案也许并未出现在历史数据中,所以不能仅通过数据挖掘来评估某些服务组合的协作有效性。为缓解该问题,本发明试图将基于图的相似度计算和频繁项的挖掘相结合,来获得复合服务之间的相似度关系,进而评估服务协作的有效性。

到目前为止,已经做了很多关于服务推荐的相关工作。然而,目前已有的研究工作主要是沿用传统服务计算领域的服务组合思路,为组合流程中每个任务选择一个制造服务来完成其任务,或通过组合优化模型和启发式算法协同实现服务选择。实际的算法是由实际的问题来驱动的,在不同的制造场景中,有必要针对优化问题的特殊性重新设计相关算法,以便算法能从应用角度获得较为满意的解。

发明内容

为解决目前技术的不足,本发明结合现有技术,从实际的生产实例出发,尝试解决针对不同种类服务在工业生产要素服务推荐中的问题,来切实提高工业互联网平台的生产质量与效率。

为实现上述目的,本发明的技术方案如下:

1、一种工业互联网环境下面向生产要素的服务推荐方法。其流程包括以下步骤:(1)分解任务:对用户的生产任务进行分解;(2)数据处理:利用SimRank和FP-growth筛选历史数据中的频繁项并得到服务之间的相似度数据:(3)量化指标并结合MOEA:将MOEA算法与协作有效性指标CEI(Collaboration Effectiveness Indicator)结合,筛选高质量的和高协作有效性的复合服务;(4)推荐:将筛选后的复合服务形成组合服务交付给用户来完成生产任务。

2、根据权利要求1所述的一种工业互联网环境下面向生产要素的服务推荐方法,其所述步骤(1)中,在分解生产任务时对任务进行预处理,包括任务的QoS指标,完成服务必须的资源,包括生产资源,物料资源的经济成本等,以及工业互联网平台的任务协作数据。

3、根据权利要求1所述的一种工业互联网环境下面向生产要素的服务推荐方法,其所述步骤(2)、(3)中,算法的步骤为:

(1)、使用python从所选的历史协作数据中读取复合服务的调用关系;

(2)、使用SimRank算法将调用关系生成关系矩阵;

(3)、将关系矩阵迭代计算出所有服务之间的相似度;

(4)、使用FP-growth算法筛选复合服务协作历史中的频繁项;

(5)、结合频繁项和SimRank相似度评价复合服务的协作频率指标CEI;

(6)、将MOEA的每一代迭代过程中优先考虑高CEI的个体以同时筛选出高CEI和高QoS的复合服务。

(7)、多个优化的复合服务形成推荐列表并推荐给用户。

4、根据权利要求3所述的一种工业互联网环境下面向生产要素的服务推荐方法,其特征在于,所述步骤(1)中,工业互联网平台应具有丰富的协作关系数据,包括但不限于工业生产记录,服务协作记录等结构化和非结构化信息。

5、根据权利要求1所述的一种工业互联网环境下面向生产要素的服务推荐方法,其特征在于,所述步骤(3)中,在进行算法的处理之前,已经完成数据的格式化,适配算法的输入;

6、根据权利要求3所述的一种工业互联网环境下面向生产要素的服务推荐方法,其特征在于,所述步骤(3)中,MOEA算法的参数调整均使用算法推荐的默认参数,且对结果进行标准化处理。

本发明的有益效果:

本发明中,通过结合服务协作历史信息,将SimRank相似度和FP-growth的频繁项结合评价服务的协作有效性。与此同时,将协作有效性指标与多目标进化算法结合来筛选候选服务。最后,实验表明,本发明得到的复合服务的HV、均值f、CEI等指标相比于传统MOEA分类方法有较明显提升。

附图说明

图1为本发明的船舶生产流程样例图;

图2为复合服务筛选结果形成组合服务的一种结果;

图3为任务服务的二部图;

图4服务推荐流程总模型框架图

图5为MOEA+CEIF算法流程图;

图6为在MOEA+CEIF算法参数选择的正交实验中过滤比P的结果;

图7为在MOEA+CEIF算法参数选择的正交实验中频繁项阈值F的结果;

图8为CEI指标在MOEA+CEIF与两种原始MOEA的方法对比结果图;

图9为HV指标在MOEA+CEIF与两种原始MOEA的方法对比结果图;

图10为均值f指标在MOEA+CEIF与两原始MOEA的方法对比结果图。

具体实施方式

结合附图和具体实施例,对本发明作进一步说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样在本申请所限定的范围。

由于,目前已有的研究工作主要是沿用传统服务计算领域的服务组合思路,为组合流程中每个任务选择一个制造服务来完成其任务,或通过组合优化模型和启发式算法协同实现服务选择。为此,本发明提出一种新的面向工业互联网平台的针对生产要素服务的推荐方法,称为MOEA+CEIF。我们首先基于SimRank对工业互联网平台历史协作数据进行处理,计算服务之间的相似度。随后,使用FP-growth频繁项挖掘算法对复合服务进行筛选后量化协作有效性指标。其次,将MOEA与协作有效性指标结合即MOEA+CEIF,为用户推荐符合需求的复合服务。最后,将既有高协作有效性和QoS指标的复合服务交付用户。

本发明所提出的基于协作驱动的生产要素服务组合推荐方法的总体框架如图1所示,包括四个主要部分:1)分解任务:从用户的需求出发分解出若干生产任务,形成任务链;2)历史数据处理:基于SimRank描述历史记录中服务之间的协作相似度,再基于FP-growth算法找出频繁项来挖掘并量化协作历史中隐藏的协作有效性;3)生产要素服务组合优化算法:将协作有效性指标和MOEA算法结合,找出既有高QoS指标值又有高协作有效性指标值的复合服务;4)服务推荐:将多个优化的复合服务形成组合服务推荐给用户。

下面对本发明的实例、模型构建与实验进行详细说明。

工业生产实例描述:

为描述工业互联网环境下,工业制造环节中的生产要素服务组合问题,本发明以真实场景中一个粗粒度的船舶生产流程为例,阐述其生产的过程。船舶生产流程如图2所示,船舶生产过程包括5个不同的任务:钢材加工、截面生产、装备加工、泊位封闭和船舶试验,每个任务至少需要一类生产要素资源,即物料资源或机器资源,而每类生产要素资源可能需要一种或多种,T

一、协作驱动的生产要素服务组合推荐

本发明考虑的服务组合的综合服务质量包括时间成本和经济成本,其优化目标函数如公式(1)所示。其中,Q

f=min{Q

在本发明中服务的QoS指标有:(1)时间,指完成指定的制造服务所需的执行时间的总和。(2)成本,指为指定的制造服务执行制造任务的经济成本等。QoS评价指标有四种典型的组合结构:顺序、并行、条件和循环,如表一所示。

表一 QOS优化目标

1.1基于FP-growth的频繁项挖掘算法

多次成功调用的服务组合理论上应具有更高的CEI指标值,该服务组合被选中的可能性更大,因此经过FP-growth在历史数据中挖掘出的频繁项,应在理论上拥有更高的CEI指标值,即首先选出拥有理论上高CEI指标的服务组合。然后,结合服务之间的相似度计算不频繁项的服务组合的CEI指标,搜索频繁项时有两个重要参数:支持度(Sup)和置信度(Conf)。在FP-Growth中,需要设置算法的minsup参数,即最小支持度。minsup和服务组合的频繁项由实验确定,将在具体实施例中进行详细描述。Sup的计算方法如公式3所示,Conf的计算方法如下公式4所示。

其中,N

1.2基于SimRank的协作相似度计算

频繁项集合中的每一个复合服务是在历史中经常出现并服务某一个或一类任务的服务组合,通过FP-Growth筛选后区分出频繁项和非频繁项的服务组合后,对于相同或不同类型的服务,为找到服务与服务中的隐藏关系,可使用SimRank算法计算服务之间的相似性。该算法是一种基于图论的方法来计算任意两个节点之间的相似度。该算法的基本思路为:如果两个实体相似,则与它们关联的个体应相似。如图4所示,实线表示任务和服务之间的调用关系。其中,六边形代表不同物料,物料是完成某种任务所需要的材料,圆形代表生产机器、自动工厂等自动化设备。三个任务调用的服务分别是:T1:S1、S2、S4、S6;T2:S1、S2、S4和S7;T3:S2、S3、S5和S7。由于T1和T2调用的服务组合只有S6和S7不同,所以组合中的S6和S7理论上非常相似。从T2和T3调用的服务组合可以发现,S1、S2、S4和S5之间也存在相关性,但应小于S6和S7之间的相关性。

根据数据集描述的服务与任务的历史调用关系,我们可以迭代得到包含在历史中出现过的任务之间的相似度与相似度矩阵。迭代方法如公式5所示,根据相关研究,我们可以通过公式6来进一步确定任何两个服务之间的相似性。

在公式5中,S代表相似矩阵,Q代表转移概率矩阵,Q的每一列之和为1,表示如果节点i可以转移到节点j,并且有n个这样的节点i,则

1.3计算协作有效性指标

在获得相似度和频繁项之后,我们可以进一步计算其写作有效性,考虑到相似度和频繁项之间的特点和联系,拟考虑用相似度和频繁项来定义和计算协作有效性指标。具体步骤如下:

在公式7中,a为公式6中的阻尼系数,F

二、生产要素服务组合优化算法

在此部分,本发明提出一种基于CEI的过滤方法MOEA+CEIF。该算法可以结合MOEA在迭代中筛选种群的高CEI个体,以提高优化效果。为保证解果具有较高的综合QoS,同时又具有较高的CEI指标值,考虑用多目标优化算法与CEI评价方法结合。图5为MOEA+CEIF的算法框架。在每一代的筛选、迭代的过程中着重保留高CEI的业务组合,使具有高CEI的个体可以在每一代的种群进化中得以保留,以此来保证在调用过程中服务组合的高CEI的基础之上,同时获得QoS的帕累托最优组合。MOEA+CEIF算法的具体步骤如下:

(1)、设置种群迭代次数,种群个数,交叉变异概率,过滤比参数;

(2)、生成并读取到种群解集P,另外创建一个精英解集P';

(3)、将种群集合P'复制到集合P',并计算P'中每一个元素的支配解个数,第i个元素的支配解个数为S(i),其中S(i)的定义如公式8所示;

(4)、从P'中删除被支配的解集,如果P'中的个体超过最大个体数N,则通过聚类方法修剪当前P'。在聚类方法中,为P'中的每个元素进行聚类,构建聚类集合。剪枝时选择距离较小的簇集进行合并,并选择簇中心作为参考点。聚类c1和c2之间的距离计算如公式9所示;

(5)、从P∪P'随机选择个体进行交叉和变异以生成下一代种群后随机选择个体进行交叉、变异;

(6)、计算交叉变异后的每个个体的CEI,在同样的支配度下用CEI指标进行排序,并根据预先设定的比例过滤解集;

(7)、通过轮盘赌的方法选择种群。在轮盘赌中,个体适应度在每一次的计算中被当作是一个概率因素。然而,个体适应度F受距离度量D和优势关系度量R的影响。而R(i)是支配i的所有个体j的S(j)之和。D(i)是为保证当两点的R(i)相同时,相邻两代的前沿之间存在一定距离。计算如公式10-12所示;

(8)、判断迭代是否达到最大迭代次数,结束则返回并为客户推荐的服务组合指标三元组设置为{S

S(i)={j|j∈PUP′,i>j} (8)

R(i)=∑

F(i)=R(i)+D(i) (12)

其中,在公式9中,|c1|和|c2|表示聚类中心的数量,|i

实施例:

在本实施例中,针对本发明提供的推荐方法,进行了实验验证,下面对本实施例的数据集与实验参数设置、评估指标、对比方法以及实验结果进行详细描述。

数据集与实验设置:

我们使用仿真数据集进行实验。数据集使用Python随机生成数据集,包括随机生成服务组合中服务和任务的历史调用关系和各个服务的执行时间、成本等,生成两种不同种类的候选服务200个,并随机生成其调用关系。

参数设置对实验结果有很大的影响,本发明针对生成的仿真数据集进行多次实验,试图通过正交实验确定算法在仿真集中的部分参数取值,如表二所示,每组实验进行10次并取均值作为参考,结果如图6~7所示。最终,所有参数的取值如表三所示,其中“-”表示原始MOEA无需设置该参数。对比方法中的参数选择算法推荐的默认参数,如:PC为交叉概率,PM为变异概率。计算协作有效性需要两个参数:过滤比P和频繁项阈值F,N为种群数,IN为迭代次数。

表二 参数实验

表三 参数设置表

评估指标:

QoS包括多个优化指标,一般很难用一些通用的评估标准来衡量算法的效果。本实验中,拟采用Hypervolume指标评价方法,它表示由解集中的个体与参考点在目标空间中所围成的超立方体的体积,相关研究表明,如果一个解集S优于另一个解集S',那么解集S的Hypervolume指标亦会大于解集S'的Hypervolume指标,并且Hypervolume可一同评价解的收敛性和解的分布性。计算Hypervolume指标的准确性依赖于参考点的选择,即对同一个解集进行评价时,选择不同的参考点,将会得到不同的计算结果。在不知道真实前沿面的情况下,可选取参考点(1,1),如果知道真实Pareto前沿,可以选取离原点最近的点,或者选择各属性最优的点作为参考点。本实验拟选用(1,1)为参考点,Hypervolume指标的计算方法如公式15所示。

其中,X表示算法的非最优解集,

对比方法:

为验证MOEA+CEI的算法性能,进行一系列实验。对照两个经典MOEA算法:SPEA-II和NSGA-II,根据相关研究,SPEA-II和NSGA-II较传统PSO和GA算法更优,因此本发明不再比较。本发明将MOEA+CEI与原MOEA进行实验对比,验证本发明的方法在筛选优化性能高和高CEI指标的复合服务的能力,并展示整体性能和效果。

SimRank的相似性(SR)与基于皮尔逊相关系数(PCC)或与描述客户评级的余弦相似度的方法不同。它基于服务之间的调用关系,而不针对于单个服务,因此选择该算法进行相似度计算。表4和表5中,针对任务T1的候选复合服务进行以上两种相似度计算可以看出s

实验结果与分析:

SimRank的相似性(SR)与基于皮尔逊相关系数(PCC)或与描述客户评级的余弦相似度的方法不同,它基于服务之间的调用关系,而不针对于单个服务,因此选择该算法进行相似度计算。表四和表五中,针对实例任务T1的候选复合服务进行以上两种相似度计算可以看出s

表四 针对任务T1的候选服务的SR相似度(部分)

表五 针对任务T1的候选服务的PCC相似度(部分)

表六为对比实验的统计结果,实验中每个算法运行10次,避免算法操作的随机性,所有结果均标准化。选择的评价指标为HV、mean f和CEI。均值f表示非支配解集中所有QoS项的平均值,在数值上可以反映优化结果的优劣。可以看出,三种指标中QoS指标提升基本相同。CEI的提升在NSGA-II中更为明显。加入CEI指标后的SPEA-II和NSGA-II在协作有效性上有较大的提升。HV指标的提升幅度在两种算法中基本相同。为使结果更加直观,本发明使用箱图来展示实验结果,如图5~7所示,箱图中的点为均值点,箱图中的线为中位线,箱图外的点为异常值点。

表六 算法与对比算法实验结果

如图8~10所示,加入CEI指标可以改善原始MOEA的性能,这是因为企业与企业之间的关系等原因,服务之间存在隐藏的协作关系,而这些隐藏的关系不能直接发现,但可以通过服务之间的调用关系反映出来。MOEA+CEI考虑复合服务调用历史中隐含的服务之间的协作关系,并利用历史数据中有价值的信息。同时,在选择过程中倾向于保留高CEI的复合服务,使得结果优于原始MOEA,在NSGA-II中更为明显。由此可见,MOEA+CEI在SPEA-II下各指标的优化性能提升要略小于NSGA-II,相对于SPEA-II本发明的算法更适应NSGA-II。因此,在求解制造服务的复合优化问题时,MOEA+CEI相较于原始MOEA具有更好的优化性能。

本发明针对工业互联网下面向生产要素的服务组合需求,通过结合经典MOEA和服务的协作有效性指标CEI,提出了协同优化服务协作有效性和服务质量的混合服务推荐方法,即MOEA+CEIF。具体地,本发明将服务组合优化问题建模为双目标帕累托优化问题。为解决该问题,本发明结合基于SimRank相似度算法和FP-growth算法,应用多目标优化算法的帕累托最优思想,求解服务组合优化问题,为用户推荐协作效率高和服务质量优化服务组合优化方案。一系列的实验结果表明,与其他基准方法相比,MOEA+CEI具有在保证QoS指标的情况下,能保证较高协作有效性。

技术分类

06120115627604