掌桥专利:专业的专利平台
掌桥专利
首页

一种基于知识图谱表示学习的加工链重用方法

文献发布时间:2023-06-19 16:06:26



技术领域

本发明属于机械加工工艺规划技术领域,具体地说是一种基于知识图谱表示学习的加工链生成方法。

背景技术

知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的技术方法。知识图谱旨在从数据中识别、发现和推理事物或概念间的复杂关系,是事物关系的可计算模型,其在知识库的构建方面具备接入多源数据的能力,比传统的人工方式更加高效。而知识图谱的表示学习是将知识图谱中包括实体和关系的语义信息映射为低维稠密向量进行表示,通过知识图谱中大量知识三元组的训练,得到该向量表示,以表达实体关系的语义内容,便于下游的知识推理计算。目前,知识图谱在机械工业方面的应用逐步发展起来,部分企业已构建如加工工艺规划知识图谱、切削加工知识图谱等机械加工工艺规划垂直领域知识图谱。

与此同时,随着产品需求趋于个性化、多样化和动态化,产品更新更快,样式更多,小批量定制化产品的市场份额提升明显。面对小批量定制产品中工艺方式的决策难和工艺知识的可重用性差等问题,亟需一种高效的工艺知识检索与重用方法,以利用工艺规划中的相关知识,重用历史加工特征的加工链。现有方法下,一般采用建立工艺信息模型进行节点的匹配或者结构的相似性度量,亦或是对典型工艺路线进行提取以实现工艺知识重用,这种方法勉强能应对大批量标准化工件的生产加工,但难以应对定制化产品加工方式的多样化与决策的实时性要求,难以响应定制化产品的动态变更需求。

因此结合现有的机械加工工艺规划知识图谱,利用知识图谱的表示学习技术,为工艺规划知识图谱中的知识三元组学习向量表示,通过语义信息对加工特征的加工链进行相似度度量从而进一步实现加工路线的重用,更快地响应决策需求,支撑定制化产品生产制造的高质量发展。

发明内容

本发明的目的是通过发明一种基于知识图谱表示学习技术的加工链生成方法,利用知识图谱表示学习技术为知识图谱中每个实体和关系学习一个向量表示,将各实体和关系转化到低维稠密向量,从而得到量化的实值数据,再以多属性相似度计算加工特征实体的相似性,进一步完成对历史加工链信息的重用。

一种基于知识图谱表示学习的加工链重用方法,包括下列步骤:

第一步:建立零件的工艺信息模型;

第二步:基于TransD模型训练向量表示

对于给定的知识三元组(h,r,t),TransD模型设计有投影矩阵M

经投影变换后,头实体h和尾实体t向量表示为:

h

将TransD模型运用在工艺规划领域知识图谱的向量表示中,其训练过程如下:

(1)将工艺规划知识图谱中的实体与关系分别编入不同文件,并设立每个实体、关系的唯一编号id;建立一个新文件用以存储三元组,其中三元组中的实体和关系用编号id代替,完成数据集的处理;

(2)输入TransD模型训练的超参数,损失函数中的标准化项γ为1,损失函数为:

式中T代表正样本,T′代表负样本,h为头实体,t为尾实体,γ代表正样本与负样本的间隔值,γ越大则三元组间被允许的误差就越大;正样本由原始数据集得到,负样本是对原始三元组中的头实体或尾实体进行随机替换后形成;

其评分函数f

(3)通过随机梯度下降法SGD计算损失,更新模型参数;若不满足收敛条件,则循环生成正负实例进行损失计算;若满足收敛条件,得到最终的嵌入向量;

第三步:基于向量表示的多属性相似度计算

根据TransD模型训练好的向量表示,将待加工特征视为目标加工特征,可重用的历史加工特征视为相似加工特征,分别对从属于待加工特征的特征类型FT、尺寸特征SF、材料特征MC、精度特征AF四类属性进行相似度计算,再赋权求和得到最终加工特征之间的相似度值,属性间的相似度计算采用余弦相似度

通过多属性相似度计算对特征MF的属性进行相似度量,重用历史数据中的加工链;多属性相似度计算方法为:

式中,

对于α、β、

第四步:利用多属性相似度计算分值进行加工链重用

根据得到的多属性相似度值

进一步地,第一步的方法如下:

将待加工零件拆解成若干个加工特征,表达为:

式中,PMF代表待加工零件PM的特征集合,MF

根据工艺制造所需的机加工信息描述,工件的特征单元MF表达为如下的七元组形式:

MF={ID,FT,SF,MC,AF,PC,PFs}

式中,ID代表该特征单元的序列编号,FT代表其加工特征类型,SF代表其尺寸特征,MC代表其材料特征,AF代表其精度特征,PC代表特征单元的加工链,PFs代表先行特征集,即待加工零件下加工顺序要优先于该特征的特征单元序列编号集合,由特征间的约束关系决定,该约束关系主要包含四类:先粗后精型约束、先面后孔型约束、基准优先型约束、主次优先型约束。

面向加工特征的几何形状将加工特征类型FT分成16个基本大类,即FT={凸台类,腔孔类,槽类,凸起类,圆角类,外圆类,台阶类,平面类,旋转特征类,球冠类,轮廓类,螺纹类,标记类,滚花类,一般移除体积类,肋顶类};每个大类又进一步拆分为子类别。

尺寸特征SF包括定位尺寸与定型尺寸。材料特征MC包括材料类型、硬度。精度特征AF包括尺寸公差和表面粗糙度。

加工链PC是由特征单元MF下所有加工元ME组成的加工序列,表达为:

式中,MF代表加工链从属的特征单元,ME

加工元ME能对单个加工方式进行描述:

ME={ID,MN,MF,PM}#(4)

式中,ID代表该加工元的序列编号,MN代表加工方式名称,MF代表其从属的特征单元编号,PM代表其可使用的工艺设备。

本发明的有益效果在于:其一,利用知识图谱的高效检索与资源组织能力,为工艺知识重用提供优质数据源;其二,在知识图谱表示学习上,利用TransD模型为知识三元组训练出向量表示,对比其他表示学习模型,该模型对知识图谱的语义信息与实体关系结构信息的学习能力更强,能够更充分地表征语义,为加工链重用提供有效的向量表示。

附图说明

图1零件的工艺信息模型

图2 TransD模型原理图

图3 TransD模型训练过程

图4多属性相似度计算示意图

图5工艺规划知识图谱局部示意图

图6加工链重用示意图

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于此描述的其他方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

本发明的相关概念定义如下:

从工艺角度来说,待加工零件主要由若干个加工特征组成,加工特征是指包括零件特定的几何构形,以及具备实际工程意义和制造要求相关的信息集合,是形成零件几何形状和信息模型的基本单元。机械加工工艺过程可以视为将工件按照各类加工特征的要求,由毛坯依次完成相关加工内容最终形成满足工艺需求零件的过程。依据加工工艺过程,学者们共识性地提出了加工元和零件加工链等相关定义,为便于工艺规划中零件的工艺信息表达,参照国家标准GB/T 4863-2008,本发明对加工链、加工元等概念进行定义,并建立了零件的工艺信息模型。

首先在整体上可以将待加工零件拆解成若干个加工特征,在数学上可表达为:

式中,PMF代表待加工零件PM的特征集合,MF

其次,根据工艺制造所需的机加工信息描述,工件的特征单元MF又可表达为如下的七元组形式:

MF={ID,FT,SF,MC,AF,PC,PFs}#(2)

式中,ID代表该特征单元的序列编号,FT代表其加工特征类型,SF代表其尺寸特征,MC代表其材料特征,AF代表其精度特征,PC代表特征单元的加工链,PFs代表先行特征集,即待加工零件下加工顺序要优先于该特征的特征单元序列编号集合,由特征间的约束关系决定,该约束关系主要包含四类:先粗后精型约束、先面后孔型约束、基准优先型约束、主次优先型约束。

根据现行标准,结合ISO关于加工特征“为获得零件最终几何形状而应从毛坯去除的材料体积”的定义,面向加工特征的几何形状可将加工特征类型FT分成16个基本大类,即FT={凸台类,腔孔类,槽类,凸起类,圆角类,外圆类,台阶类,平面类,旋转特征类,球冠类,轮廓类,螺纹类,标记类,滚花类,一般移除体积类,肋顶类}。而每个大类又可再进一步拆分为子类别,如凸台类可进一步分为圆形凸台和矩形凸台等。

尺寸特征SF主要包括定位尺寸与定型尺寸。材料特征MC主要包括材料类型、硬度等。精度特征AF主要包括尺寸公差和表面粗糙度等。

加工链PC是由该特征下所有加工元ME组成的加工序列,可表达为:

式中,MF代表该加工链从属的特征单元,ME为加工元。如某平面的加工方式为粗铣ME

加工元ME能对单个加工方式进行描述,可细化表达为如下的四元组形式:

ME={ID,MN,MF,PM}#(4)

式中,ID代表该加工元的序列编号,MN代表加工方式名称,MF代表其从属的特征单元编号,PM代表其可使用的工艺设备。

图1是本发明所建立的零件工艺信息模型的示意图,图中对特征单元、加工元等要素及其之间的关系进行了表达。

因此加工元是以特征为基础形成的加工链中的各基本元素,而加工链便是单个加工特征的加工方式集合。在小批量定制化产品中,通过对单个加工特征的加工链进行确定,然后通过优化模型对各加工链的优先级进行计算与平衡,最后集成调度加工资源拟定最优加工路线。因此加工链的确定是基础,同时也是定制化产品实现工艺路线智能生成的重要一环,通过加工链能够进一步匹配细粒度的加工方式,从而组织广泛的加工资源,实时性地调度生产机器。

综合以上定义和机械加工工艺过程分析,本发明将以加工特征的加工链生成为主要内容,通过知识图谱表示学习方法为工艺规划知识图谱的知识三元组学习向量表示,再通过对属性的节点相似度计算来重用历史加工链,最终实现加工链的生成。

本发明的技术方案如下:

①基于TransD模型训练向量表示

在知识图谱中,数据采用三元组进行存储,其中节点代表了实体,不同类型的边代表了关系,在知识图谱的知识表示中为了更直接地说明实体和关系,通常用以下形式来表达三元组:

T=(h,r,t)#(5)

式中,h代表头实体,t代表尾实体,r代表其之间的关系。

三元组的表示如(机床,kind-of,铣床),但这种基于离散符号的表示,难以在计算机中表达对应的语义信息和进行语义计算,故知识图谱表示学习技术应运而生。知识图谱表示学习借助了词向量的思想,通过给知识图谱中每个实体和关系学习一个向量表示,将各实体和关系转化到低维稠密向量,从而得到量化的实值数据。常用的知识表示学习模型有TransE、TransR、TransD等,其中TransE模型无法支持一对多或者多对多类型的关系,而TransR模型计算过于复杂,TransD模型能支持多对关系且运算难度较低。考虑到计算复杂度、模型效果以及工艺数据的动态增长特性,经对比分析本发明采用了TransD模型用以生成知识图谱实体和关系的表示向量。TransD模型原理如图2所示,对于给定的知识三元组(h,r,t),TransD模型设计了投影矩阵M

式中,w

经投影变换后,头实体h和尾实体t向量可表示为:

h

本发明将TransD模型运用在工艺规划领域知识图谱的向量表示中,其训练过程如图3所示,步骤如下:

(1)首先将工艺规划知识图谱中的实体与关系分别编入文件entity2id.txt、relation2id.txt,并设立每个实体、关系的唯一编号id;建立一个新文件triple.txt用以存储三元组,其中三元组中的实体和关系用编号id代替,完成数据集的处理。

(2)然后输入TransD模型训练的超参数,主要的超参数为:学习率0.001,批次大小设置为100,迭代次数为200、维度K为100,损失函数中的标准化项γ为1。其中损失函数为:

式中T代表正样本,T′代表负样本,h为头实体,t为尾实体,γ代表正样本与负样本的间隔值,γ越大则三元组间被允许的误差就越大。正样本由原始数据集得到,负样本是对原始三元组中的头实体或尾实体进行随机替换后形成。

其评分函数f

(3)最后通过SGD(随机梯度下降法)计算损失,更新模型参数。若不满足收敛条件,则循环生成正负实例进行损失计算;若满足收敛条件,可得到最终的嵌入向量。

②基于向量表示的多属性相似度计算

依据零件的工艺信息模型,特征单元MF主要包括{ID,FT,SF,MC,AF,PC,PFs}七类信息,其中加工特征类型FT、尺寸特征SF、材料特征MC、精度特征AF可由需求信息与设计特征转化而来,先行特征集PFs可基于特征间的约束关系,采用规则进行确定。而加工链PC包含了若干个加工元ME,对于各特征下的加工链,现有方法往往采用人工进行拟定,这是因为加工链的确定需要协同考虑各类加工方法以及该方法所能达到的精度等条件,而这些条件又趋于多样化。如对于孔类的加工,可以选择“钻-扩-铰”,也可以选择“钻-扩-拉”、“粗镗-精镗”等加工链。因此加工链的拟定是一个复杂的决策问题,需要依靠经验知识与约束规则。但从工件本身来看,加工特征是存在相似性的,若待加工特征的材料特征、精度特征、尺寸特征等条件与拥有确定加工链的历史加工特征的各条件相似,则可重用该历史加工链,即重用了历史的经验知识与约束规则,同时若拥有较大规模的历史加工特征数据,则能够进行更精准的计算,知识图谱的大规模知识三元组恰恰满足了这一需求。

因此,根据TransD模型训练好的向量表示,可以为待拟定加工链的加工特征各属性与知识图谱中的历史加工特征各属性进行相似度计算,从而重用最具相似性的历史加工特征的加工链。如图4所示,图中将待加工特征视为目标加工特征,可重用的历史加工特征视为相似加工特征,分别对从属于该加工特征的特征类型FT、尺寸特征SF、材料特征MC、精度特征AF四类属性进行相似度计算,再赋权求和得到最终加工特征之间的相似度值。

其中,属性间的相似度计算采用余弦相似度,如对于属性A,其向量表示为[a

式中,a

通过多属性相似度计算对特征MF的属性进行相似度量,过滤低相似特征,从而重用历史数据中的加工链。其中多属性相似度计算方法为:

式中,

对于α、β、

(1)生成各属性相似度矩阵。因四类属性相似度值均在[0,1]内,故无须归一化,可得相似度矩阵S

在矩阵S

⑵计算各属性相似度的平均值与标准差。

式中,D

⑶计算各属性相似度的变异系数。该变异系数反映了指标间相对变异程度。

⑷对变异系数进行归一化处理,得到各属性相似度的权重。

从而得到最终的指标权重α、β、

③利用多属性相似度计算分值进行加工链重用

根据得到的多属性相似度值

下面结合实施例对本发明进行说明。

步骤①基于TransD模型训练向量表示

本案例使用的知识图谱主要依据零件工艺信息模型进行构建,从工艺表格或文本数据中抽取(实体,关系,实体)的知识三元组,然后构建了工艺规划知识图谱,如图5所示,图中主要包括两类关系:从属的属性关系(attribute_of),整体与部分关系(part_of),其中特征类型FT、尺寸特征SF、材料特征MC、精度特征AF四类属性与加工特征MF的关系为attribute_of,加工链PC中的加工元ME与加工特征MF的关系为part_of。在实际实施时可以根据企业内部的需求对关系的划分进行调整以拟定符合自身生产环境的工艺规划知识图谱。

基于TransD模型对工艺规划领域知识图谱的三元组进行训练。将工艺规划知识图谱中的实体与关系分别编入文件entity2id.txt、relation2id.txt,并设立每个实体、关系的唯一编号id,建立一个新文件triple.txt用以存储三元组,其中三元组中的实体和关系用编号id代替,然后使用图3所说明的TransD模型训练过程进行训练得到各实体关系的向量表示。如表1所示,有一三元组(10195,10018,10197),其中头实体为10195,其名称为外圆类,训练后的向量表示为[0.7812,0.0092,0.0673,0.0039...],其中该向量维度由训练参数决定,本案例中设置为100维,受篇幅限制对向量的后96个维度数据进行了省略;尾实体ID为10196,名称为特征F0025,训练后的向量表示为[0.7812,0.0092,0.0673,0.0039...];关系ID为10018,名称为attribute_of,训练后的向量表示为[0.1861,0.0936,0.0015,0.0736...]。

表1知识三元组数据示例

步骤②基于向量表示的多属性相似度计算

根据TransD模型训练好的向量表示,可以为待拟定加工链的加工特征各属性与知识图谱中的历史加工特征各属性进行相似度计算,其中将待加工特征视为目标加工特征,可重用的历史加工特征视为相似加工特征,分别对从属于该加工特征的特征类型FT、尺寸特征SF、材料特征MC、精度特征AF四类属性通过公式10进行相似度计算,再使用公式11对应的多属性相似度计算方法对各属性间的相似度进行赋权求和,权重的确定使用变异系数法即公式12-16进行计算,最终得到加工特征之间的相似度值。

计算示例如图6所示,图中有一待加工零件包含一个编号为F10895的通孔类特征,通过公式11计算多属性相似度,这里由变异系数法得到的权重为α=0.39,β=0.25,

步骤③利用多属性相似度计算分值进行加工链重用

通过对各相似度分值进行排序,可得到与目标加工特征最相似的历史加工特征,如图6所示,经排序得到最终与F10895最相似的历史加工特征F00931,从而实现加工链{钻孔,扩孔,铰孔}的重用。

相关技术
  • 一种基于知识图谱表示学习的加工链重用方法
  • 一种基于知识图谱表示学习的个性化推荐方法
技术分类

06120114700659