掌桥专利:专业的专利平台
掌桥专利
首页

确定事件信息的方法和装置

文献发布时间:2024-04-18 19:58:26


确定事件信息的方法和装置

技术领域

本申请涉及数据处理技术领域,尤其涉及一种确定事件信息的方法和装置。

背景技术

在电子设备研发以及出厂前都会涉及到电子设备的质量检测或者研发计划。电子设备的质量检测或者研发计划的生命周期中涉及到多种检测或者研发项目,每个项目可以看成是一个检测环节或者检测阶段。

在电子设备的检测或者研发项目对应的生命周期内,可能会存在一个或者多个需要解决的事件。预测电子设备的一个项目内可能会出现的事件的情况对于该项目的生命周期的管理决策具有重要意义。但是,项目内可能出现的事件的具体情况与电子设备的型号、种类、电子设备内的软硬件情况以及研发团队等多种因素有关,因此,如何能够确定出项目内可能出现的事件的情况是本领域技术人员需要解决的技术问题。

发明内容

一方面,本申请提供了一种确定事件信息的方法,包括:

确定待预测的目标项目的项目描述信息,所述目标项目的项目描述信息用于表征所述目标项目的属性特征信息;

获得项目知识图谱中多个历史项目各自的属性特征信息,所述历史项目的属性特征信息为基于所述历史项目的项目描述信息以及所述历史项目已发生的历史事件信息确定出的,所述历史事件信息包括历史事件序列;

基于所述目标项目的项目描述信息以及所述历史项目的属性特征信息,从所述多个历史项目中确定与所述目标项目相似的至少一个目标历史项目;

基于所述目标历史项目的历史事件序列,确定所述目标项目在未来时间段内的事件发生趋势序列。

在一种可能的实现方式中,所述目标项目的项目描述信息用于表征所述目标项目在至少一种目标属性上的属性特征信息;

所述历史项目已发生的历史事件序列通过如下方式转换为所述历史项目的属性特征信息:

确定所述历史项目已发生的历史事件序列对应的至少一种统计学特征;

基于所述至少一种统计学特征,确定所述历史项目在所述至少一种目标属性上的属性特征信息。

在又一种可能的实现方式中,所述历史事件信息还包括历史事件描述信息;

所述历史项目的历史事件描述信息通过如下方式转换为所述历史项目的属性特征信息:

基于所述历史项目的历史事件描述信息,利用经过训练的机器学习模型,确定所述历史项目在所述至少一种目标属性上的属性特征信息。

在又一种可能的实现方式中,所述基于所述目标项目的项目描述信息以及所述历史项目的属性特征信息,从所述多个历史项目中确定与所述目标项目相似的至少一个目标历史项目,包括:

基于所述目标项目的项目描述信息,在所述项目知识图谱中添加所述目标项目对应的属性特征信息;

基于所述项目知识图谱中所述目标项目的属性特征信息以及各历史项目的属性特征信息,从所述多个历史项目中确定与所述目标项目相似的至少一个目标历史项目。

在又一种可能的实现方式中,还包括:

在获得所述目标项目已发生的事件信息后,基于所述目标项目已发生的事件信息,确定所述目标项目在至少一种目标属性上的属性特征信息;

基于所述目标项目在所述至少一种目标属性上的属性特征信息,更新所述项目知识图谱中所述目标项目关联的属性特征信息。

在又一种可能的实现方式中,所述项目知识图谱中包括:多个历史项目对应的历史项目实体,所述历史项目实体的至少一种属性以及各历史项目实体的属性之间的关系,所述历史项目实体为基于所述历史项目各自的项目描述信息提取出的实体,所述历史项目实体的至少一种属性以及各历史项目实体的属性之间的关系为基于所述多个历史项目各自的项目描述信息以及历史事件信息确定出的;

所述基于所述目标项目的项目描述信息,在所述项目知识图谱中添加所述目标项目对应的属性特征信息,包括:

基于所述目标项目的项目描述信息,在所述项目知识图谱中添加所述目标项目对应的项目实体、所述目标项目的项目实体关联的至少一种属性以及所述目标项目对应的属性与各历史项目的属性之间的关系;

所述基于所述项目知识图谱中所述目标项目的属性特征信息以及各历史项目的属性特征信息,从所述多个历史项目中确定与所述目标项目相似的至少一个目标历史项目,包括:

从所述项目知识图谱中确定与所述目标项目关联的属性以及关系相似的至少一个目标历史项目。

在又一种可能的实现方式中,所述基于所述目标历史项目的历史事件序列,确定所述目标项目在未来时间段内的事件发生趋势序列,包括:

基于所述目标历史项目与所述目标项目的相似程度,确定所述目标历史项目的权重;

依据各目标历史项目的历史事件序列以及各目标历史项目对应的权重,确定所述目标项目在未来时间段内的事件发生趋势序列。

在又一种可能的实现方式中,所述历史项目的历史事件序列包括所述历史项目在多个不同时间点的事件信息;

所述基于所述目标历史项目的历史事件序列,确定所述目标项目在未来时间段内的事件发生趋势序列,包括:

基于设定的时间周期以及所述目标历史项目的历史事件序列中处于各时间周期内的事件信息,确定所述目标历史项目在至少一个时间周期内的事件特征;

基于各目标历史项目在至少一个时间周期内的事件特征,确定所述目标项目在未来至少一个时间周期内的目标事件特征。

在又一种可能的实现方式中,所述历史项目的历史事件序列包括所述历史项目在多个不同时间点的事件数量;

所述基于设定的时间周期以及所述目标历史项目的历史事件序列中处于各时间周期内的事件信息,确定所述目标历史项目在至少一个时间周期内的事件特征,包括:

基于设定的时间周期,分别对所述目标历史项目的历史时间序列中处于不同时间周期内的事件数量进行归一化,得到所述目标历史项目在不同时间周期对应的数量归一化序列;

所述基于各目标历史项目在至少一个时间周期内的事件特征,确定所述目标项目在未来至少一个时间周期内的目标事件特征,包括:

基于各目标历史项目对应不同时间周期的数量归一化序列,确定所述目标项目在未来至少一个时间周期的预测事件数量序列;

分别对所述目标项目在未来至少一个时间周期的预测事件数量序列进行反归一化,得到所述目标项目在未来至少一个时间周期的目标事件数量序列。

又一方面,本申请还提供了一种确定事件信息的装置,包括:

信息确定单元,用于确定待预测的目标项目的项目描述信息,所述目标项目的项目描述信息用于表征所述目标项目的属性特征信息;

图谱获得单元,用于获得项目知识图谱中多个历史项目各自的属性特征信息,所述历史项目的属性特征信息为基于所述历史项目的项目描述信息以及所述历史项目已发生的历史事件信息确定出的,所述历史事件信息包括历史事件序列;

目标确定单元,用于基于所述目标项目的项目描述信息以及所述历史项目的属性特征信息,从所述多个历史项目中确定与所述目标项目相似的至少一个目标历史项目;

事件预测单元,用于基于所述目标历史项目的历史事件序列,确定所述目标项目在未来时间段内的事件发生趋势序列。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1示出了本申请实施例提供的确定事件信息的方法的一种流程示意图;

图2示出了本申请实施例中确定目标项目的事件发生趋势序列的一种实现流程示意图;

图3示出了由历史项目的历史事件序列转换为属性特征信息的一种示意图;

图4示出了本申请实施例提供的确定事件信息的方法的又一种流程示意图;

图5示出了本申请实施例中确定事件信息的方法的一种实现原理示意图;

图6示出了本申请实施例中确定事件信息的装置的一种组成结构示意图;

图7示出了本申请实施例提供的电子设备的一种组成架构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

如图1,其示出了本申请实施例提供的确定事件信息的方法的一种流程示意图,本实施例的方法应用于任意电子设备,如,个人计算机,服务器,或者是云平台等系统中的设备节点等,对此不加限制。

本实施例的方法可以包括:

S101,确定待预测的目标项目的项目描述信息。

目标项目为处于研发或者出厂检测阶段的目标电子设备在质量检测过程中所涉及到的任意一个检测项目或者研发项目等,对此不加限制。其中,目标电子设备是作为本申请执行主体的该电子设备之外的其他电子设备,如,目标电子设备可以为手机、平板或者笔记本电脑终端设备,当然,还可以是工业领域中工业控制或者应用等相关的设备,对此不加限制。

其中,该目标项目的项目描述信息用于表征目标项目的属性特征信息。

在本申请中,项目描述信息至少包括项目的基础描述信息,该基础描述信息用于描述项目自身具有的属性信息,如,项目的基础描述信息可以包括:项目的名称、类型、内容以及项目对应的工作区域等,对此不加限制。

进一步的,项目的项目描述信息还可以包括项目的专业描述信息。该专业信息可以由具有经验的专家、项目管理人员等经验丰富的专业人员根据经验,结合该项目的基础描述信息针对该项目提供的描述信息。该专业描述信息可以是针对项目的基础描述信息的补充,根据实际需要可以补充多种维度的信息。如,项目的专业描述信息可以包括:项目的项目背景、项目的评价信息、项目特点、项目可能存在的常规风险问题以及项目常见的风险问题的常规解决策略等等,对此不加限制。

项目(如目标项目)的属性特征信息是指项目在设定的属性维度上表现出的特征。如,项目的属性特征信息可以包括项目的项目名称、项目类型、项目涉及到业务特征以及项目趋势特征等。当然,对于不同类型的电子设备或者存在较大区别的项目而言,不同项目的属性特征信息所涉及到的属性维度也会有所不同,具体可以根据需要划分或者设定,对此不加限制。

在本申请中,目标项目的项目描述信息可以是直接作为目标项目的属性特征信息。考虑到目标项目的项目描述信息中包含的信息多且杂,该目标项目的属性特征信息还可以是需要基于目标项目的项目描述信息进行设定的属性维度上的特征提取才能够得到的信息。

S102,获得项目知识图谱中多个历史项目各自的属性特征信息。

其中,历史项目的属性特征信息为基于历史项目的项目描述信息以及历史项目已发生的历史事件信息确定出的。与前面类似,历史项目的属性特征信息也可以包括多种属性维度上的特征,对此不加限制。

历史项目的历史事件信息至少包括:历史事件信息包括历史事件序列。历史事件序列可以包括历史项目已发生的多个事件信息。由于历史项目的多个事件信息分别对应不同的历史时间点或者历史时间周期,因此,历史项目的多个事件信息按照时间顺序构成了一个序列,即历史事件序列。事件信息可以是事件数量,也可以是具体的事件名称。

进一步的,该历史项目的历史事件信息还可以包括:历史项目的历事件描述信息。历史事件描述信息为与历史项目已发生的事件相关的描述信息,其可以仅仅包括客观描述的事件的基础信息,当然,还可以包括专家等专业人员根据经验为事件添加的参考信息或者评价信息等。如,历史项目已发生的事件对应的历史事件描述信息不仅可以包括:事件类别、目标电子设备中导致该历史事件发生的具体部件、历史事件被解决的时间等基础信息,还可以包括历史事件的专业评价信息等。

其中,历史项目的项目描述信息可以包括历史项目的基础描述信息,还可以包括历史项目的专业信息,具体如上面项目描述信息的介绍,在此不再赘述。

可以理解的是,基于历史项目的项目描述信息和事件序列信息在知识图谱中构建历史项目的属性特征信息的过程可以采用任意知识图谱构建方式,本申请对此不加限制。

可以理解的是,在知识图谱中每个节点代表一个实体,每个实体都关联各自至少一个维度属性上的属性信息,而且知识图谱还会结合实体的属性信息,构建出不同实体之间的关系。基于此,在本申请中,历史项目的属性特征信息可以包括历史项目关联的属性以及不同历史项目的属性之间的关系。

如,该项目知识图谱可以包括:多个历史项目对应的历史项目实体,各历史项目实体的至少一种属性以及各历史项目实体的属性之间的关系。其中,历史项目对应的历史项目实体为基于该历史项目的项目描述信息提取出的实体。各历史项目实体的至少一种属性以及各历史项目实体的属性之间的关系为基于多个历史项目各自的项目描述信息以及历史事件信息确定出的。

在本申请中,对于构建项目知识图谱的具体实现过程不加限制。

S103,基于该目标项目的项目描述信息以及历史项目的属性特征信息,从多个历史项目中确定与目标项目相似的至少一个目标历史项目。

本申请中,为了便于区分,将与该目标项目相似的历史项目称为目标历史项目。

其中,确定目标历史项目的方式可以有多种,如,在一种实现方式中,可以基于目标项目的项目描述信息与历史项目的属性特征信息进行特征相似度计算等,以确定出特征相似度最高或者满足设定条件的至少一个目标历史项目。

例如,目标项目的项目描述信息本身为目标项目的属性特征信息的情况下,可以直接确定项目的项目描述信息与历史项目的属性特征信息之间的相似度;如果目标项目的项目描述信息不是属性特征信息,还可以在确定出目标项目的属性特征信息后,确定目标项目的属性特征信息与历史项目的属性特征信息之间的相似度。

在又一种可能的实现方式中,考虑到项目知识图谱能够更深层次的表现出不同项目的属性之间的关联关系,在此基础上,为了能够更为准确地体现出目标项目与各历史项目之间的相似情况,本申请还可以基于目标项目的项目描述信息,在该项目知识图谱中添加该目标项目对应的属性特征信息。

其中,基于目标项目的项目描述信息在项目知识图谱中构建该目标项目对应的属性特征信息可以采用任意知识图谱构建以及扩展的相关方式,对此不加限制。

相应的,可以基于项目知识图谱中目标项目的属性特征信息以及各历史项目的属性特征信息,从该多个历史项目中确定与目标项目相似的至少一个目标历史项目。

S104,基于该目标历史项目的历史事件序列,确定目标项目在未来时间段内的事件发生趋势序列。

可以理解的是,基于相似的目标历史项目的历史时间序列,预测该目标项目的事件发生趋势序列的具体实现方式可以有多种可能,本申请对此不加限制。

如,可以结合各目标历史项目的历史事件序列,确定包含多个不同时间点上事件信息的综合事件序列,将综合事件序列中各事件信息分别确定为未来时间段内多个时间点上的事件趋势信息,得到包含不同未来不同时间点对应的事件趋势信息的事件发生趋势序列。

又如,可以基于目标历史项目与目标项目的相似程度,确定各目标历史项目的权重。依据各目标历史项目的历史事件序列以及各目标历史项目对应的权重,确定该目标项目在未来时间段内的事件发生趋势序列。

当然,还可以有其他确定事件发生趋势序列的方式,对此不加限制。

由以上内容可知,在本申请中预先结合各历史项目的项目描述信息以及历史项目已发生的历史事件序列等历史事件信息构建出项目知识图谱,通过项目知识图谱可以更为直观且深层次的反映出各个历史项目的属性特征信息。在此基础上,本申请基于待预测的目标项目的项目描述信息以及项目知识图谱中各历史项目的属性特征信息,能够更为准确地确定出在项目描述信息以及可能发生的事件上与该目标项目相似的至少一个目标历史项目信息,从而基于该目标历史项目信息的历史事件序列,能够更为准确地确定出目标项目在未来时间中的事件发生趋势情况。

在本申请中,如前面所述确定目标项目在未来时间段内的事件发生趋势序列的具体实现有多种可能。

在一种可能的实现方式中,历史项目的历史事件序列包括该历史项目在多个不同时间点的事件信息。在该种情况下,考虑到不同时间点发生的事件可能存在波动性,而且一个项目目前都是按照设定的时间周期做计划的,基于此,本申请还可以针对每个目标历史项目,基于设定的时间周期以及该目标历史项目的历史事件序列中处于各时间周期内的事件信息,确定该目标历史项目在至少一个时间周期内的事件特征。

其中,时间周期的长度可以根据需要设定,如,时间周期可以为一周,对此不加限制。

对于每个历史项目而言,一个时间周期内的事件特征可以是该目标历史项目在该时间周期内不同时间点的事件信息的归一化,也可以是,该时间周期内各事件信息的平均值、或者变化趋势特征等,对此不加限制。

相应的,基于各目标历史项目在至少一个时间周期内的事件特征,确定目标项目在未来至少一个时间周期内的目标事件特征。

下面以的事件特征的一种可能情况为例,对本申请中确定目标项目在未来时间段内的事件发生趋势序列的过程进行说明。如图2所示,其示出了本申请实施例中确定目标项目的事件发生趋势序列的一种实现流程示意图。

在本实施例中以历史项目的历史事件序列包括所述历史项目在多个不同时间点的事件数量为例说明。如,以天为最小单位统计事件发生数量为例,那么历史项目的历史时间序列可以包括历史上多天已发生的事件数量。

本实施例的流程可以包括:

S201,基于设定的时间周期,分别对目标历史项目的历史时间序列中处于不同时间周期内的事件数量进行归一化,得到目标历史项目在不同时间周期对应的数量归一化序列。

可以理解的是,由于目标历史项目的历史时间序列的时间长度可以覆盖多个时间周期,因此,对于每个时间周期而言,该时间周期内不同时间点上的事件数量实际上组成的一个序列,该序列为历史时间序列的子序列。相应的,对时间周期内的事件数量进行归一化是指对对应时间点属于该时间周期内的各事件数量分别进行归一化,从而得到一个该时间周期对应的归一化后的事件数量序列。

为了便于区分,将时间周期内各事件数量归一化后得到的序列称为数量归一化序列。相应的,目标历史项目在一个时间周期内的数量归一化序列可以包括:该时间周期内多个不同时间点上的事件数量的归一化值。

如,以天为最小统计单位为例,对于目标项目在第j个时间周期内第i天的事件数量x

其中,x

可以理解的是,通过对各时间周期内的事件数量进行归一化,可以减少数据量级不同而对后续预测的影响。

S202,基于各目标历史项目对应不同时间周期的数量归一化序列,确定目标项目在未来至少一个时间周期的预测事件数量序列。

其中,目标项目在未来一个时间周期内的预测事件数量序列可以包括:多个预测事件数量,该多个预测事件数量为未来该时间周期内的不同时间点上对应的预测事件数量。

可以理解的是,目标历史项目对应的时间周期属于当前时刻之前的历史时间周期,在此基础上,可以按照目标历史项目对应的多个时间周期的先后顺序,将不同时间周期对应的各目标历史项目的数量归一化序列分别用于预测目标项目来未来不同时间周期内的预测事件数量序列。

如,可以采用历史上第1个时间周期各目标历史项目对应的数量归一化序列确定目标项目在未来第1个时间周期内的预测事件数量序列,相应的,利用历史上第2个时间周期内各目标历史项目对应的数量归一化序列,确定目标项目在未来第2个时间周期内的预测事件数量序列,依此类推。

相应的,在实际应用中,对于未来任意一个时间周期内的某个时间点而言,可以通过对历史上相应顺序上的时间周期内相应位置上的时间点的事件数量的归一化值进行求取平均值等方式,来确定未来该事件周期内目标项目在该时间点的事件数量。

进一步的,如前面所述,本申请还可以预先确定出各目标历史项目的权重。

如,可以将目标历史项目与该目标项目的相似度确定为目标历史项目的权重。进一步的,考虑到相似度的数量级别可能存在差距,本申请还可以对各个目标历史项目对应的相似度进行归一化,将目标历史项目对应的归一化后的相似度确定为该目标历史项目的权重。通过对相似度进行归一化,可以使得归一化得到的各个权重均处于[0,1]区间内。

当然,对于通过其他方式确定各目标历史项目的权重也同样适用于本申请,对此不加限制。

相应的,可以依据各目标历史项目对应的权重以及各目标历史项目对应不同时间周期的数量归一化序列,确定目标项目在未来至少一个时间周期的预测事件数量序列。

如,假设利用历史上某个时间周期内某一天N个目标历史项目对应的N个事件数量的归一化值(q

Θ

其中,q

S203,分别对目标项目在未来至少一个时间周期的预测事件数量序列进行反归一化,得到目标项目在未来至少一个时间周期的目标事件数量序列。

其中,对未来一个时间周期内的预测事件数量序列进行反归一化是指对该时间周期内的预测事件数量序列中各个预测事件数量进行反归一化。相应的,未来一个时间周期内的目标事件数量序列包括该时间周期中对应的不同时间点上的预测事件数量的反归一化值。

如,假设目标项目在未来一个时间周期内的目标事件数量序列表示为Ψ

Θ′

其中,Θ

可以理解的是,待预测的目标项目一般为新出现的项目或者是执行时间较短的项目,因此,目标项目都不存在关联的已发生的事件信息或者存在较少的事件信息。基于此,为了能够准确地确定历史项目在可能发生的事件上也与该目标项目存在相似性,在本申请中,对于任意一个历史项目,将历史项目已发生的历史时间序列转换为该历史项目的属性特征信息时,可以是先该确定历史项目已发生的历史事件序列对应的至少一种统计学特征。然后,再基于该至少一种统计学特征,确定该历史项目在至少一种目标属性上的属性特征信息。

其中,至少一种目标属性信息为该目标项目的项目描述信息表征出的属性特征信息所对应的至少一种目标属性。也就是说,项目的项目描述信息能够表征出该项目在至少一种目标属性上的属性特征信息。

基于此,本申请会将历史项目的历史事件序列对应的统计学特征映射到能够通过项目的项目描述信息表征出的各目标属性的属性特征信息上,从而使得一些新的目标项目也能够利用已知的项目描述信息,从多个历史项目中确定出与该目标项目相似的目标历史项目,使得目标历史项目已发生的历史事件序列能够反映出该目标项目的事件发生趋势,从而可以准确预测目标项目的事件发生情况。

其中,历史项目已发生的历史事件序列对应的至少一种统计学特征可以历史事件序列中各历史事件的均值、方差、最大值、极值、斜率、频率、随机噪声等统计学特征的部分或者全部。

在本申请中,可以预先构建不同统计学特征的取值范围与设定的至少一种目标属性的属性特征之间的转换关系,基于转换关系将统计学特征转换为至少一种目标属性上的属性特征信息。

如图3所示,在确定出历史项目已发生的历史事件序列对应的至少一种统计学特征(如图3中时间序列特征部分所示)之后,可以按照设定的转换关系,确定出该历史项目在能够通过项目描述信息表征出的业务特征、业务背景或者是专家知识等设定的属性维度上的属性特征信息,从而将历史事件序列转换为可能与待预测的目标项目具有的属性维度进行匹配的相关属性特征信息。

举例说明,如果某个历史项目的统计学特征表明该项目已发生事件的事件数量均值属于设定的较高水平,且事件数量呈现上升趋势,斜率较大。基于此,可以确定出该项目属于非初代项目,项目事件发生类型属于高事件发生项目等。

当然,在实际应用中,本申请还可以通过预先通过有监督或者无监督的方式训练网络模型或者大语言识别模型,利用模型确定出历史事件序列的统计学特征对应到至少一种目标属性维度上的属性特征信息,对此不加限制。

进一步的,如果历史项目的历史事件信息还包括历史事件描述信息,本申请可以基于该历史项目的历史事件描述信息,利用经过训练的机器学习模型,确定该历史项目在该至少一种目标属性上的属性特征信息。

其中,该机器学习模型可以采用有监督或者无监督的方式训练得到的,对此不加限制。

如,机器学习模型为能够实现不同属性的分类模型,将历史项目的历史事件描述信息输入到该机器学习模型后便可以输出该历史项目对应在某一种或者多种目标属性上的属性特征信息。

可以理解的是,为了能够更为准确地匹配出与目标项目相似的目标历史项目,本申请还可以将目标项目也添加到项目知识图谱后,再基于项目知识图谱确定与目标项目相似的历史项目。下面针对该种情况结合一种具体实现对本申请确定事件信息的方法进行介绍。

如图4所示,其示出了本申请实施例中确定事件信息的方法的又一种流程示意图,本实施例的方法可以包括:

S401,确定待预测的目标项目的项目描述信息。

如,目标项目的项目描述信息可以包括目标项目的项目名称、类别、项目内容以及负责人等能够反映目标项目的属性特征的基础描述信息。当然,该目标项目的项目描述信息还可以包括专业人员补充的目标项目的项目背景、项目特征以及项目评价信息等专业信息。

S402,获得项目知识图谱。

该项目知识图谱为预先基于多个历史项目的项目描述信息和历史事件信息构建出的知识图谱。

其中,该项目知识图谱中包括:多个历史项目对应的历史项目实体,每个历史项目实体的至少一种属性以及各历史项目实体的属性之间的关系。

其中,历史项目实体为基于历史项目各自的项目描述信息提取出的实体,历史项目实体的至少一种属性以及各历史项目实体的属性之间的关系为基于多个历史项目各自的项目描述信息以及历史事件信息确定出的。

在本申请中,构建项目知识图谱可以与常规知识图谱构建的过程相似。

为了便于理解,下面结合图5对本申请中构建项目知识图谱的过程进行简单介绍。

在图5中,以历史项目的项目数据包括历史项目的专业信息、基础描述信息以及历史事件信息为例说明。

结合图5,对该项目知识图谱的构建过程进行简单介绍,该过程可以如下:

首先,构建待分析的行业领域的本体层。

本体层包括本体,本体属性和本体关系。其中,本体是指知识图谱中所涉及到的实体的类别,即抽象出的实体的类,如,本体可以包括项目、软件以及硬件等实体类别。本体属性是指本体能够具有的属性类别。本体关系是指本体的不同属性类别之间能够关联的关系。

本体层可以根据实际需要设定,对此不加限制。

其次,基于本体所涉及到的实体类别和本体属性,从项目的项目描述信息和专业信息中抽取实体(如历史项目对应的历史项目实体)和实体对应的实体属性,建立实体之间的关系。

如图5,抽取实体和实体属性本质上就是通过知识表示将项目描述信息转换为知识图谱中的实体和实体属性。类似的,对于非结构化的专业信息通过知识抽取,提取出实体和实体属性后,最终可以转换为知识图谱中相应的知识表示。基于此可以基于历史项目的项目描述信息和专业信息,在知识图谱中表示出历史项目对应的历史项目实体以及属性。

在构建历史项目实体的实体关系时,可以继承前面本体以及本体之间的关系,也就是说,如果不同历史项目实体归属的本体或者关联的本体属性之间具有关联关系,便可以建立相应历史项目实体及其相应属性之间的关系,以最终完成知识图谱的构建。

再次,基于本体所涉及到的实体类别和本体属性,将历史项目的历史事件信息进行属性特征提取或者转换,生成知识图谱中相应的知识表示。

该步骤实际上是将历史项目的历史事件描述信息和历史事件序列分别进行处理,以生成知识图谱中相应的历史项目实体的属性特征信息,具体过程可以参见前面的相关介绍,在此不再赘述。

最后,对历史项目的历史项目实体和属性进行不一致检验。

如图5所示,在知识表示后还需要实体对齐。

具体的,可以预先建立实体标准命名表,该表中包括标准化的实体名称,当然,还可以包括标准化的实体属性名称。在此基础上,可以遍历该实体标准命名表,以检测各历史项目的历史项目实体和属性是否存在与实体标准命名表中的实体或实体属性不一致的历史项目实体或者实体属性,并针对存在有误的历史项目实体或者实体属性进行修改。

当然,在构建实体关系之后,还可以由专业人员对知识图谱中各个历史项目实体、属性以及关系等进行调整,以使得知识图谱能够更准确地反映历史项目之间的关系。如图5中实体对齐之后还需要质量评估,才可以得到最终的项目知识图谱。

可以理解的是,随着项目的推进,有些项目可能会出现一些新增的事件,如,一些历史项目原本也可能没有历史事件信息,或者是虽然历史项目原本存在历史事件信息,但是由于历史项目仍未结束,历史项目仍会出现一些新增的事件,使得历史项目存在一些新增的事件信息。

如图5所示,在历史项目存在新增的事件信息的情况下,本申请还会利用历史项目新出现的事件信息更新知识图谱。基于新出现的事件信息更新知识图谱可以是基于新出现的事件信息确定历史项目在至少一种目标属性上的属性特征信息,基于当前确定出的属性特征信息向知识图谱中新增该历史项目的属性特征信息,或者是,调整或删除属性特征信息,对此不加限制。

当然,如果历史项目不存在新增的事件信息,本申请还可以由专业人员根据经验,结合历史项目当前的进程等调整知识图谱中与该目标项目相关的属性以及关系等,具体过程不加限制。

S403,基于目标项目的项目描述信息,在该项目知识图谱中添加目标项目对应的项目实体、目标项目的项目实体关联的至少一种属性以及目标项目对应的属性与各历史项目的属性之间的关系。

在本申请中,基于目标项目的项目描述信息,在项目知识图谱中添加该目标项目的项目实体、属性以及关系可以采用知识图谱中知识表示的相关技术实现,具体与上面抽取基于历史项目的项目描述信息抽取历史项目的项目实体,属性以及构建关系的过程相似,在此不再赘述。

S404,从项目知识图谱中确定与目标项目关联的属性以及关系相似的至少一个目标历史项目。

如,在一种可能的实现方式中,可以先确定项目知识图谱中与目标项目的项目实体具有关系的历史项目集,该历史项目集包括至少一个历史项目。

针对项目知识图谱中目标项目和历史项目集中的历史项目具有的任意一种属性,分别确定历史项目集中每个历史项目中在该属性上的属性特征对应的属性向量,以及该目标项目在该属性上的属性特征对应的属性向量。

在此基础上,对于历史项目集中每个历史项目,基于目标项目与该历史项目集中在多个属性的属性向量之间的相似度,确定该目标项目与该历史项目之间的相似度。

其中,属性向量之间的相似度可以采用任意向量之间相似度的计算方式。

例如,假设目标项目A和历史项目B分别有n个属性的属性值,对于第t个属性,该目标项目A在第t个属性上的属性向量表示A

当然,以上仅仅是一种情况为例说明,在实际应用中,基于目标项目和历史项目在项目知识图谱中的属性以及关系,确定二者相似度的方式还可以有其他可能,对此不加限制。

在确定出目标项目与历史项目集中各历史项目的相似度之后,本申请可以选取与该目标项目的相似度最高的前设定数量个历史项目作为候选历史项目,得到包括至少一个候选历史项目的候选历史项目集。如图5,基于知识图谱可以得到候选历史项目集。

在实际应用中,候选历史项目集中的候选历史项目可以直接作为目标历史项目。

在一种可选方式中,为了避免一些明显与目标项目存在较大区别的历史项目被筛选为目标历史项目,本申请还可以预先设定一些筛选规则。如图5,本申请还可以将不符合筛选规则的候选历史项目去除,得到将剩余的各候选历史项目确定为目标历史项目,以用于对目标项目的事件发生趋势进行预测。

S405,基于目标历史项目的历史事件序列,确定目标项目在未来时间段内的事件发生趋势序列。

该步骤可以参见前面图1以及图2实施例的相关介绍,在此不再赘述。

可以理解的是,与前面更新知识图谱中历史项目相关的属性和关系类似。在该项目知识图谱中添加目标项目对应的项目实体、属性以及相应的关系之后,如果目标项目存在已发生的事件,在获得所述目标项目已发生的事件信息后,同样可以基于该目标项目已发生的事件信息,确定该目标项目在至少一种目标属性上的属性特征信息。

如,目标项目已发生的事件信息可以包括目标项目已发生的事件序列以及事件描述信息。在此基础上,可以基于事件描述信息以及已训练的机器学习模型,确定该目标项目在前面提到的至少一种目标属性上的属性特征信息。基于该目标项目的事件序列,可以确定出该事件序列的统计学特征,基于事件序列的统计学特征确定目标项目在至少一种目标属性上的属性特征信息。具体过程与前面基于历史项目的历史事件信息确定属性特征信息的过程相似,在此不再赘述。

相应的,基于该目标项目在至少一种目标属性上的属性特征信息,可以更新项目知识图谱中该目标项目关联的属性特征信息。

如,如果基于目标项目的事件信息确定出的属性特征信息属于该目标项目在项目知识图谱中不具有的属性特征信息,则可以基于最新确定的属性特征信息,向项目知识图谱中新增该目标项目的属性特征以及关系等。

如果基于目标项目的事件信息确定出的属性特征信息表征项目知识图谱中该目标项目关联的一些属性的属性特征存在变化,则更新相应的属性以及相关关系。

对应本申请实施例提供的确定事件信息的方法,本申请还提供了一种确定事件信息的装置。

如图6所示,其示出了本申请实施例中确定事件信息的装置的一种组成结构示意图,本实施例的装置可以包括:

信息确定单元601,用于确定待预测的目标项目的项目描述信息,所述目标项目的项目描述信息用于表征所述目标项目的属性特征信息;

图谱获得单元602,用于获得项目知识图谱中多个历史项目各自的属性特征信息,所述历史项目的属性特征信息为基于所述历史项目的项目描述信息以及所述历史项目已发生的历史事件信息确定出的,所述历史事件信息包括历史事件序列;

目标确定单元603,用于基于所述目标项目的项目描述信息以及所述历史项目的属性特征信息,从所述多个历史项目中确定与所述目标项目相似的至少一个目标历史项目;

事件预测单元604,用于基于所述目标历史项目的历史事件序列,确定所述目标项目在未来时间段内的事件发生趋势序列。

在一种可能的实现方式中,该信息确定单元确定的该目标项目的项目描述信息用于表征所述目标项目在至少一种目标属性上的属性特征信息;

该图谱获得单元获得的所述历史项目的属性特征信息包括:所述历史项目已发生的历史事件序列通过如下方式转换得到的属性特征信息:

确定所述历史项目已发生的历史事件序列对应的至少一种统计学特征;

基于所述至少一种统计学特征,确定所述历史项目在所述至少一种目标属性上的属性特征信息。

进一步的,该图谱获得单元获得的所述历史项目的历史事件信息还包括历史事件描述信息;

该图谱获得单元获得的所述历史项目的属性特征信息包括:由历史项目的历史事件描述信息通过如下方式转换得到的属性特征信息:

基于所述历史项目的历史事件描述信息,利用经过训练的机器学习模型,确定所述历史项目在所述至少一种目标属性上的属性特征信息。

在又一种可能的实现方式中,该目标确定单元,包括:

项目添加子单元,用于基于所述目标项目的项目描述信息,在所述项目知识图谱中添加所述目标项目对应的属性特征信息;

目标确定子单元,用于基于所述项目知识图谱中所述目标项目的属性特征信息以及各历史项目的属性特征信息,从所述多个历史项目中确定与所述目标项目相似的至少一个目标历史项目。

在又一种可能的实现方式中,该装置还包括:

属性确定单元,用于在获得所述目标项目已发生的事件信息后,基于所述目标项目已发生的事件信息,确定所述目标项目在至少一种目标属性上的属性特征信息;

图谱更新单元,用于基于所述目标项目在所述至少一种目标属性上的属性特征信息,更新所述项目知识图谱中所述目标项目关联的属性特征信息。

在又一种可能的实现方式中,该图谱获得单元获得的项目知识图谱中包括:多个历史项目对应的历史项目实体,所述历史项目实体的至少一种属性以及各历史项目实体的属性之间的关系,所述历史项目实体为基于所述历史项目各自的项目描述信息提取出的实体,所述历史项目实体的至少一种属性以及各历史项目实体的属性之间的关系为基于所述多个历史项目各自的项目描述信息以及历史事件信息确定出的;

该项目添加子单元,包括:

知识表示子单元,用于基于所述目标项目的项目描述信息,在所述项目知识图谱中添加所述目标项目对应的项目实体、所述目标项目的项目实体关联的至少一种属性以及所述目标项目对应的属性与各历史项目的属性之间的关系;

该目标确定子单元具体为,用于从所述项目知识图谱中确定与所述目标项目关联的属性以及关系相似的至少一个目标历史项目。

在又一种可能的实现方式中,该事件预测单元,包括:

权重确定单元,用于基于所述目标历史项目与所述目标项目的相似程度,确定所述目标历史项目的权重;

序列预测单元,用于依据各目标历史项目的历史事件序列以及各目标历史项目对应的权重,确定所述目标项目在未来时间段内的事件发生趋势序列。

在又一种可能的实现方式中,该历史项目的历史事件序列包括历史项目在多个不同时间点的事件信息;

该事件预测单元,包括:

特征确定子单元,用于基于设定的时间周期以及所述目标历史项目的历史事件序列中处于各时间周期内的事件信息,确定所述目标历史项目在至少一个时间周期内的事件特征;

事件预测子单元,用于基于各目标历史项目在至少一个时间周期内的事件特征,确定所述目标项目在未来至少一个时间周期内的目标事件特征。

在又一种可能的实现方式中,该历史项目的历史事件序列包括所述历史项目在多个不同时间点的事件数量;

该特征确定子单元具体为,用于基于设定的时间周期,分别对所述目标历史项目的历史时间序列中处于不同时间周期内的事件数量进行归一化,得到所述目标历史项目在不同时间周期对应的数量归一化序列;

该事件预测子单元,包括:

序列预测子单元,用于基于各目标历史项目对应不同时间周期的数量归一化序列,确定所述目标项目在未来至少一个时间周期的预测事件数量序列;

反归一化单元,用于分别对所述目标项目在未来至少一个时间周期的预测事件数量序列进行反归一化,得到所述目标项目在未来至少一个时间周期的目标事件数量序列。

又一方面,本申请还提供了一种电子设备,如图7所示,其示出了该电子设备的一种组成结构示意图,该电子设备可以为任意类型的电子设备,该电子设备至少包括处理器701和存储器702;

其中,处理器701用于执行如上任意一个实施例中的确定事件信息的方法。

该存储器702用于存储处理器执行操作所需的程序。

可以理解的是,该电子设备还可以包括显示单元703以及输入单元704。

当然,该电子设备还可以具有比图7更多或者更少的部件,对此不加限制。

另一方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上任意一个实施例所述的确定事件信息的方法。

本申请还提出了一种计算机程序,该计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机程序在电子设备上运行时,用于执行如上任意一个实施例中的确定事件信息的方法。

可以理解的是,在本申请中,说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的部分,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示的以外的顺序实施。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。同时,本说明书中各实施例中记载的特征可以相互替换或者组合,使本领域专业技术人员能够实现或使用本申请。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

相关技术
  • 信息推荐方法、情感倾向确定方法及装置和电子设备
  • 分布信息的确定方法、无人飞行器的控制方法及装置
  • 一种信息确定方法及装置
  • 用户关注信息确定方法、装置、穿戴式设备及存储介质
  • 用于确定相似度信息的装置、用于确定相似度信息的方法、用于确定自相关信息的装置、用于确定互相关信息的装置以及计算机程序
  • 一种周期性事件信息确定方法及装置
技术分类

06120116490102