导航：首页> 机床；其他类目中不包括的金属加工>理赔文件的标签生成方法、装置、设备及介质

理赔文件的标签生成方法、装置、设备及介质

文献发布时间：2024-04-18 19:59:31

技术领域

本申请适用于保险服务技术领域，尤其涉及一种理赔文件的标签生成方法、装置、设备及介质。

背景技术

随着保险业务的发展，理赔服务需要与时俱进，保险行业为了降低潜在损失，在核保、理赔等业务中需要进行严格的风险管控。目前，业务的风险管控一般使用人工进行信息核对、内容审核等过程，但人工作业工作效率较低，且无法保证稳定的、统一的风险管控能力。

现有面对大量的理赔案件时，可以考虑通过人工智能的技术，综合利用历史上积累的大数据和专家经验，构建智能理赔服务，辅助人工决策甚至自动决策替代人工理赔审核作业，从而智能化地降低业务风险，减少人工成本，提升风险管控响应效率，提高业务风险管控能力。然而，由于理赔案件中涉及的信息较多且广，信息复杂程度较大，现有的人工智能技术不能够有效地学习各个信息之间的关系，也就导致最终的判别可能存在误差，进而对业务造成损失。因此，如何有效地利用信息之间的交叉关系，来提高决策的准确性成为亟待解决的问题。

发明内容

有鉴于此，本申请实施例提供了一种理赔文件的标签生成方法、装置、设备及介质，以解决如何有效地利用信息之间的交叉关系，来提高决策的准确性成为亟待解决的问题。

第一方面，本申请实施例提供一种理赔文件的标签生成方法，所述标签生成方法包括：

获取目标理赔文件所属的用户的身份信息、所述用户的保险信息以及所述目标理赔文件的文件内容，基于所述身份信息构建身份特征向量，基于所述保险信息构建保险特征向量，基于所述文件内容构建文件特征向量；

根据所述身份特征向量、所述保险特征向量和所述文件特征向量，计算每个向量对应的k阶的交叉特征向量，将所有的k阶的交叉特征向量排列为一维的矩阵序列，其中，k为大于1的整数；

针对任一矩阵序列，基于自注意力机制对所述矩阵序列进行线性变换，得到形状相同的查询矩阵、键矩阵和值矩阵；

基于所述查询矩阵和所述键矩阵，得到自注意力矩阵，将所述自注意力矩阵与所述值矩阵相乘，确定相乘结果为对应阶的隐式交叉特征，对所有阶的隐式交叉特征进行求和，得到求和结果；

获取预设的标签与划分范围的映射表，确定所述求和结果在所述划分范围中所处的目标位置，从所述映射表中确定所述目标位置对应的标签为所述目标理赔文件的标签。

在一实施方式中，基于所述身份信息构建身份特征向量，基于所述保险信息构建保险特征向量，基于所述文件内容构建文件特征向量包括：

使用第一编码器对所述身份信息进行向量编码，得到第一编码结果，确定第一编码结果为身份特征向量；

使用第二编码器对所述保单信息进行向量编码，得到第二编码结果，确定第二编码结果为保单特征向量；

使用第三编码器对所述文件内容进行向量编码，得到第三编码结果，确定第三编码结果为文件特征向量。

在一实施方式中，根据所述身份特征向量、所述保险特征向量和所述文件特征向量，计算每个向量对应的k阶的交叉特征向量包括：

将所述身份特征向量的k-1阶的交叉特征向量分别与所述保险特征向量和所述文件特征向量进行对位相乘，确定两个相乘结果的和为所述身份特征向量的k阶的交叉特征向量；

将所述保险特征向量的k-1阶的交叉特征向量分别与所述身份特征向量和所述文件特征向量进行对位相乘，确定两个相乘结果的和为所述保险特征向量的k阶的交叉特征向量；

将所述文件特征向量的k-1阶的交叉特征向量分别与所述身份特征向量和所述保险特征向量进行对位相乘，确定两个相乘结果的和为所述文件特征向量的k阶的交叉特征向量。

在一实施方式中，基于所述查询矩阵和所述键矩阵，得到自注意力矩阵包括：

使用矩阵乘法对所述查询矩阵和所述键矩阵进行相乘运算，得到乘积矩阵；

对所述乘积矩阵进行归一化，得到归一化后的乘积矩阵，确定所述归一化后的乘积矩阵为自注意力矩阵。

在一实施方式中，确定所述求和结果在所述划分范围中所处的目标位置包括：

对所述身份特征向量、所述保险特征向量和所述文件特征向量形成的融合向量进行因子分解，得到一阶特征值和零阶特征值；

将所述零阶特征值、所述一阶特征值和所述求和结果进行相加运算，得到相加结果；

确定所述相加结果在所述划分范围中所处的目标位置为所述求和结果在所述划分范围中所处的目标位置。

在一实施方式中，在从所述映射表中确定所述目标位置对应的标签为所述目标理赔文件的标签之后，还包括：

根据所述目标理赔文件的标签，生成理赔结果，输出所述理赔结果和所述目标理赔文件。

第二方面，本申请实施例提供一种理赔文件的标签生成装置，所述标签生成装置包括：

信息获取模块，用于获取目标理赔文件所属的用户的身份信息、所述用户的保险信息以及所述目标理赔文件的文件内容，基于所述身份信息构建身份特征向量，基于所述保险信息构建保险特征向量，基于所述文件内容构建文件特征向量；

交叉特征计算模块，用于根据所述身份特征向量、所述保险特征向量和所述文件特征向量，计算每个向量对应的k阶的交叉特征向量，将所有的k阶的交叉特征向量排列为一维的矩阵序列，其中，k为大于1的整数；

矩阵变换模块，用于针对任一矩阵序列，基于自注意力机制对所述矩阵序列进行线性变换，得到形状相同的查询矩阵、键矩阵和值矩阵；

隐式交叉计算模块，用于基于所述查询矩阵和所述键矩阵，得到自注意力矩阵，将所述自注意力矩阵与所述值矩阵相乘，确定相乘结果为对应阶的隐式交叉特征，对所有阶的隐式交叉特征进行求和，得到求和结果；

标签生成模块，用于获取预设的标签与划分范围的映射表，确定所述求和结果在所述划分范围中所处的目标位置，从所述映射表中确定所述目标位置对应的标签为所述目标理赔文件的标签。

在一实施方式中，所述信息获取模块包括：

第一编码单元，用于使用第一编码器对所述身份信息进行向量编码，得到第一编码结果，确定第一编码结果为身份特征向量；

第二编码单元，用于使用第二编码器对所述保单信息进行向量编码，得到第二编码结果，确定第二编码结果为保单特征向量；

第三编码单元，用于使用第三编码器对所述文件内容进行向量编码，得到第三编码结果，确定第三编码结果为文件特征向量。

在一实施方式中，所述交叉特征计算模块包括：

第一交叉特征计算单元，用于将所述身份特征向量的k-1阶的交叉特征向量分别与所述保险特征向量和所述文件特征向量进行对位相乘，确定两个相乘结果的和为所述身份特征向量的k阶的交叉特征向量；

第二交叉特征计算单元，用于将所述保险特征向量的k-1阶的交叉特征向量分别与所述身份特征向量和所述文件特征向量进行对位相乘，确定两个相乘结果的和为所述保险特征向量的k阶的交叉特征向量；

第三交叉特征计算单元，用于将所述文件特征向量的k-1阶的交叉特征向量分别与所述身份特征向量和所述保险特征向量进行对位相乘，确定两个相乘结果的和为所述文件特征向量的k阶的交叉特征向量。

在一实施方式中，所述隐式交叉计算模块包括：

相乘运算单元，用于使用矩阵乘法对所述查询矩阵和所述键矩阵进行相乘运算，得到乘积矩阵；

归一化单元，用于对所述乘积矩阵进行归一化，得到归一化后的乘积矩阵，确定所述归一化后的乘积矩阵为自注意力矩阵。

在一实施方式中，所述标签生成模块包括：

其余特征计算单元，用于对所述身份特征向量、所述保险特征向量和所述文件特征向量形成的融合向量进行因子分解，得到一阶特征值和零阶特征值；

特征值计算单元，用于将所述零阶特征值、所述一阶特征值和所述求和结果进行相加运算，得到相加结果；

目标位置确定单元，用于确定所述相加结果在所述划分范围中所处的目标位置为所述求和结果在所述划分范围中所处的目标位置。

在一实施方式中，所述标签生成装置还包括：

理赔结果输出模块，用于在从所述映射表中确定所述目标位置对应的标签为所述目标理赔文件的标签之后，根据所述目标理赔文件的标签，生成理赔结果，输出所述理赔结果和所述目标理赔文件。

第三方面，本申请实施例提供一种计算机设备，所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的标签生成方法。

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的标签生成方法。

本申请实施例与现有技术相比存在的有益效果是：本申请基于目标理赔文件所属的用户的身份信息构建身份特征向量，基于用户的保险信息构建保险特征向量，基于目标理赔文件的文件内容构建文件特征向量，根据身份特征向量、保险特征向量和文件特征向量，计算每个向量对应的k阶的交叉特征向量，将所有的k阶的交叉特征向量排列为一维的矩阵序列，针对任一矩阵序列，基于自注意力机制对矩阵序列进行线性变换，得到形状相同的查询矩阵、键矩阵和值矩阵，基于查询矩阵和键矩阵，得到自注意力矩阵，将自注意力矩阵与值矩阵相乘，确定相乘结果为对应阶的隐式交叉特征，对所有阶的隐式交叉特征进行求和，得到求和结果，获取预设的标签与划分范围的映射表，确定求和结果在划分范围中所处的目标位置，从映射表中确定目标位置对应的标签为目标理赔文件的标签，标签标志着对目标理赔文件的判断结果，通过对理赔文件的交叉信息的处理来实现判别，有效地处理了复杂信息之间的交叉，有助于提高判别结果的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例一提供的一种理赔文件的标签生成方法的一应用环境示意图；

图2是本申请实施例二提供的一种理赔文件的标签生成方法的流程示意图；

图3是本申请实施例三提供的一种理赔文件的标签生成方法的流程示意图；

图4是本申请实施例四提供的一种理赔文件的标签生成装置的结构示意图；

图5是本申请实施例五提供的一种计算机设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

应理解，以下实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

为了说明本申请的技术方案，下面通过具体实施例来进行说明。

本申请实施例一提供的一种理赔文件的标签生成方法，可应用在如图1的应用环境中，其中，客户端与服务端进行通信。其中，客户端包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本、云端计算机设备、个人数字助理(personal digital assistant，PDA)等计算机设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

参见图2，是本申请实施例二提供的一种理赔文件的标签生成方法的流程示意图，上述理赔文件的标签生成方法应用于图1中的服务端，服务端对应的计算机设备连接相应的数据库，以获取数据库中相应的数据。上述计算机设备还可以连接相应的客户端，客户端为用户所操作，用户可以通过客户端向服务端提供相应的目标理赔文件。如图2所示，该理赔文件的标签生成方法可以包括以下步骤：

步骤S201，获取目标理赔文件所属的用户的身份信息、用户的保险信息以及目标理赔文件的文件内容，基于身份信息构建身份特征向量，基于保险信息构建保险特征向量，基于文件内容构建文件特征向量。

本申请中，目标理赔文件可以是指任一需要进行判别(即标签生成)的文件，该文件为用户上报的需要进行理赔操作的文件，文件内包括本次理赔的疾病信息、治疗信息、就诊医院信息等，用户可以通过客户端将该目标理赔文件上传，从而用于后续步骤的执行，当然，用户上传后的文件可以存储与相应的数据库，执行本申请的方法的服务端可以从数据库中调用该目标理赔文件。

身份信息可以是指标识用户身份的信息，例如，用户的性别、职业、所在地、出生年份等，保险信息可以是指用户名下所购买的保险的信息，例如，保险的险种等。这部分信息为用户的私人信息，服务端可以从相应的数据库中通过用户的标识来匹配到对应的信息。

针对身份信息而言，可以根据身份信息的一些特征，将身份信息转换为特征向量进行表示，有助于后续的计算机运算，同样地，保险信息和文件内容可以进行上述操作，最终得到的向量能够很好地表达信息的特征。具体地，可以根据每个信息中的信息量来确定对应向量中元素行和列的数量。

可选的是，基于身份信息构建身份特征向量，基于保险信息构建保险特征向量，基于文件内容构建文件特征向量包括：

使用第一编码器对身份信息进行向量编码，得到第一编码结果，确定第一编码结果为身份特征向量；

使用第二编码器对保单信息进行向量编码，得到第二编码结果，确定第二编码结果为保单特征向量；

使用第三编码器对文件内容进行向量编码，得到第三编码结果，确定第三编码结果为文件特征向量。

其中，在构建特征向量时，可以采用编码器编码的方式，对每个信息进行编码操作，由于身份信息、保单信息和文件内容这三者的构成因子不相同，因而不能够采用相同的编码器进行编码。

上述过程中所使用的第一编码器、第二编码器和第三编码器可以为单独训练好的编码器。

步骤S202，根据身份特征向量、保险特征向量和文件特征向量，计算每个向量对应的k阶的交叉特征向量，将所有的k阶的交叉特征向量排列为一维的矩阵序列。

本申请中，k为大于1的整数，也即是交叉特征向量至少为2阶的，交叉特征向量可以是指任两个向量之间进行交叉计算得到的向量，0阶的交叉特征向量也即是原始的特征向量，1阶的交叉特征向量为两个原始的特征向量的交叉计算结果，2阶的交叉特征限量为1阶的交叉特征向量与一个原始的特征向量的交叉计算结果。

例如，针对身份特征向量而言，其1阶的交叉特征向量为身份特征向量与保险特征向量的交叉计算结果，以及身份特征向量与文件特征向量的交叉计算结果进行计算得到。

针对每一阶而言，均对应一个矩阵序列，一维的矩阵序列即为对应阶的所有的交叉特征向量进行横向或者竖向的排列，得到一个一行多列或者一列多行的矩阵。

可选的是，根据身份特征向量、保险特征向量和文件特征向量，计算每个向量对应的k阶的交叉特征向量包括：

将身份特征向量的k-1阶的交叉特征向量分别与保险特征向量和文件特征向量进行对位相乘，确定两个相乘结果的和为身份特征向量的k阶的交叉特征向量；

将保险特征向量的k-1阶的交叉特征向量分别与身份特征向量和文件特征向量进行对位相乘，确定两个相乘结果的和为保险特征向量的k阶的交叉特征向量；

将文件特征向量的k-1阶的交叉特征向量分别与身份特征向量和保险特征向量进行对位相乘，确定两个相乘结果的和为文件特征向量的k阶的交叉特征向量。

其中，公式如下：

式中，

相应地，k阶的矩阵序列公式表达为

步骤S203，针对任一矩阵序列，基于自注意力机制对矩阵序列进行线性变换，得到形状相同的查询矩阵、键矩阵和值矩阵。

本申请中，自注意力机制用于计算隐式的交叉特征，其是在同阶的步骤S202计算出的交叉结果的基础上进行运算。

上述变换方式可以为矩阵乘法，例如，VK

步骤S204，基于查询矩阵和键矩阵，得到自注意力矩阵，将自注意力矩阵与值矩阵相乘，确定相乘结果为对应阶的隐式交叉特征，对所有阶的隐式交叉特征进行求和，得到求和结果。

本申请中，根据查询矩阵、键矩阵和值矩阵可以采用自注意力机制来学习各矩阵之间的隐式交叉关系，进而得到每个阶对应的隐式交叉特征，由于自注意力机制是在上述步骤S202中交叉特征向量上执行的，因此，既能够兼顾向量间的显示交叉关系，又能够得到隐含隐式交叉关系。

针对任一阶，均会得到对应的隐式交叉特征，也即包含2阶的交叉特征、3阶的交叉特征直至k阶的交叉特征，可见，相较于传统的仅学习2阶的交叉特征而言，具备更高的准确性。

可选的是，基于查询矩阵和键矩阵，得到自注意力矩阵包括：

使用矩阵乘法对查询矩阵和键矩阵进行相乘运算，得到乘积矩阵；

对乘积矩阵进行归一化，得到归一化后的乘积矩阵，确定归一化后的乘积矩阵为自注意力矩阵。

其中，对VK

针对上述公式而言，将自注意力矩阵与值矩阵相乘，确定相乘结果为VO

相应地，k阶的交叉特征是在k-1阶交叉特征的基础上进行计算的，并且是k-1阶先后完成了特征高阶显式交叉和自注意力隐式交叉后的最终交叉结果。循环重复执行特征高阶显式交叉和自注意力隐式交叉两个步骤k次就可以得到2到k阶的隐式交叉特征，分别表示为VO

最后，把所有的隐式交叉特征在向量维度上加起来，即：

X＝VO

步骤S205，获取预设的标签与划分范围的映射表，确定求和结果在划分范围中所处的目标位置，从映射表中确定目标位置对应的标签为目标理赔文件的标签。

本申请中，映射表为表征各个标签与不同的值的范围(即划分范围)之间的映射关系，如标签包括0和1，则标签0对应一个值的范围，标签1对应一个值的范围。

上述步骤S204得到的求和结果为一特征值，将此特征值与映射表中值的范围进行比较，确定特征值最终所在的范围，也即是目标位置，据此可以确定对应的标签。例如，特征值为0.2，处于范围0.1～0.3之间，则0.1～0.3这个范围对应的标签为标签1，由此可见，最终确定的标签为标签1。

标签用于确定对目标理赔文件的判别或者决策，如果本申请的方法应用为判断理赔文件是否进行理赔，对应的标签分为理赔和不理赔，相应地，最终即可确定目标理赔文件是否理赔。

可选的是，在从映射表中确定目标位置对应的标签为目标理赔文件的标签之后，还包括：

根据目标理赔文件的标签，生成理赔结果，输出理赔结果和目标理赔文件。

其中，标签对应理赔结果，最终，输出理赔结果和目标理赔文件可供审核人员进行审核，提高结果的可视化程度。

本申请实施例基于目标理赔文件所属的用户的身份信息构建身份特征向量，基于用户的保险信息构建保险特征向量，基于目标理赔文件的文件内容构建文件特征向量，根据身份特征向量、保险特征向量和文件特征向量，计算每个向量对应的k阶的交叉特征向量，将所有的k阶的交叉特征向量排列为一维的矩阵序列，针对任一矩阵序列，基于自注意力机制对矩阵序列进行线性变换，得到形状相同的查询矩阵、键矩阵和值矩阵，基于查询矩阵和键矩阵，得到自注意力矩阵，将自注意力矩阵与值矩阵相乘，确定相乘结果为对应阶的隐式交叉特征，对所有阶的隐式交叉特征进行求和，得到求和结果，获取预设的标签与划分范围的映射表，确定求和结果在划分范围中所处的目标位置，从映射表中确定目标位置对应的标签为目标理赔文件的标签，标签标志着对目标理赔文件的判断结果，通过对理赔文件的交叉信息的处理来实现判别，有效地处理了复杂信息之间的交叉，有助于提高判别结果的准确性。

参见图3，是本申请实施例三提供的一种理赔文件的标签生成方法的流程示意图，如图3所示，该理赔文件的标签生成方法可以包括以下步骤：

步骤S301，获取目标理赔文件所属的用户的身份信息、用户的保险信息以及目标理赔文件的文件内容，基于身份信息构建身份特征向量，基于保险信息构建保险特征向量，基于文件内容构建文件特征向量。

步骤S302，根据身份特征向量、保险特征向量和文件特征向量，计算每个向量对应的k阶的交叉特征向量，将所有的k阶的交叉特征向量排列为一维的矩阵序列。

步骤S303，针对任一矩阵序列，基于自注意力机制对矩阵序列进行线性变换，得到形状相同的查询矩阵、键矩阵和值矩阵。

步骤S304，基于查询矩阵和键矩阵，得到自注意力矩阵，将自注意力矩阵与值矩阵相乘，确定相乘结果为对应阶的隐式交叉特征，对所有阶的隐式交叉特征进行求和，得到求和结果。

步骤S305，获取预设的标签与划分范围的映射表。

其中，步骤S301至步骤S305的内容与上述步骤S201至步骤S205的部分内容相同，可参考步骤S201至步骤S205的描述，在此不再赘述。

步骤S306，对身份特征向量、保险特征向量和文件特征向量形成的融合向量进行因子分解，得到一阶特征值和零阶特征值。

本申请中，将身份特征向量、保险特征向量和文件特征向量进行融合得到融合向量，其中，融合可以是向量相加等。

采用因子分解机对整个的融合向量进行分解，因子分解机的表达式如下：

式中，

步骤S307，将零阶特征值、一阶特征值和求和结果进行相加运算，得到相加结果。

本申请中，针对

步骤S308，确定相加结果在划分范围中所处的目标位置为求和结果在划分范围中所处的目标位置，从映射表中确定目标位置对应的标签为目标理赔文件的标签。

其中，步骤S308的内容与上述步骤S205的部分内容相同，可参考步骤S201至步骤S205的描述，在此不再赘述。

本申请实施例基于目标理赔文件所属的用户的身份信息构建身份特征向量，基于用户的保险信息构建保险特征向量，基于目标理赔文件的文件内容构建文件特征向量，根据身份特征向量、保险特征向量和文件特征向量，计算每个向量对应的k阶的交叉特征向量，将所有的k阶的交叉特征向量排列为一维的矩阵序列，针对任一矩阵序列，基于自注意力机制对矩阵序列进行线性变换，得到形状相同的查询矩阵、键矩阵和值矩阵，基于查询矩阵和键矩阵，得到自注意力矩阵，将自注意力矩阵与值矩阵相乘，确定相乘结果为对应阶的隐式交叉特征，对所有阶的隐式交叉特征进行求和，得到求和结果，获取预设的标签与划分范围的映射表，对身份特征向量、保险特征向量和文件特征向量形成的融合向量进行因子分解，得到一阶特征值和零阶特征值，将零阶特征值、一阶特征值和求和结果进行相加运算，得到相加结果，确定相加结果在划分范围中所处的目标位置为求和结果在划分范围中所处的目标位置，从映射表中确定目标位置对应的标签为目标理赔文件的标签，标签标志着对目标理赔文件的判断结果，通过对理赔文件的交叉信息的处理来实现判别，有效地处理了复杂信息之间的交叉，有助于提高判别结果的准确性。

对应于上文实施例的理赔文件的标签生成方法，图4示出了本申请实施例四提供的理赔文件的标签生成装置的结构框图，上述标签生成装置应用于图1中的服务端，服务端对应的计算机设备连接相应的数据库，以获取数据库中相应的数据。上述计算机设备还可以连接相应的客户端，客户端为用户所操作，用户可以通过客户端向服务端提供相应的目标理赔文件。为了便于说明，仅示出了与本申请实施例相关的部分。

参见图4，该标签生成装置包括：

信息获取模块41，用于获取目标理赔文件所属的用户的身份信息、用户的保险信息以及目标理赔文件的文件内容，基于身份信息构建身份特征向量，基于保险信息构建保险特征向量，基于文件内容构建文件特征向量；

交叉特征计算模块42，用于根据身份特征向量、保险特征向量和文件特征向量，计算每个向量对应的k阶的交叉特征向量，将所有的k阶的交叉特征向量排列为一维的矩阵序列，其中，k为大于1的整数；

矩阵变换模块43，用于针对任一矩阵序列，基于自注意力机制对矩阵序列进行线性变换，得到形状相同的查询矩阵、键矩阵和值矩阵；

隐式交叉计算模块44，用于基于查询矩阵和键矩阵，得到自注意力矩阵，将自注意力矩阵与值矩阵相乘，确定相乘结果为对应阶的隐式交叉特征，对所有阶的隐式交叉特征进行求和，得到求和结果；

标签生成模块45，用于获取预设的标签与划分范围的映射表，确定求和结果在划分范围中所处的目标位置，从映射表中确定目标位置对应的标签为目标理赔文件的标签。

可选的是，信息获取模块41包括：

第一编码单元，用于使用第一编码器对身份信息进行向量编码，得到第一编码结果，确定第一编码结果为身份特征向量；

第二编码单元，用于使用第二编码器对保单信息进行向量编码，得到第二编码结果，确定第二编码结果为保单特征向量；

第三编码单元，用于使用第三编码器对文件内容进行向量编码，得到第三编码结果，确定第三编码结果为文件特征向量。

可选的是，交叉特征计算模块42包括：

第一交叉特征计算单元，用于将身份特征向量的k-1阶的交叉特征向量分别与保险特征向量和文件特征向量进行对位相乘，确定两个相乘结果的和为身份特征向量的k阶的交叉特征向量；

第二交叉特征计算单元，用于将保险特征向量的k-1阶的交叉特征向量分别与身份特征向量和文件特征向量进行对位相乘，确定两个相乘结果的和为保险特征向量的k阶的交叉特征向量；

第三交叉特征计算单元，用于将文件特征向量的k-1阶的交叉特征向量分别与身份特征向量和保险特征向量进行对位相乘，确定两个相乘结果的和为文件特征向量的k阶的交叉特征向量。

可选的是，隐式交叉计算模块44包括：

相乘运算单元，用于使用矩阵乘法对查询矩阵和键矩阵进行相乘运算，得到乘积矩阵；

归一化单元，用于对乘积矩阵进行归一化，得到归一化后的乘积矩阵，确定归一化后的乘积矩阵为自注意力矩阵。

可选的是，标签生成模块45包括：

其余特征计算单元，用于对身份特征向量、保险特征向量和文件特征向量形成的融合向量进行因子分解，得到一阶特征值和零阶特征值；

特征值计算单元，用于将零阶特征值、一阶特征值和求和结果进行相加运算，得到相加结果；

目标位置确定单元，用于确定相加结果在划分范围中所处的目标位置为求和结果在划分范围中所处的目标位置。

可选的是，标签生成装置还包括：

理赔结果输出模块，用于在从映射表中确定目标位置对应的标签为目标理赔文件的标签之后，根据目标理赔文件的标签，生成理赔结果，输出理赔结果和目标理赔文件。

需要说明的是，上述模块之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

图5为本申请实施例五提供的一种计算机设备的结构示意图。如图5所示，该实施例的计算机设备包括：至少一个处理器(图5中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序，处理器执行计算机程序时实现上述任意各个理赔文件的标签生成方法实施例中的步骤。

该计算机设备可包括，但不仅限于，处理器、存储器。本领域技术人员可以理解，图5仅仅是计算机设备的举例，并不构成对计算机设备的限定，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如还可以包括网络接口、显示屏和输入装置等。

所称处理器可以是CPU，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器包括可读存储介质、内存储器等，其中，内存储器可以是计算机设备的内存，内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是计算机设备的硬盘，在另一些实施例中也可以是计算机设备的外部存储设备，例如，计算机设备上配备的插接式硬盘、智能存储卡(Smart Media Card，SMC)、安全数字(Secure Digital，SD)卡、闪存卡(Flash Card)等。进一步地，存储器还可以既包括计算机设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等，该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述方法实施例的步骤。其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

本申请实现上述实施例方法中的全部或部分流程，也可以通过一种计算机程序产品来完成，当计算机程序产品在计算机设备上运行时，使得计算机设备执行时实现可实现上述方法实施例中的步骤。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/计算机设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/计算机设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：中国平安人寿保险股份有限公司;

上一篇：一种异种时效强化型铝合金熔化焊接方法
下一篇：显示面板和电子装置