掌桥专利:专业的专利平台
掌桥专利
首页

关键信息抽取方法、装置、电子设备及可读存储介质

文献发布时间:2023-06-19 13:26:15


关键信息抽取方法、装置、电子设备及可读存储介质

技术领域

本发明涉及人工智能领域,尤其涉及一种关键信息抽取方法、装置、电子设备及可读存储介质。

背景技术

信息抽取的应用非常广泛,例如,保险理赔时,需要对医疗发票图像中的关键信息(例如,人员信息、扣费项目、扣费金额等)进行抽取、整理以进行核保定损。当前,通常根据图像中字段位置进行关键信息抽取,然而这种方式仅适用于格式固定的文本图像,对于格式多样的文本图像的关键信息的抽取准确度不高。因此,亟需一种关键信息抽取方法,以提高信息抽取准确度。

发明内容

鉴于以上内容,有必要提供一种关键信息抽取方法,旨在提高信息抽取准确度。

本发明提供的关键信息抽取方法,包括:

解析用户基于客户端发出的针对待处理图像的关键信息抽取请求,对所述待处理图像执行文字识别及文本框识别处理,得到多个文本框及所述多个文本框中每个文本框内的字段内容,确定每个文本框在所述待处理图像中的位置信息;

从所述待处理图像中获取每个文本框对应的框图,将一个文本框作为一个节点,基于所述位置信息、字段内容及框图确定每个节点对应的节点特征,基于所述位置信息构建所述待处理图像对应的节点图,基于所述节点图中节点之间的距离关系确定每个节点对应的边特征;

将所述节点特征及边特征输入节点分类模型执行节点分类处理,得到每个节点对应的节点类别,基于所述节点类别确定所述待处理图像对应的初始节点集;

对所述初始节点集中每个节点对应的字段内容执行信息校验处理,基于信息校验结果确定所述待处理图像对应的目标节点集,抽取所述目标节点集中每个节点对应的字段内容作为关键信息抽取结果。

可选的,所述基于所述位置信息、字段内容及框图确定每个节点对应的节点特征,包括:

选择一个节点,对选择的节点对应的字段内容执行编码处理及向量转换处理,得到所述选择的节点对应的语义特征;

对所述选择的节点对应的框图执行特征提取处理,得到所述选择的节点对应的图像特征;

基于所述位置信息确定所述选择的节点对应的文本框的坐标值、宽度值及高度值,将所述坐标值、宽度值及高度值作为所述选择的节点对应的位置特征;

合并所述语义特征、图像特征及位置特征,得到所述选择的节点对应的节点特征。

可选的,所述基于所述节点图中节点之间的距离关系确定每个节点对应的边特征,包括:

将所述节点图中与选择的节点的距离小于预设阈值的节点的集合作为所述选择的节点的邻域节点集;

计算所述领域节点集中每个节点与所述选择的节点的中心点坐标值的距离差值,将所述距离差值作为所述选择的节点对应的边特征。

可选的,所述基于所述节点类别确定所述待处理图像对应的初始节点集,包括:

从第一数据库获取所述待处理图像所属的图像类别对应的关键字段集合;

将各个节点的节点类别与所述关键字段集合进行匹配,将匹配成功的节点的集合作为所述待处理图像对应的初始节点集。

可选的,所述关键字段集合中的各个字段标注有重要等级,在所述将匹配成功的节点的集合作为所述待处理图像对应的初始节点集之后,所述方法还包括:

将所述关键字段集合中重要等级高于预设等级的字段的集合作为重要字段集合;

若所述重要字段集合中某一字段与所述初始节点集中每个节点的节点类别皆匹配失败,则拒绝所述关键信息抽取请求,并向所述客户端发出预警信息。

可选的,所述对所述初始节点集中每个节点对应的字段内容执行信息校验处理,包括:

从第二数据库获取每个节点类别对应的信息校验规则,基于所述信息校验规则对所述初始节点集中每个节点对应的字段内容执行信息校验处理。

可选的,所述基于信息校验结果确定所述待处理图像对应的目标节点集,包括:

当无信息校验失败的节点,或者信息校验失败的节点对应的重要等级小于或等于预设等级时,将信息校验成功的节点的集合作为所述待处理图像对应的目标节点集。

为了解决上述问题,本发明还提供一种关键信息抽取装置,所述装置包括:

识别模块,用于解析用户基于客户端发出的针对待处理图像的关键信息抽取请求,对所述待处理图像执行文字识别及文本框识别处理,得到多个文本框及所述多个文本框中每个文本框内的字段内容,确定每个文本框在所述待处理图像中的位置信息;

构建模块,用于从所述待处理图像中获取每个文本框对应的框图,将一个文本框作为一个节点,基于所述位置信息、字段内容及框图确定每个节点对应的节点特征,基于所述位置信息构建所述待处理图像对应的节点图,基于所述节点图中节点之间的距离关系确定每个节点对应的边特征;

分类模块,用于将所述节点特征及边特征输入节点分类模型执行节点分类处理,得到每个节点对应的节点类别,基于所述节点类别确定所述待处理图像对应的初始节点集;

抽取模块,用于对所述初始节点集中每个节点对应的字段内容执行信息校验处理,基于信息校验结果确定所述待处理图像对应的目标节点集,抽取所述目标节点集中每个节点对应的字段内容作为关键信息抽取结果。

为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的关键信息抽取程序,所述关键信息抽取程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述关键信息抽取方法。

为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有关键信息抽取程序,所述关键信息抽取程序可被一个或者多个处理器执行,以实现上述关键信息抽取方法。

相较现有技术,本发明首先识别待处理图像中的多个文本框及每个文本框内的字段内容,确定每个文本框的位置信息;接着,获取每个文本框对应的框图,将一个文本框作为一个节点,基于位置信息、字段内容及框图确定每个节点对应的节点特征,基于节点图中节点之间的距离关系确定每个节点对应的边特征;然后,将节点特征及边特征输入节点分类模型,得到每个节点对应的节点类别,基于节点类别确定初始节点集;最后,对初始节点集中节点对应的字段内容执行信息校验处理,基于信息校验结果确定目标节点集,抽取目标节点集中每个节点对应的字段内容作为关键信息抽取结果。本发明的节点特征融合了位置信息对应的位置特征、字段内容对应的语义特征及框图对应的图像特征,使得节点特征更为丰富,分类准确度更高。因此,本发明提高了关键信息抽取准确性。

附图说明

图1为本发明一实施例提供的关键信息抽取方法的流程示意图;

图2为本发明一实施例提供的关键信息抽取装置的模块示意图;

图3为本发明一实施例提供的实现关键信息抽取方法的电子设备的结构示意图;

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

本发明提供一种关键信息抽取方法。参照图1所示,为本发明一实施例提供的关键信息抽取方法的流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。

本实施例中,关键信息抽取方法包括:

S1、解析用户基于客户端发出的针对待处理图像的关键信息抽取请求,对所述待处理图像执行文字识别及文本框识别处理,得到多个文本框及所述多个文本框中每个文本框内的字段内容,确定每个文本框在所述待处理图像中的位置信息。

所述待处理图像可以是发票图像或证件图像,本实施例以待处理图像为医疗发票图像为例进行说明,用于抽取医疗发票图像中的关键信息。

本方案通过OCR技术对待处理图像执行文字识别及文本框识别处理,识别得到多个文本框及多个文本框中每个文本框内的字段内容,OCR技术为现有技术,在此不做赘述。

识别到待处理图像中的各个文本框后,以待处理图像中的预设位置(例如,待处理图像的左下角)为原点建立坐标系(例如,以待处理图像的下边框为x轴、左边框为y轴),以预设数值为刻度单位(例如,以1mm作为1个刻度),根据文本框与坐标轴的距离确定每个文本框的各个顶点的坐标值,将文本框的四个顶点坐标值作为文本框的位置信息。

S2、从所述待处理图像中获取每个文本框对应的框图,将一个文本框作为一个节点,基于所述位置信息、字段内容及框图确定每个节点对应的节点特征,基于所述位置信息构建所述待处理图像对应的节点图,基于所述节点图中节点之间的距离关系确定每个节点对应的边特征。

本实施例中,将一个文本框作为一个节点,得到多个节点,根据文本框的位置信息、字段内容及框图确定每个节点的节点特征,位置信息反映了文本框在待处理图像中的相对位置特征、字段内容体现了字段语义特征、框图体现了图像特征,从而节点特征融合了相对位置特征、字段语义特征及图像特征,表征更为丰富。

根据各个节点的位置信息可构建待处理图像对应的节点图,根据节点图可确定每个节点的边特征,边特征体现了节点之间的距离关系,将节点之间的距离差值作为节点的边特征。

所述基于所述位置信息、字段内容及框图确定每个节点对应的节点特征,包括:

A11、选择一个节点,对选择的节点对应的字段内容执行编码处理及向量转换处理,得到所述选择的节点对应的语义特征;

编码处理用于将字段内容转换为数值型数据,本实施例中,可采用one hot编码对字段内容执行编码处理。

本实施例中,通过将编码后的字段内容输入LSTM(Long Short Term Memorynetworks,长短期记忆网络)模型进行向量转换处理,得到选择的节点对应的语义特征。

A12、对所述选择的节点对应的框图执行特征提取处理,得到所述选择的节点对应的图像特征;

本实施例中,通过将选择的节点对应的框图输入卷积神经网络执行特征提取处理,得到选择的节点对应的图像特征。

A13、基于所述位置信息确定所述选择的节点对应的文本框的坐标值、宽度值及高度值,将所述坐标值、宽度值及高度值作为所述选择的节点对应的位置特征;

位置信息包括文本框的四个顶点的坐标值,通过坐标值可计算得到文本框的宽度值和高度值,将坐标值、宽度值及高度值作为对应节点的位置特征。

A14、合并所述语义特征、图像特征及位置特征,得到所述选择的节点对应的节点特征。

将上述语义特征、图像特征及位置特征合并,得到选择的节点对应的节点特征,节点特征为一个多元数组。

例如,若节点1对应的文本框的四个顶点的坐标值分别为(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4),宽度值为w,高度值为h,语义特征为p,图像特征为q,则节点1对应的节点特征为(x1,y1,x2,y2,x3,y3,x4,y4,w,h,p,q)。

所述基于所述节点图中节点之间的距离关系确定每个节点对应的边特征,包括:

B11、将所述节点图中与选择的节点的距离小于预设阈值的节点的集合作为所述选择的节点的邻域节点集;

本实施例中,若选择的节点对应的文本框的高度值为h,则预设阈值可以是2h。例如,若选择的节点为节点1,节点1对应的文本框的高为5mm,则将节点图中与节点1的距离小于10mm的节点的集合作为节点1的领域节点集。

B12、计算所述领域节点集中每个节点与所述选择的节点的中心点坐标值的距离差值,将所述距离差值作为所述选择的节点对应的边特征。

例如,若节点1的领域节点集中包括节点2、节点3、节点4及节点5,节点1、节点2、节点3、节点4及节点5的中心点坐标值分别为(x10,y10)、(x20,y20)、(x30,y30)、(x40,y40)及(x50,y50),则节点1对应的边特征为{(x10-x20),(y10-y20),(x10-x30),(y10-y30),(x10-x40),(y10-y40),(x10-x50),(y10-y50)}。

本实施例中,仅将与选择的节点的距离小于预设阈值的节点和选择的节点之间的距离差值,作为选择的节点对应的边特征,在保证了有连接关系的节点被采样的前提下,减少了总采样量,从而降低了输入模型的数据量,加快了节点分类效率。

S3、将所述节点特征及边特征输入节点分类模型执行节点分类处理,得到每个节点对应的节点类别,基于所述节点类别确定所述待处理图像对应的初始节点集。

本实施例中,所述节点分类模型为通过初始分类模型训练得到的,所述初始分类模型为图神经网络模型,图神经网络模型用于对节点分类和节点之间的边关系分类,图神经网络包括多层图卷积层,每个图卷积层仅处理一阶邻域信息,通过叠加多个图卷积层实现多阶邻域信息的传递。

所述节点类别为节点对应的文本框所属的类别,例如,对于医疗发票图像,节点类别包括发票编号、医院名称、就诊人姓名、年龄、就诊日期、诊疗项目名称、自费金额、社保扣除金额等。

通过节点分类模型识别得到每个节点对应的节点类别后,从中抽取关键信息对应的节点,得到待处理图像对应的初始节点集。

所述基于所述节点类别确定所述待处理图像对应的初始节点集,包括:

C11、从第一数据库获取所述待处理图像所属的图像类别对应的关键字段集合;

例如,若待处理图像为医疗发票图像,则待处理图像所属的图像类别为医疗发票,第一数据库中预先存储了医疗发票对应的关键字段集合,需要从医疗发票中抽取关键字段对应的数据,以获取医疗发票的关键信息。

对于医疗发票,其对应的关键字段集合可以包括发票编号、就诊人姓名、就诊日期、诊疗项目名称及自费金额等。

C12、将各个节点的节点类别与所述关键字段集合进行匹配,将匹配成功的节点的集合作为所述待处理图像对应的初始节点集。

将各个节点的节点类别与关键字段集合中的每个字段进行匹配,将匹配成功的节点的集合作为初始节点集。

所述关键字段集合中的各个字段标注有重要等级,在所述将匹配成功的节点的集合作为所述待处理图像对应的初始节点集之后,所述方法还包括:

D11、将所述关键字段集合中重要等级高于预设等级的字段的集合作为重要字段集合;

重要等级越高,说明该字段对应的数据越重要,更需要从待处理图像中抽取出来。本实施例中,重要字段集合中各个字段对应的数据是必须抽取的。

D12、若所述重要字段集合中某一字段与所述初始节点集中每个节点的节点类别皆匹配失败,则拒绝所述关键信息抽取请求,并向所述客户端发出预警信息。

若重要字段集合中某一字段与初始节点集中任意一个节点的节点类别皆匹配失败,说明无法从待处理图像中抽取该字段对应的数据,可能是节点类别识别时出现了错误,或者待处理图像显示不全,此时,拒绝关键信息抽取请求。

所述节点分类模型的获取过程,包括:

E11、从第三数据库获取标注文本框类别的样本集,确定所述样本集的各个样本中每个文本框对应的节点特征和边特征;

样本集中的样本为框选了文本框并标注了文本框类别的图像,每个文本框对应的节点特征和边特征的确定过程与步骤S2相同,在此不再赘述。

E12、将所述样本集的各个样本中每个文本框对应的节点特征和边特征输入初始分类模型,得到每个文本框对应的预测节点类别;

将对应的节点特征和边特征输入初始分类模型,可输出各个文本框在每个节点类别的预测概率,将预测概率最大的节点类别作为预测节点类别。

E13、基于标注的文本框类别确定每个文本框对应的真实节点类别,通过最小化预测节点类别与真实节点类别之间的损失值确定所述初始分类模型的结构参数,得到节点分类模型。

所述损失值的计算公式为:

其中,q

S4、对所述初始节点集中每个节点对应的字段内容执行信息校验处理,基于信息校验结果确定所述待处理图像对应的目标节点集,抽取所述目标节点集中每个节点对应的字段内容作为关键信息抽取结果。

得到待处理图像对应的初始节点集后,还需要对初始节点集中各个节点对应的字段内容进行信息校验,以保证抽取的信息的准确性,对于信息校验失败的节点,需要从初始节点集中剔除。

所述对所述初始节点集中每个节点对应的字段内容执行信息校验处理,包括:

从第二数据库获取每个节点类别对应的信息校验规则,基于所述信息校验规则对所述初始节点集中每个节点对应的字段内容执行信息校验处理。

例如,对于发票编号,其对应的信息校验规则包括校验发票编号的位数是否为预设位数、校验发票编号的起始位是否为预设字符等;对于就诊人姓名,其对应的信息校验规则包括校验就诊人姓名的字符位数是否在预设范围内、校验就诊人姓名的首字符是否是姓氏表中的字符及校验就诊人姓名是否不是发票上的字段名称(例如,就诊人姓名不能是“年龄”)。

所述基于信息校验结果确定所述待处理图像对应的目标节点集,包括:

当无信息校验失败的节点,或者信息校验失败的节点对应的重要等级小于或等于预设等级时,将信息校验成功的节点的集合作为所述待处理图像对应的目标节点集。

若无信息校验失败的节点,或信息校验失败的节点的重要等级小于或等于预设等级,则说明高重要等级的节点都校验通过了,此时,满足了关键信息抽取要求了。

所述基于信息校验结果确定所述待处理图像对应的目标节点集,还包括:

若某一信息校验失败的节点对应的重要等级大于预设等级,则拒绝所述关键信息抽取请求,并向所述客户端发送预警信息。

信息校验失败的节点对应的重要等级大于预设等级,说明高重要等级的节点的字段内容不符合对应的信息校验规则,无法抽取该字段的正确信息,此时,可以拒绝关键信息抽取请求。

由上述实施例可知,本发明提出的关键信息抽取方法,首先,识别待处理图像中的多个文本框及每个文本框内的字段内容,确定每个文本框的位置信息;接着,获取每个文本框对应的框图,将一个文本框作为一个节点,基于位置信息、字段内容及框图确定每个节点对应的节点特征,基于节点图中节点之间的距离关系确定每个节点对应的边特征;然后,将节点特征及边特征输入节点分类模型,得到每个节点对应的节点类别,基于节点类别确定初始节点集;最后,对初始节点集中节点对应的字段内容执行信息校验处理,基于信息校验结果确定目标节点集,抽取目标节点集中每个节点对应的字段内容作为关键信息抽取结果。本发明的节点特征融合了位置信息对应的位置特征、字段内容对应的语义特征及框图对应的图像特征,使得节点特征更为丰富,分类准确度更高。因此,本发明提高了关键信息抽取准确性。

如图2所示,为本发明一实施例提供的关键信息抽取装置的模块示意图。

本发明所述关键信息抽取装置100可以安装于电子设备中。根据实现的功能,所述关键信息抽取装置100可以包括识别模块110、构建模块120、分类模块130及抽取模块140。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。

在本实施例中,关于各模块/单元的功能如下:

识别模块110,用于解析用户基于客户端发出的针对待处理图像的关键信息抽取请求,对所述待处理图像执行文字识别及文本框识别处理,得到多个文本框及所述多个文本框中每个文本框内的字段内容,确定每个文本框在所述待处理图像中的位置信息。

构建模块120,用于从所述待处理图像中获取每个文本框对应的框图,将一个文本框作为一个节点,基于所述位置信息、字段内容及框图确定每个节点对应的节点特征,基于所述位置信息构建所述待处理图像对应的节点图,基于所述节点图确定每个节点对应的边特征。

所述基于所述位置信息、字段内容及框图确定每个节点对应的节点特征,包括:

A21、选择一个节点,对选择的节点对应的字段内容执行编码处理及向量转换处理,得到所述选择的节点对应的语义特征;

A22、对所述选择的节点对应的框图执行特征提取处理,得到所述选择的节点对应的图像特征;

A23、基于所述位置信息确定所述选择的节点对应的文本框的坐标值、宽度值及高度值,将所述坐标值、宽度值及高度值作为所述选择的节点对应的位置特征;

A24、合并所述语义特征、图像特征及位置特征,得到所述选择的节点对应的节点特征。

所述基于所述节点图中节点之间的距离关系确定每个节点对应的边特征,包括:

B21、将所述节点图中与选择的节点的距离小于预设阈值的节点的集合作为所述选择的节点的邻域节点集;

B22、计算所述领域节点集中每个节点与所述选择的节点的中心点坐标值的距离差值,将所述距离差值作为所述选择的节点对应的边特征。

分类模块130,用于将所述节点特征及边特征输入节点分类模型执行节点分类处理,得到每个节点对应的节点类别,基于所述节点类别确定所述待处理图像对应的初始节点集。

所述基于所述节点类别确定所述待处理图像对应的初始节点集,包括:

C21、从第一数据库获取所述待处理图像所属的图像类别对应的关键字段集合;

C22、将各个节点的节点类别与所述关键字段集合进行匹配,将匹配成功的节点的集合作为所述待处理图像对应的初始节点集。

所述关键字段集合中的各个字段标注有重要等级,在所述将匹配成功的节点的集合作为所述待处理图像对应的初始节点集之后,所述分类模块130还用于:

D21、将所述关键字段集合中重要等级高于预设等级的字段的集合作为重要字段集合;

D22、若所述重要字段集合中某一字段与所述初始节点集中每个节点的节点类别皆匹配失败,则拒绝所述关键信息抽取请求,并向所述客户端发出预警信息。

抽取模块140,用于对所述初始节点集中每个节点对应的字段内容执行信息校验处理,基于信息校验结果确定所述待处理图像对应的目标节点集,抽取所述目标节点集中每个节点对应的字段内容作为关键信息抽取结果。

所述对所述初始节点集中每个节点对应的字段内容执行信息校验处理,包括:

从第二数据库获取每个节点类别对应的信息校验规则,基于所述信息校验规则对所述初始节点集中每个节点对应的字段内容执行信息校验处理。

所述基于信息校验结果确定所述待处理图像对应的目标节点集,包括:

当无信息校验失败的节点,或者信息校验失败的节点对应的重要等级小于或等于预设等级时,将信息校验成功的节点的集合作为所述待处理图像对应的目标节点集。

所述基于信息校验结果确定所述待处理图像对应的目标节点集,还包括:

若某一信息校验失败的节点对应的重要等级大于预设等级,则拒绝所述关键信息抽取请求,并向所述客户端发送预警信息。

如图3所示,为本发明一实施例提供的实现关键信息抽取方法的电子设备的结构示意图。

所述电子设备1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子设备1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。

在本实施例中,电子设备1包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,该存储器11中存储有关键信息抽取程序10,所述关键信息抽取程序10可被所述处理器12执行。图3仅示出了具有组件11-13以及关键信息抽取程序10的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子设备1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子设备1的内部存储单元,例如该电子设备1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子设备1的操作系统和各类应用软件,例如存储本发明一实施例中的关键信息抽取程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行关键信息抽取程序10等。

网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述电子设备1与客户端(图中未画出)之间建立通信连接。

可选的,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。

所述电子设备1中的所述存储器11存储的关键信息抽取程序10是多个指令的组合,在所述处理器12中运行时,可以实现上述关键信息抽取方法。

具体地,所述处理器12对上述关键信息抽取程序10的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。

进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是非易失性的,也可以是非易失性的。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。

所述计算机可读存储介质上存储有关键信息抽取程序10,所述关键信息抽取程序10可被一个或者多个处理器执行,以实现上述关键信息抽取方法。

在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。

因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

相关技术
  • 关键信息抽取方法、装置、电子设备及可读存储介质
  • 文本的关键信息的抽取方法、装置、电子设备及存储介质
技术分类

06120113677714