掌桥专利:专业的专利平台
掌桥专利
首页

数据库的自动处理方法及装置

文献发布时间:2023-06-19 10:21:15


数据库的自动处理方法及装置

技术领域

本发明涉及信息技术领域,尤其涉及一种数据库的自动处理方法及装置。

背景技术

目前数据的管理方法一般是:通过具备专业知识的人员建立相应的数据采集库,当需要添加数据时,再手动将不同的数据添加到对应的数据采集库中,来实现数据采集库中数据的管理。

然而,实践发现,这种通过人工结合终端设备的数据管理方法,需要依靠专业人员进行维护,人工成本高、出错率高以及管理效率低等,无法保证数据管理的时效性。因此,很有必要提出一种数据的智能化处理技术方案,提高数据的处理管效率以及准确性,以实现数据的智能化处理。

发明内容

本发明所要解决的技术问题在于,提供一种数据库的自动处理方法及装置,能够提高数据的处理管效率以及准确性,以实现数据的智能化处理。

为了解决上述技术问题,本发明实施例第一方面公开了一种数据库的自动处理方法,所述方法包括:

根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对所述数据采集条件的原始数据;

获取所述原始数据对应的文本集合,所述文本集合包括至少一条文本,并基于确定出的与所述数据采集条件匹配的领域本体,从所述文本集合中抽取所述数据采集条件对应的目标数据;

根据所述目标数据与确定出的数据采集库中的数据的关系,对所述目标数据执行存储操作;

其中,所述根据所述目标数据与确定出的数据采集库中的数据的关系,对所述目标数据执行存储操作,包括:

判断所述目标数据与确定出的数据采集库中的某一数据是否相匹配,当判断相匹配时,将所述目标数据所述某一数据执行合并操作,并将合并后的数据存储至所述数据采集库中;当判断不匹配时,存储所述目标数据至所述数据采集库中。

作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:

基于获取到的网址检索条件在确定出的数据采集库中执行网页查询操作,得到与所述网址检索条件匹配的所有网址;

从与所述网址检索条件匹配的所有所述网址中,筛选排序在预设名次前的网址,并将排序在所述预设名次前的网址输入确定出的网址二分类识别模型中进行分析;

获取所述网址二分类识别模型输出的结果,作为目标网页,并触发执行所述的根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对所述数据采集条件的原始数据的操作。

作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:

基于确定出的网址获取方式从确定出的网址队列中,获取目标信息,所述目标信息至少包括目标网址,并判断所述目标网址是否满足确定出的网址正则表达式;

当判断满足所述网址正则表达式,基于确定出的元素定位方式获取所述目标网址的网页中的信息,并判断所述目标网址的网页中的信息是否满足确定出的数据要求;

当判断出不满足所述数据要求时,确定所述目标网址的网页为目标网页,并触发执行所述的根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对所述数据采集条件的原始数据的操作。

作为一种可选的实施方式,在本发明实施例第一方面中,所述目标网址的数量大于等于1,且所述目标信息还包括每个所述目标网址的深度,每个所述目标网址的深度用于表示从原始网址对应的网页转到该目标网址所经过的网页数量,所述原始网址存在于所述网址队列中;

以及,所述基于确定出的网址获取方式从确定出的网址队列中,获取目标信息之后,所述方法还包括:

判断所述目标网址的深度是否大于等于确定出的深度阈值,当判断出小于所述深度阈值时,将所述目标网址添加至所述网页队列中,并重新执行所述的基于确定出的网址获取方式从确定出的网址队列中,获取目标信息的操作。

作为一种可选的实施方式,在本发明实施例第一方面中,当判断出小于所述深度阈值之后,以及所述将所述目标网址添加至所述网页队列中之前,所述方法还包括:

当判断出满足所述网址正则表达式时,标识所述目标网址为第一优先级的网址,并触发执行所述的将所述目标网址添加至所述网页队列中的操作;

当判断出不满足所述网址正则表达式时,标识所述目标网址为第二优先级的网址,并触发执行所述的将所述目标网址添加至所述网页队列中的操作;

其中,所述第一优先级的等级大于所述第二优先级的等级。

作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述目标数据与确定出的数据采集库中的数据的关系,对所述目标数据执行存储操作之后,所述方法还包括:

当检测接收到认证用户的数据时,在所述数据采集库中查询与所述认证用户的数据匹配的第一数据;

建立所述认证用户唯一对应的标识与所述第一数据的关联关系,并将所述第一数据与所述关联关系存储至预先确定出的数据认证库中。

作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述第一数据与所述关联关系存储至预先确定出的数据认证库中之后,所述方法还包括:

当检测接收到预先确定出的数据自建库的建立用户对应的用户终端发送的数据时,判断在目标数据库中是否存在与所述建立用户对应的用户终端发送的数据匹配的数据,所述目标数据库包括所述数据采集库和/或所述数据认证库;

当判断出存在与所述建立用户对应的用户终端发送的数据匹配的数据时,从与所述建立用户对应的用户终端发送的数据匹配的数据中,筛选匹配度最高的第二数据,并将所述第二数据存储至所述目标数据库中。

作为一种可选的实施方式,在本发明实施例第一方面中,所述获取所述原始数据对应的文本集合之后,以及所述基于确定出的与所述数据采集条件匹配的领域本体,从所述文本集合中抽取所述数据采集条件对应的目标数据之前,所述方法还包括:

判断所述文本集合中是否存在确定出的停用词,当判断出不存在时,触发执行所述的基于确定出的与所述数据采集条件匹配的领域本体,从所述文本集合中抽取所述数据采集条件对应的目标数据的操作;

当判断出存在时,删除所述文本集合中的停用词,得到删除所述停用词的所述文本集合;

其中,所述基于确定出的与所述数据采集条件匹配的领域本体,从所述文本集合中抽取所述数据采集条件对应的目标数据,包括:

基于确定出的与所述数据采集条件匹配的领域本体,从删除所述停用词的所述文本集合中抽取所述数据采集条件对应的目标数据。

本发明实施例第二方面公开了一种数据库的自动处理装置,所述装置包括:

采集模块,用于根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对所述数据采集条件的原始数据;

获取模块,用于获取所述原始数据对应的文本集合,所述文本集合包括至少一条文本;

抽取模块,用于基于确定出的与所述数据采集条件匹配的领域本体,从所述文本集合中抽取所述数据采集条件对应的目标数据;

存储模块,用于根据所述目标数据与确定出的数据采集库中的数据的关系,对所述目标数据执行存储操作;

其中,所述存储模块根据所述目标数据与确定出的数据采集库中的数据的关系,对所述目标数据执行存储操作的方式具体为:

判断所述目标数据与确定出的数据采集库中的某一数据是否相匹配,当判断相匹配时,将所述目标数据所述某一数据执行合并操作,并将合并后的数据存储至所述数据采集库中;当判断不匹配时,存储所述目标数据至所述数据采集库中。

作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括:

第一查询模块,用于基于获取到的网址检索条件在确定出的数据采集库中执行网页查询操作,得到与所述网址检索条件匹配的所有网址;

第一筛选模块,用于从与所述网址检索条件匹配的所有所述网址中,筛选排序在预设名次前的网址;

分析模块,用于将排序在所述预设名次前的网址输入确定出的网址二分类识别模型中进行分析;

所述获取模块,还用于获取所述网址二分类识别模型输出的结果,作为目标网页,并触发所述采集模块执行所述的根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对所述数据采集条件的原始数据的操作。

作为一种可选的实施方式,在本发明实施例第二方面中,所述获取模块,还用于基于确定出的网址获取方式从确定出的网址队列中,获取目标信息,所述目标信息至少包括目标网址;

以及,所述装置还包括:

第一判断模块,用于判断所述目标网址是否满足确定出的网址正则表达式;

所述获取模块,还用于当所述第一判断模块判断满足所述网址正则表达式,基于确定出的元素定位方式获取所述目标网址的网页中的信息;

所述第一判断模块,还用于判断所述目标网址的网页中的信息是否满足确定出的数据要求;

以及,所述装置还包括:

确定模块,用于当所述第一判断模块判断出不满足所述数据要求时,确定所述目标网址的网页为目标网页,并触发所述采集模块执行所述的根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对所述数据采集条件的原始数据的操作。

作为一种可选的实施方式,在本发明实施例第二方面中,所述目标网址的数量大于等于1,且所述目标信息还包括每个所述目标网址的深度,每个所述目标网址的深度用于表示从原始网址对应的网页转到该目标网址所经过的网页数量,所述原始网址存在于所述网址队列中;

以及,所述第一判断模块,还用于在所述获取模块基于确定出的网址获取方式从确定出的网址队列中,获取目标信息之后,判断所述目标网址的深度是否大于等于确定出的深度阈值;

以及,所述装置还包括:

添加模块,用于当所述第一判断模块判断出小于所述深度阈值时,将所述目标网址添加至所述网页队列中,并触发所述获取模块重新执行所述的基于确定出的网址获取方式从确定出的网址队列中,获取目标信息的操作。

作为一种可选的实施方式,在本发明实施例第二方面中,以及所述装置还包括:

标识模块,用于当所述第一判断模块判断出小于所述深度阈值之后且所述第一判断模块判断出满足所述网址正则表达式时,以及在所述添加模块将所述目标网址添加至所述网页队列中之前,标识所述目标网址为第一优先级的网址,并触发所述添加模块执行所述的将所述目标网址添加至所述网页队列中的操作;

所述标识模块,还用于当所述第一判断模块判断出小于所述深度阈值之后且当所述第一判断模块判断出不满足所述网址正则表达式时,标识所述目标网址为第二优先级的网址,并触发所述添加模块执行所述的将所述目标网址添加至所述网页队列中的操作;

其中,所述第一优先级的等级大于所述第二优先级的等级。

作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括:

第二查询模块,用于在所述存储模块根据所述目标数据与确定出的数据采集库中的数据的关系,对所述目标数据执行存储操作之后,当检测接收到认证用户的数据时,在所述数据采集库中查询与所述认证用户的数据匹配的第一数据;

建立模块,用于建立所述认证用户唯一对应的标识与所述第一数据的关联关系;

所述存储模块,还用于将所述第一数据与所述关联关系存储至预先确定出的数据认证库中。

作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括:

第二判断模块,用于在所述存储模块将所述第一数据与所述关联关系存储至预先确定出的数据认证库中之后,当检测接收到预先确定出的数据自建库的建立用户对应的用户终端发送的数据时,判断在目标数据库中是否存在与所述建立用户对应的用户终端发送的数据匹配的数据,所述目标数据库包括所述数据采集库和/或所述数据认证库;

第二筛选模块,用于当所述第二判断模块判断出存在与所述建立用户对应的用户终端发送的数据匹配的数据时,从与所述建立用户对应的用户终端发送的数据匹配的数据中,筛选匹配度最高的第二数据;

所述存储模块,还用于将所述第二数据存储至所述目标数据库中。

作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括:

第三判断模块,用于所述获取模块获取所述原始数据对应的文本集合之后,以及在所述抽取模块基于确定出的与所述数据采集条件匹配的领域本体,从所述文本集合中抽取所述数据采集条件对应的目标数据之前,判断所述文本集合中是否存在确定出的停用词,当判断出不存在时,触发所述抽取模块执行所述的基于确定出的与所述数据采集条件匹配的领域本体,从所述文本集合中抽取所述数据采集条件对应的目标数据的操作;

删除模块,用于当所述第三判断模块判断出存在时,删除所述文本集合中的停用词,得到删除所述停用词的所述文本集合;

其中,所述抽取模块基于确定出的与所述数据采集条件匹配的领域本体,从所述文本集合中抽取所述数据采集条件对应的目标数据的方式具体为:

基于确定出的与所述数据采集条件匹配的领域本体,从删除所述停用词的所述文本集合中抽取所述数据采集条件对应的目标数据。

本发明第三方面公开了另一种数据库的自动处理装置,该装置包括:

存放有可执行程序代码的存放器;

与所述存放器耦合的处理器;

所述处理器调用所述存放器中存放的所述可执行程序代码,执行本发明第一方面公开的数据库的自动处理方法。

本发明第四方面公开了一种计算机可存放介质,所述计算机存放介质存放有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的数据库的自动处理方法。

与现有技术相比,本发明实施例具有以下有益效果:

本发明实施例中,提供了一种数据库的自动处理方法及装置,该方法包括根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据;获取原始数据对应的文本集合,文本集合包括至少一条文本,并基于确定出的与数据采集条件匹配的领域本体,从文本集合中抽取数据采集条件对应的目标数据;判断目标数据与确定出的数据采集库中的某一数据是否相匹配,当判断相匹配时,将目标数据某一数据执行合并操作,并将合并后的数据存储至数据采集库中;当判断不匹配时,存储目标数据至数据采集库中。可见,实施本发明实施例在获取到满足数据采集条件的原始数据之后,自动获取与领域本体相匹配的目标数据,并在目标数据与数据采集库中的数据匹配时,能够自动将目标数据与数据采集库中匹配的数据进行合并与存储至数据采集库,从而对数据进行智能化归类存储,为其他数据的存储留出足够的资源空间,提高了数据采集库中的资源空间的利用率;若不匹配,则直接存储至数据采集库,无需人工对数据进行处理,能够提高数据的处理效率以及准确性,以实现数据的智能化处理,保证了数据采集库中的数据真实性以及时效性,从而便于充分利用数据资源以及减少数据采集库的维护成本。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种数据库的自动处理方法的流程示意图;

图2是本发明实施例公开的另一种数据库的自动处理方法的流程示意图;

图3是本发明实施例公开的一种数据库的自动处理装置的结构示意图;

图4是本发明实施例公开的另一种数据库的自动处理装置的结构示意图

图5是本发明实施例公开的又一种数据库的自动处理装置的结构示意图;

图6是本发明实施例公开的又一种数据库的自动处理装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

本发明公开了一种数据库的自动处理方法及装置,能够在获取到满足数据采集条件的原始数据之后,自动获取与领域本体相匹配的目标数据,并在目标数据与数据采集库中的数据匹配时,能够自动将目标数据与数据采集库中匹配的数据进行合并与存储至数据采集库,从而对数据进行智能化归类存储,为其他数据的存储留出足够的资源空间,提高了数据采集库中的资源空间的利用率;若不匹配,则直接存储至数据采集库,无需人工对数据进行处理,能够提高数据的处理效率以及准确性,以实现数据的智能化处理,保证了数据采集库中的数据真实性以及时效性,从而便于充分利用数据资源以及减少数据采集库的维护成本。以下分别进行详细说明。

实施例一

请参阅图1,图1是本发明实施例公开的一种数据库的自动处理方法的流程示意图。如图1所示,该数据库的自动处理方法可以包括以下操作:

101、根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据。

本发明实施例中,数据采集条件包括但不限于目标人员(例如:科技人员)的标识信息条件,其中,目标人员的标识信息条件包括但不限于目标人员的姓名条件、职称条件以及身份号码条件中的至少一种。进一步的,数据采集条件还包括目标人员的研究领域条件和/或所在单位名称条件。

本发明实施例中,原始数据包括但不限于网址和/或html文档。

102、获取原始数据对应的文本集合,该文本集合包括至少一条文本。

本发明实施例中,文本集合包括半结构化文本以及非结构化文本。其中,半结构化文本用于表示多个键值对组成的文本,其中,键值包括但不限于文本型、数值型、图片、以及嵌套等中的至少一种。非结构化文本包括自然文本和/或网址。

103、基于确定出的与数据采集条件匹配的领域本体,从文本集合中抽取数据采集条件对应的目标数据。

本发明实施例中,不同的数据采集条件,对应不同的领域本体。具体的:领域本体包括基本概念模型和/或扩展概念模型,其中,基本概念模型包括但不限于职位、姓名、年龄、出生日期、出生地、籍贯、职称、学位等中的至少一种,扩展概念模型包括但不限于经历、成果、奖励荣誉和研究领域等中的至少一种,其中,经历但不限于包括经历描述、经历单位、经历时间等中的至少一种。又进一步的,根据领域本体所包括的内容,采用分类模型选出候选词,从而得到对应科技人员信息。进一步可选的,该分类模型的具体训练方法如下:

对采集到的样本主页的N条样本文本作为训练集,其中,可选的,N大于等于100;

按照确定出的标注方式对训练集中每条样本文本进行实体标注,得到训练集中每条样本文本的标注结果,其中,标注方式包括人名标注方式、组织名标注方式、地点标注方式、日期标注方式与年份标注方式等标注方式中的至少一种;

初始化确定出的序列标注模型中的参数,并将训练集中的样本文本转化为词序列,得到训练集的词序列;

使用词向量矩阵将训练集的词序列转化为多个词向量,并将训练集的词向量依次输入初始化后的序列标注模型中进行训练,并获取初始化后的序列标注类模型输出的训练结果;

基于梯度下降法计算每条样本文本的训练结果与该样本文本的标注结果的第一差值,并判断该第一差值是否超过确定出的第一阈值,当判断出第一差值超过第一阈值时,基于反向传播算法调整序列标注模型中的参数;

重新执行上述的将训练集的词向量依次输入初始化后的序列标注模型中进行训练的操作,直至对训练集的词向量训练完成为止,并基于序列标注模型对训练集的词向量训练第一预设次数,例如:3次,此时,初始化后的序列标注模型为经过参数调整的序列标注模型;

计算第一预设次数+1次的序列标注模型中的参数的第一均值参数,并将序列标注模型中的当前参数更新为第一均值参数,以及确定更新后的序列标注模型为上述分类模型。

本发明实施例中,数据采集条件对应的目标数据包括目标人员的基本数据和/或目标人员的活动数据,其中,目标人员的基本数据包括但不限于目标人员的姓名、职称以及身份号码中的至少一种。进一步的,目标人员的基本数据还包括目标人员的研究领域和/或所在单位名称。目标人员的活动数据包括目标人员的课题和/或该课题的举办时间。

104、根据目标数据与确定出的数据采集库中的数据的关系,对目标数据执行存储操作。

本发明实施例中,数据库包括数据采集库,其中,数据采集库用于存储采集到的目标数据,例如:采集到的科技人员的数据。进一步可选的,数据采集库存在用于供用户进行数据查询的入口、采集任务登记的入口与数据编辑更正的入口中的至少一种,本发明实施例不做限定。这样通过为数据采集库设置多种处理入口,便于接收用户输入的数据,以及便于用户对数据进行更正和修改,提高数据采集库中的数据准确性以及可靠性。又进一步的,数据库还包括数据认证库和/或数据自建库。进一步可选的,数据采集库中的数据、数据认证库中的数据、数据自建库中的数据可以进行相互关联。其中,关于数据认证库以及数据自建库的详细描述,请参阅本发明实施例中后续的相关内容的描述。这样通过将数据采集库、数据认证库以及数据自建库中的数据进行相互关联,有利于保证各个数据库之间数据的一致性。

本发明实施例中,作为一种可选的实施方式,根据目标数据与确定出的数据采集库中的数据的关系,对目标数据执行存储操作,包括:

判断目标数据与确定出的数据采集库中的某一数据是否相匹配,当判断相匹配时,将目标数据某一数据执行合并操作,并将合并后的数据存储至数据采集库中;当判断不匹配时,存储目标数据至数据采集库中。

本发明实施例中,可选的,分别计算目标数据与数据采集库中的数据的相似度,并将数据采集库中相似度大于等于确定出的相似度阈值的数据确定为某一数据。

举例来说,假设目标人员的基本数据为科技人员的个人数据,即“名字:陈好;职称:副教授;单位:理工大学;研究领域:深度学习”;当数据采集库中存在某一数据,即“名字:陈好;职称:副教授;单位:理工大学;研究领域:自然语言处理”,则科技人员的个人数据与某一数据匹配,即将科技人员的个人数据与某一数据进行合并,得到合并后的数据为“名字:陈好;职称:副教授;单位:理工大学;研究领域:深度学习,自然语言处理”

又举例说明,假设目标人员的活动数据为科技人员的活动数据,即“{时间:2019年;活动:发表《XX技术综述》;地点:广州;来源:中国知网},{时间:2020年2月1日10:00:00;活动内容:讲座;地点:理工大学A1栋}”以及“{时间:2019年;活动:发表《XX技术综述》;地点:广州;来源:万方}”,则合并的数据为:“{时间:2019年;活动:发表《XX技术综述》;地点:广州;来源:中国知网,万方},{时间:2020年2月1日10:00:00;活动内容:讲座;地点:理工大学A1栋}”。

可见,实施图1所描述的数据库的自动处理方法能够通过在获取到满足数据采集条件的原始数据之后,自动获取与领域本体相匹配的目标数据,并在目标数据与数据采集库中的数据匹配时,能够自动将目标数据与数据采集库中匹配的数据进行合并与存储至数据采集库,从而对数据进行智能化归类存储,为其他数据的存储留出足够的资源空间,提高了数据采集库中的资源空间的利用率;若不匹配,则直接存储至数据采集库,无需人工对数据进行处理,能够提高数据的处理效率以及准确性,以实现数据的智能化处理,保证了数据采集库中的数据真实性以及时效性,从而便于充分利用数据资源以及减少数据采集库的维护成本。

在一个可选的实施例中,在执行步骤101之前,该方法还可以包括以下步骤:

基于获取到的网址检索条件在确定出的数据采集库中执行网页查询操作,得到与网址检索条件匹配的所有网址;

从与网址检索条件匹配的所有网址中,筛选排序在预设名次前(例如:前10)的网址,并将排序在预设名次前的网址输入确定出的网址二分类识别模型中进行分析;

获取网址二分类识别模型输出的结果,作为目标网页,并触发执行上述的根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据的操作。

该可选的实施例中,网址检索条件包括但不限于目标人员的标识信息,其中,目标人员的标识信息包括但不限于目标人员的姓名、职称以及身份号码中的至少一种。进一步的,网址检索条件还包括目标人员的研究领域和/或所在单位名称。

该可选的实施例中,可选的,不同的网址检索条件,可以对应不同的预设名次前。

可见,该可选的实施例通过在数据采集库中查询与网址检索条件匹配的网址,并将相关度较高的网址对应的网页作为目标网页,能够提高网页获取的准确性,以及通过网址二分类识别模型获取目标网页,能够提高目标网页的获取效率以及准确性。

该可选的实施例中,可选的,网址二分类识别模型的构建方式如下:

获取M个正样本网页以及M个负样本网页,作为训练集,其中,可选的,M≥100;

从训练集中的样本网页提取每个样本网页的样本人员的主页特征,并按照确定出的标注方式对每个样本网页的样本人员的主页特征进行标注,得到每个样本网页的标注结果;其中,每个样本网页的样本人员的主页特征包括网页标题的信息、网页的正文文本中样本人员的属性关键词、网页url长度,其中,网页标题的信息包括网页标题的长度、网页标题中样本人员的信息(例如:样本人员的姓名和/或样本人员所在单位的单位名称),网页的正文文本中样本人员的属性关键词包括样本人员的职称、样本人员的学科词,其中,标注方式包括网页标题的信息标注方式、网页的正文文本中样本人员的属性关键词标注方式、网页url长度标注方式;

对确定出的二分类模型中的参数进行初始化,并将训练集包括的每个样本网页依次输入到确定出的二分类模型中进行训练,得到每个样本网页的训练结果;

基于梯度下降法计算每个样本网页的训练结果与该样本网页的标注结果之间的第二差值,并判断该第二差值是否超过确定出的第二阈值,当判断出第二差值超过第二阈值时,基于反向传播算法调整二分类模型中的参数;

重新执行上述的将训练集的样本网页依次输入初始化后的二分类模型中进行训练的操作,直至对训练集的样本网页训练完成为止,并基于二分类模型对训练集的词向量训练第二预设次数,例如:5次,初始化后的二分类模型为经过参数调整的二分类模型;

计算预设次数+1次的样本网页中的参数的第二均值参数,并将样本网页中的当前参数更新为该第二均值参数,以及确定更新后的二分类模型为上述网址二分类识别模型。

在另一个可选的实施例中,在执行步骤101之前,该方法还可以包括以下步骤:

基于确定出的网址获取方式从确定出的网址队列中,获取目标信息,该目标信息至少包括目标网址,并判断目标网址是否满足确定出的网址正则表达式;

当判断满足网址正则表达式时,基于确定出的元素定位方式获取目标网址的网页中的信息,并判断目标网址的网页中的信息是否满足确定出的数据要求;

当判断出不满足数据要求时,确定目标网址的网页为目标网页,并触发执行上述的根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据的操作。

该可选的实施例中,网址获取方式包括网址队列中网址的优先级等级和/或网址队列中网址的入库时间。其中,优先获取优先级等级高和/或入库时间越早的网址。

该可选的实施例中,元素定位方式包括目标数据在目标网址的网页中的位置,例如:科技人员的姓名所在网页的位置,科技人员的职称所在网页的位置等。

该可选的实施例中,网址队列中可以包括种子网址,其中,该种子网址可以是用户向数据采集库中输入的,或者通过用户的终端设备发送的。

可见,该可选的实施例通过在已有的网址队列中获取满足网址正则表达式且其网页中的信息不满足数据要求的网址对应的网页为目标网页,能够充分利用网址队列的资源,以及提高目标网址的获取准确性以及可靠性,丰富了目标网址获取方式,从而丰富了数据库的自动处理装置的智能化功能。

在又一个可选的实施例中,基于确定出的网址获取方式从确定出的网址队列中,获取目标信息之后,该方法还可以包括以下步骤:

判断目标网址的深度是否大于等于确定出的深度阈值,当判断出小于深度阈值时,将目标网址添加至网页队列中,并重新执行上述的基于确定出的网址获取方式从确定出的网址队列中,获取目标信息的操作。

该可选的实施例中,目标网址的数量大于等于1,且目标信息还包括每个目标网址的深度,每个目标网址的深度用于表示从原始网址对应的网页转到该目标网址所经过的网页数量,原始网址存在于网址队列中。

该可选的实施例中,可选的,当判断出大于等于深度阈值时,结束本次流程。

可见,该可选的实施例在获取到目标地址的深度之后,进一步判断目标地址的深度是否较大,若还比较小,则将目标网址返回网址队列重新执行目标信息的获取操作,能够提高扩充数据采集库的数据,有利于提高数据的采集准确性、可靠性以及时效性。

在又一个可选的实施例中,当判断出小于深度阈值之后,以及将目标网址添加至网页队列中之前,该方法还可以包括以下步骤:

当判断出满足网址正则表达式时,标识目标网址为第一优先级的网址,并触发执行上述的将目标网址添加至网页队列中的操作;

当判断出不满足网址正则表达式时,标识目标网址为第二优先级的网址,并触发执行上述的将目标网址添加至网页队列中的操作;

其中,第一优先级的等级大于第二优先级的等级。

该可选的实施例中,可选的,在将目标网址添加至网页队列的过程中或之后,同时记录目标网址的入库时间,这样有利于进一步提供后续目标网址的获取准确性以及效率。

可见,该可选的实施例在判断出目标网址的深度较小之后,进一步判断目标网址是否满足网址正则表达式,若满足,则标记为高优先级,若不满足,则标记为低优先级,便于区分每个网址的优先级别,提高从网址队列中获取目标网址的准确性以及可靠性,以及进一步提高数据采集库的数据采集准确性以及效率。

在又一个可选的实施例中,在执行步骤104之后,该方法还可以包括以下步骤:

当检测接收到认证用户的数据时,在数据采集库中查询与认证用户的数据匹配的第一数据;

建立认证用户唯一对应的标识与第一数据的关联关系,并将第一数据与关联关系存储至预先确定出的数据认证库中。

该可选的实施例中,可选的,认证用户唯一对应的标识可以包含于认证用户的数据中,也可以是单独获取的。其中,认证用户唯一对应的标识可以包括认证用户的身份号码、姓名、职称以及代号中能够识别身份的标识中的至少一种。又进一步可选的,认证用户是指完成系统的科技人员认证后的用户群体,具有完整的数据采集库、数据认证库、公开的数据自建库的查询权限与数据认证库的数据管理权限的用户。

该可选的实施例中,第一数据可以包括认证用户的标识信息,其中,认证用户的标识信息包括但不限于认证用户的身份证号、姓名以及职称中的至少一种。进一步可选的,第一数据还包括认证用户的研究领域和/或所在单位名称。又进一步可选的,第一数据还包括该第一数据的网页来源。

该可选的实施例中,当第一数据的数量大于等于1时,计算每条第一数据与认证用户的数据的相似度,并将最大相似度的第一数据更新为第一数据,以及触发上述的建立认证用户唯一对应的标识与第一数据的关联关系的操作。这样能够提高认证用户的数据的存储准确性以及可靠性。

该可选的实施例中,认证用户的数据可以是认证用户自己的数据,也可以是认证用户对应的用户的数据。

可见,该可选的实施例在检测到认证用户的数据之后,通过在数据采集库中查找与认证用户的数据匹配的数据,并自动建立认证用户与其匹配的数据的关联关系,进一步将匹配的数据以及关联关系存放在数据认证库中,有利于对认证用户的数据进行智能化管理,以及保证数据采集库与数据认证库中的数据的一致性,有利于为信息应用与平台用户提供高效可靠的数据。

该可选的实施例中,可选的,在数据采集库中查询与认证用户的数据匹配的第一数据之后,以及建立认证用户唯一对应的标识与第一数据的关联关系之前,该方法还可以包括以下步骤:

向认证用户输出与认证用户的数据匹配的第一数据,并检测是否存在针对第一数据的修改操作,若不存在,触发执行上述的建立认证用户唯一对应的标识与第一数据的关联关系的操作;

可选的,若存在,获取修改后的第一数据,并触发执行上述的建立认证用户唯一对应的标识与第一数据的关联关系的操作,此时,该步骤中的第一数据为修改后的第一数据。

该可选的实施例中,其中,当检测到针对第一数据的确认反馈,或者经过预设时长(例如:5s)之后,仍未检测到针对第一数据的修改操作之后,确定不存在针对第一数据的修改操作。其中,预设时长的起始时刻为向认证用户输出与认证用户的数据匹配的第一数据的时刻。

该可选的实施例中,进一步可选的,在获取修改后的第一数据之后,该方法还可以包括以下步骤:

对获取到的修改后的第一数据执行校验操作,当校验通过之后,触发执行上述的触发执行上述的建立认证用户唯一对应的标识与第一数据的关联关系的操作;当校验不通过,结束流程或者向认证用户输出校验失败提示。这样通过校验用户修改后的数据,能够减少用户输入不符合要求的数据却直接存储于数据认证库的情况发生,能够进一步提高数据认证库的数据采集准确性以及可靠性。

可见,该可选的实施例还能够在查询到与认证用户的数据匹配的数据之后,进一步向认证用户输出该数据,以便于用户进行确认或修改,能够提高数据认证库中的数据获取准确性,有利于进一步为信息应用与平台用户提供高效可靠的数据。

在又一个可选的实施例中,在将第一数据与关联关系存储至预先确定出的数据认证库中之后,该方法还可以包括以下步骤:

当检测接收到预先确定出的数据自建库的建立用户对应的用户终端发送的数据时,判断在目标数据库中是否存在与建立用户对应的用户终端发送的数据匹配的数据,目标数据库包括数据采集库和/或数据认证库;

当判断出存在与建立用户对应的用户终端发送的数据匹配的数据时,从与建立用户对应的用户终端发送的数据匹配的数据中,筛选匹配度最高的第二数据,并将第二数据存储至目标数据库中。

该可选的实施例中,可选的,数据自建库是由建立用户(第三方)构建的数据库,其中,建立用户包括管理批量数据(例如:科技人员信息)的企业单位的用户,建立用户是指完成系统的小库管理员认证后的用户群体,具有数据采集库、数据认证库与数据自建库的查询权限,专属数据自建库的管理权限及其附加功能的使用权限。其中,建立用户可以构建具备扩展类型人员库需求。进一步可选的,数据自建库可以独立于数据采集库和/或数据认证库。又进一步可选的,数据自建库用于存储批量数据以便管理与组织与该数据相关的活动。

该可选的实施例中,用户终端发送的数据的数量大于等于1。可选的,用户终端发送的数据包括具有扩展属性集以及批量科技人员的信息列表。

可选的,判断在目标数据库中是否存在与建立用户对应的用户终端发送的数据匹配的数据,包括:

针对用户终端发送的每条数据,计算用户终端发送的每条数据与目标数据库中的每条数据的相似度,当存在相似度大于等于预设相似度阈值的目标相似度时,确定存在与建立用户对应的用户终端发送的数据匹配的数据,且相似度大于等于预设相似度阈值的目标相似度的数据为与建立用户对应的用户终端发送的数据匹配的数据。

该可选的实施例中,可选的,当用户终端发送的所有数据中存在与目标数据库中的每条数据的相似度均小于预设相似度阈值的数据时,筛选与目标数据库中的每条数据的相似度均小于预设相似度阈值的第三数据,并确定与第三数据匹配的数据爬取方法,基于该数据爬取方法在数据自建库中查询与第三数据匹配的数据,并将该数据分别存储至数据采集库、数据认证库以及数据自建库中。

该可选的实施例中,可选的,当判断出不存在与建立用户对应的用户终端发送的数据匹配的数据时,结束本次流程。

可见,该可选的实施例在接收到数据自建库的建立用户对应的用户终端发送的数据之后,判断数据采集库和/或数据认证库是否存在与该数据匹配的数据,当存在时,自动将最高匹配度的数据存储至数据自建库,便于对数据自建库的数据进行智能化管理。

实施例二

请参阅图2,图2是本发明实施例公开的另一种数据库的自动处理方法的流程示意图。如图2所示,该数据库的自动处理方法可以包括以下操作:

201、根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据。

202、获取原始数据对应的文本集合,该文本集合包括至少一条文本。

203、判断文本集合中是否存在确定出的停用词,当判断出不存在时,触发执行步骤206;当判断出存在时,触发执行步骤204。

204、删除文本集合中的停用词,得到删除停用词的文本集合。

205、基于确定出的与数据采集条件匹配的领域本体,从删除停用词的文本集合中抽取数据采集条件对应的目标数据。

可见,本发明实施例还能够在获取到文本集合之后,进一步判断文本集合中是否存在停用词,若不存在,直接触发执行后续的操作,若存在,则删除文本集合中的停用词,能够提高文本集合的获取准确性以及可靠性,进一步节省数据采集库的资源空间,从而提高满足数据采集条件的目标数据的抽取准确性以及可靠性,进而有利于将高准确性的数据存储至数据采集库中,有利于提高针对数据采集库中的数据的搜索效率以及准确性,进一步实现数据的智能化处理。

206、基于确定出的与数据采集条件匹配的领域本体,从文本集合中抽取数据采集条件对应的目标数据。

207、根据目标数据与确定出的数据采集库中的数据的关系,对目标数据执行存储操作。

本发明实施例中,针对步骤201、步骤202、步骤206以及207的其他描述请参阅实施例一中针对步骤101-步骤104的相关详细描述,本发明实施例不再赘述。

可见,实施图2所描述的数据库的自动处理方法能够通过在获取到满足数据采集条件的原始数据之后,自动获取与领域本体相匹配的目标数据,并在目标数据与数据采集库中的数据匹配时,能够自动将目标数据与数据采集库中匹配的数据进行合并与存储至数据采集库,从而对数据进行智能化归类存储,为其他数据的存储留出足够的资源空间,提高了数据采集库中的资源空间的利用率;若不匹配,则直接存储至数据采集库,无需人工对数据进行处理,能够提高数据的处理效率以及准确性,以实现数据的智能化处理,保证了数据采集库中的数据真实性以及时效性,从而便于充分利用数据资源以及减少数据采集库的维护成本。还能够提高文本集合的获取准确性以及可靠性,进一步节省数据采集库的资源空间,从而提高满足数据采集条件的目标数据的抽取准确性以及可靠性,进而有利于将高准确性的数据存储至数据采集库中,有利于提高针对数据采集库中的数据的搜索效率以及准确性,进一步实现数据的智能化处理。

在一个可选的实施例中,在根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据之后,以及获取原始数据对应的文本集合之前,该方法还可以包括以下步骤:

判断原始数据是否满足确定出的数据条件,当判断结果为是时,触发执行上述的获取原始数据对应的文本集合的操作;

当判断出不满足数据条件时,对原始数据执行预处理操作,得到预处理后的原始数据,并触发执行上述的获取原始数据对应的文本集合的操作,此时,该步骤中的原始数据是预处理后的原始数据。

该可选的实施例中,预处理操作包括噪声去除操作和/或解析操作。

该可选的实施例中,数据条件包括数据噪声条件等。

可见,该可选的实施例在获取到原始数据之后,进一步在判断出原始数据不满足数据条件之后,对原始数据执行预处理操作,能够获取到准确的原始数据,从而有利于提高文本集合的获取准确性以及可靠性。

实施例三

请参阅图3,图3是本发明实施例公开的一种数据库的自动处理装置的结构示意图。如图3所示,该数据库的自动处理装置可以包括:采集模块301、获取模块302、抽取模块303以及存储模块304,其中:

采集模块301,用于根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据。

获取模块302,用于获取原始数据对应的文本集合,该文本集合包括至少一条文本。

抽取模块303,用于基于确定出的与数据采集条件匹配的领域本体,从文本集合中抽取数据采集条件对应的目标数据。

存储模块304,用于根据目标数据与确定出的数据采集库中的数据的关系,对目标数据执行存储操作。

本发明实施例中,可选的,存储模块304根据目标数据与确定出的数据采集库中的数据的关系,对目标数据执行存储操作的方式具体为:

判断目标数据与确定出的数据采集库中的某一数据是否相匹配,当判断相匹配时,将目标数据某一数据执行合并操作,并将合并后的数据存储至数据采集库中;当判断不匹配时,存储目标数据至数据采集库中。

可见,实施图3所描述的数据库的自动处理装置能够在获取到满足数据采集条件的原始数据之后,自动获取与领域本体相匹配的目标数据,并在目标数据与数据采集库中的数据匹配时,能够自动将目标数据与数据采集库中匹配的数据进行合并与存储至数据采集库,从而对数据进行智能化归类存储,为其他数据的存储留出足够的资源空间,提高了数据采集库中的资源空间的利用率;若不匹配,则直接存储至数据采集库,无需人工对数据进行处理,能够提高数据的处理效率以及准确性,以实现数据的智能化处理,保证了数据采集库中的数据真实性以及时效性,从而便于充分利用数据资源以及减少数据采集库的维护成本。

在一个可选的实施例中,如图4所示,该装置还包括:第一查询模块305、第一筛选模块306以及分析模块307,其中:

第一查询模块305,用于基于获取到的网址检索条件在确定出的数据采集库中执行网页查询操作,得到与网址检索条件匹配的所有网址。

第一筛选模块306,用于从与网址检索条件匹配的所有网址中,筛选排序在预设名次前的网址。

分析模块307,用于将排序在预设名次前的网址输入确定出的网址二分类识别模型中进行分析。

获取模块302,还用于获取网址二分类识别模型输出的结果,作为目标网页,并触发采集模块301执行上述的根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据的操作。

可见,实施图4所描述的装置能够通过在数据采集库中查询与网址检索条件匹配的网址,并将相关度较高的网址对应的网页作为目标网页,能够提高网页获取的准确性,以及通过网址二分类识别模型获取目标网页,能够提高目标网页的获取效率以及准确性。

在另一个可选的实施例中,如图5所示,该装置还包括:第一判断模块308以及确定模块309,其中:

获取模块302,还用于基于确定出的网址获取方式从确定出的网址队列中,获取目标信息,该目标信息至少包括目标网址。

第一判断模块308,用于判断目标网址是否满足确定出的网址正则表达式。

获取模块302,还用于当第一判断模块308判断满足网址正则表达式,基于确定出的元素定位方式获取目标网址的网页中的信息。

第一判断模块308,还用于判断目标网址的网页中的信息是否满足确定出的数据要求。

确定模块309,用于当第一判断模块308判断出不满足数据要求时,确定目标网址的网页为目标网页,并触发采集模块301执行上述的根据确定出的数据采集条件在目标网页中执行数据采集操作,得到针对数据采集条件的原始数据的操作。

可见,实施图5所描述的装置能够通过在已有的网址队列中获取满足网址正则表达式且其网页中的信息不满足数据要求的网址对应的网页为目标网页,能够充分利用网址队列的资源,以及提高目标网址的获取准确性以及可靠性,丰富了目标网址获取方式,从而丰富了数据库的自动处理装置的智能化功能。

在又一个可选的实施例中,目标网址的数量大于等于1,且目标信息还包括每个目标网址的深度,每个目标网址的深度用于表示从原始网址对应的网页转到该目标网址所经过的网页数量,原始网址存在于网址队列中。以及,如图5所示,该装置还包括:添加模块310,其中:

第一判断模块308,还用于在获取模块302基于确定出的网址获取方式从确定出的网址队列中,获取目标信息之后,判断目标网址的深度是否大于等于确定出的深度阈值。

添加模块310,用于当第一判断模块308判断出小于深度阈值时,将目标网址添加至网页队列中,并触发获取模块302重新执行上述的基于确定出的网址获取方式从确定出的网址队列中,获取目标信息的操作。

可见,实施图5所描述的装置还能够在获取到目标地址的深度之后,进一步判断目标地址的深度是否较大,若还比较小,则将目标网址返回网址队列重新执行目标信息的获取操作,能够提高扩充数据采集库的数据,有利于提高数据的采集准确性、可靠性以及时效性。

在又一个可选的实施例中,如图5所示,该装置还包括:标识模块311,其中:

标识模块311,用于当第一判断模块308判断出小于深度阈值之后且第一判断模块308判断出满足网址正则表达式时,以及在添加模块310将目标网址添加至网页队列中之前,标识目标网址为第一优先级的网址,并触发添加模块310执行上述的将目标网址添加至网页队列中的操作。

标识模块311,还用于当第一判断模块308判断出小于深度阈值之后且当第一判断模块判断出不满足网址正则表达式时,标识目标网址为第二优先级的网址,并触发添加模块310执行上述的将目标网址添加至网页队列中的操作。

该可选的实施例中,第一优先级的等级大于第二优先级的等级。

可见,实施图5所描述的装置还能够在判断出目标网址的深度较小之后,进一步判断目标网址是否满足网址正则表达式,若满足,则标记为高优先级,若不满足,则标记为低优先级,便于区分每个网址的优先级别,提高从网址队列中获取目标网址的准确性以及可靠性,以及进一步提高数据采集库的数据采集准确性以及效率。

在又一个可选的实施例中,如图4或5所示,该装置还包括:第二查询模块312以及建立模块313,其中:

第二查询模块312,用于在存储模块304根据目标数据与确定出的数据采集库中的数据的关系,对目标数据执行存储操作之后,当检测接收到认证用户的数据时,在数据采集库中查询与认证用户的数据匹配的第一数据。

建立模块313,用于建立认证用户唯一对应的标识与第一数据的关联关系。

存储模块304,还用于将第一数据与关联关系存储至预先确定出的数据认证库中。

可见,实施图4或5所描述的装置还能够在检测到认证用户的数据之后,通过在数据采集库中查找与认证用户的数据匹配的数据,并自动建立认证用户与其匹配的数据的关联关系,进一步将匹配的数据以及关联关系存放在数据认证库中,有利于对认证用户的数据进行智能化管理,以及保证数据采集库与数据认证库中的数据的一致性,有利于为信息应用与平台用户提供高效可靠的数据。

在又一个可选的实施例中,如图4或5所示,该装置还包括:第二判断模块314以及第二筛选模块315,其中:

第二判断模块314,用于在存储模块304将第一数据与关联关系存储至预先确定出的数据认证库中之后,当检测接收到预先确定出的数据自建库的建立用户对应的用户终端发送的数据时,判断在目标数据库中是否存在与建立用户对应的用户终端发送的数据匹配的数据,该目标数据库包括数据采集库和/或数据认证库。

第二筛选模块315,用于当第二判断模块314判断出存在与建立用户对应的用户终端发送的数据匹配的数据时,从与建立用户对应的用户终端发送的数据匹配的数据中,筛选匹配度最高的第二数据。

存储模块304,还用于将第二数据存储至目标数据库中。

可见,实施图4或5所描述的装置还能够在接收到数据自建库的建立用户对应的用户终端发送的数据之后,判断数据采集库和/或数据认证库是否存在与该数据匹配的数据,当存在时,自动将最高匹配度的数据存储至数据自建库,便于对数据自建库的数据进行智能化管理。

在又一个可选的实施例中,如图4或5所示,该装置还包括:第三判断模块315以及删除模块316,其中:

第三判断模块315,用于获取模块302获取原始数据对应的文本集合之后,以及在抽取模块303基于确定出的与数据采集条件匹配的领域本体,从文本集合中抽取数据采集条件对应的目标数据之前,判断文本集合中是否存在确定出的停用词,当判断出不存在时,触发抽取模块303执行上述的基于确定出的与数据采集条件匹配的领域本体,从文本集合中抽取数据采集条件对应的目标数据的操作。

删除模块316,用于当第三判断模块315判断出存在时,删除文本集合中的停用词,得到删除停用词的文本集合。

其中,抽取模块303基于确定出的与数据采集条件匹配的领域本体,从文本集合中抽取数据采集条件对应的目标数据的方式具体为:

基于确定出的与数据采集条件匹配的领域本体,从删除停用词的文本集合中抽取数据采集条件对应的目标数据。

可见,实施图4或5所描述的装置还能够在获取到文本集合之后,进一步判断文本集合中是否存在停用词,若不存在,直接触发执行后续的操作,若存在,则删除文本集合中的停用词,能够提高文本集合的获取准确性以及可靠性,进一步节省数据采集库的资源空间,从而提高满足数据采集条件的目标数据的抽取准确性以及可靠性,进而有利于将高准确性的数据存储至数据采集库中,有利于提高针对数据采集库中的数据的搜索效率以及准确性,进一步实现数据的智能化处理。

实施例四

请参阅图6,图6是本发明实施例公开的又一种数据库的自动处理装置。如图6所示,该数据库的自动处理装置可以包括:

存放有可执行程序代码的存放器601;

与存放器601耦合的处理器602;

进一步的,还可以包括与处理器602耦合的输入接口603以及输出接口604;

其中,处理器602调用存放器601中存放的可执行程序代码,用于执行实施例一或实施例二所描述的数据库的自动处理方法中的步骤。

实施例五

本发明实施例公开了一种计算机读存放介质,其存放用于电子数据交换的计算机程序,其中,该计算机程序使得计算机执行实施例一或实施例二所描述的数据库的自动处理方法中的步骤。

实施例六

本发明实施例公开了一种计算机程序产品,该计算机程序产品包括存放了计算机程序的非瞬时性计算机可读存放介质,且该计算机程序可操作来使计算机执行实施例一或实施例二所描述的数据库的自动处理方法中的步骤。

以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存放在计算机可读存放介质中,存放介质包括只读存放器(Read-Only Memory,ROM)、随机存放器(Random Access Memory,RAM)、可编程只读存放器(Programmable Read-only Memory,PROM)、可擦除可编程只读存放器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存放器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存放器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存放器、磁盘存放器、磁带存放器、或者能够用于携带或存放数据的计算机可读的任何其他介质。

最后应说明的是:本发明实施例公开的一种数据库的自动处理方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

相关技术
  • 数据库的自动处理方法及装置
  • 一种自动扩充关键词进行专利数据库检索的信息处理方法和装置
技术分类

06120112518893