掌桥专利:专业的专利平台
掌桥专利
首页

一种数据检索方法及相关装置

文献发布时间:2023-06-19 09:40:06


一种数据检索方法及相关装置

技术领域

本申请涉及大数据技术领域,特别涉及一种数据检索方法;还涉及一种数据检索装置、设备以及计算机可读存储介质。

背景技术

在诸多应用场景都要进行数据检索,包括云平台的虚拟资源的运维场景。当前的运维现状大多停留在人工维护或者软件进行管理但依旧由人工进行排查故障并修复的阶段。由于资源数量众多,人工维护的效率有限,导致资源产生的数据使用效率下降,造成数据的严重浪费。面对海量的数据,当前查询、检索能力有限,想找到所需数据成本极高。因此,如何提高检索效率已成为本领域技术人员亟待解决的技术问题。

发明内容

本申请的目的是提供一种数据检索方法,能够提高检索效率,减少资源占用。本申请的另一个目的是提供一种数据检索装置、设备以及计算机可读存储介质,均具有上述技术效果。

为解决上述技术问题,本申请提供了一种数据检索方法,包括:

对输入的检索语句进行拆分得到一级关键字;

将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标;

每次碰撞生成所述二级坐标后,计算所述二级坐标与所述检索语句对应的头坐标的距离,并根据所述距离计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度;

将与所述检索语句的相似度达到预设阈值的所述二级关键字作为检索结果。

可选的,所述将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标,包括:

依据

其中,

可选的,所述计算所述二级坐标与所述检索语句对应的头坐标的距离,并根据所述距离计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度包括:

计算所述二级坐标与所述检索语句对应的头坐标的欧式距离;

根据所述二级坐标与所述头坐标的欧式距离以及本次迭代碰撞的最大步长计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度。

可选的,还包括:

每次进行碰撞得到所述二级坐标后,保留与所述检索语句相似度最高的二级关键字对应的所述二级坐标,并销毁其余的所述二级坐标。

可选的,还包括:

当迭代次数达到预设值时,若仍不存在与所述检索语句相似度达到所述预设阈值的所述二级关键字,则反馈检索失败。

为解决上述技术问题,本申请还提供了一种数据检索装置,包括:

拆分模块,用于对输入的检索语句进行拆分得到一级关键字;

迭代模块,用于将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标;

计算模块,用于每次碰撞生成所述二级坐标后,计算所述二级坐标与所述检索语句对应的头坐标的距离,并根据所述距离计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度;

确定模块,用于将与所述检索语句的相似度达到预设阈值的所述二级关键字作为检索结果。

可选的,所述迭代模块用于依据

其中,

可选的,所述计算模块包括:

欧式距离计算单元,用于计算所述二级坐标与所述检索语句对应的头坐标的欧式距离;

相似度计算单元,用于根据所述二级坐标与所述头坐标的欧式距离以及本次迭代碰撞的最大步长计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度。

为解决上述技术问题,本申请还提供了一种数据检索设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上所述的数据检索方法的步骤。

为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的数据检索方法的步骤。

本申请所提供的数据检索方法,包括:对输入的检索语句进行拆分得到一级关键字;将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标;每次碰撞生成所述二级坐标后,计算所述二级坐标与所述检索语句对应的头坐标的距离,并根据所述距离计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度;将与所述检索语句的相似度达到预设阈值的所述二级关键字作为检索结果。可见,本申请所提供的数据检索方法,将数据坐标化,通过坐标的迭代、距离计算、比较等实现数据检索,可以极大的提高检索效率,减少资源占用。

本申请所提供的数据检索装置、设备以及计算机可读存储介质均具有上述技术效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种数据检索方法的流程示意图;

图2为本申请实施例所提供的一种虚拟资源运维场景的示意图;

图3为本申请实施例所提供的一种数据检索装置的示意图;

图4为本申请实施例所提供的一种数据检索设备的示意图。

具体实施方式

本申请的核心是提供一种数据检索方法,能够提高检索效率,减少资源占用。本申请的另一个核心是提供一种数据检索装置、设备以及计算机可读存储介质,均具有上述技术效果。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参考图1,图1为本申请实施例所提供的一种数据检索方法的流程示意图,参考图1所示,该方法包括:

S101:对输入的检索语句进行拆分得到一级关键字;

具体的,用户输入检索语句后,系统首先对用户所输入的检索语句进行拆分,得到若干一级关键字。例如,用户输入的检索语句为“keepalived服务意外关闭后重启方案”,此时系统可将此检索语句拆分为“keepalived服务”“关闭”、“重启”以及“方案”四个一级关键字。

S102:将各一级关键字对应的一级坐标进行迭代碰撞生成二级坐标;

具体的,不同关键字对应的坐标已预先设定,将输入的检索语句进行拆分得到多个一级关键字后,进一步得到各一级关键字对应的一级坐标。例如,“keepalived服务”对应的一级坐标为X

可以明白的是,本申请将拆分检索语句得到的关键字对应的坐标称之为一级坐标,将一级坐标碰撞及二级坐标再碰撞所生成的坐标称之为二级坐标,将检索语句对应的坐标称之为头坐标。

其中,在一种具体的实施方式中,上述将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标的方式为:

依据

例如,一级坐标X

步长step的计算方式如下:

S103:每次碰撞生成二级坐标后,计算二级坐标与检索语句对应的头坐标的距离,并根据距离计算得到二级坐标对应的二级关键字与检索语句的相似度;

具体的,碰撞生成二级坐标包括一级坐标碰撞生成二次坐标以及二级坐标进一步碰撞生成新的二级坐标。每次碰撞生成二级坐标后,计算所生成的二级坐标与检索语句对应的头坐标的距离,如检索语句对应的头坐标为W

其中,在一种具体的实施方式中,上述计算二级坐标与检索语句对应的头坐标的距离,并根据距离计算得到二级坐标对应的二级关键字与检索语句的相似度方式为:计算二级坐标与检索语句对应的头坐标的欧式距离;根据二级坐标与头坐标的欧式距离以及本次迭代碰撞的最大步长计算得到二级坐标对应的二级关键字与检索语句的相似度。

具体而言,依据公式

进一步,依据公式

另外,在上述实施例的基础上,作为一种优选的实施方式,还包括:每次进行碰撞得到二级坐标后,保留与检索语句相似度最高的二级关键字对应的二级坐标,并销毁其余的二级坐标。

具体而言,坐标越少,不利于维护坐标群的个体多样性,开辟新的解空间的能力减弱。坐标越多,虽然有利于维护维护坐标群的个体多样性,但是检索越趋近于随机搜索。有鉴于此,本实施例中,每次进行碰撞得到二级坐标后,会对各二级坐标进行取舍,保留与检索语句相似度最高的二级关键字对应的二级坐标,而销毁其余的二级坐标,所保留的二级坐标继续进行迭代碰撞生成新的二级坐标。

例如,“keepalived服务”碰撞到“keepalived服务指令”生成二级坐标,“keepalived服务”也会碰撞到“mysql服务指令”生成二级坐标,显然,“keepalived服务指令”与“keepalived服务意外关闭后重启方案”的相似度要高于“mysql服务指令”与“keepalived服务意外关闭后重启方案”的相似度。因此,保留“keepalived服务”碰撞到“keepalived服务指令”生成的二级坐标,而销毁“keepalived服务”碰撞到“mysql服务指令”生成的二级坐标。以此类推,“keepalived服务”碰撞到“keepalived服务指令”生成的二级坐标继续进行碰撞,如果进一步碰到“keepalived服务重启指令”,则保留此次碰撞生成的二级坐标,如果进一步碰到“keepalived服务优点”,则销毁此次碰撞生成的二级坐标。

S104:将与检索语句的相似度达到预设阈值的所述二级关键字作为检索结果。

具体的,计算得到二级关键字与检索语句的相似度后,判断计算所得相似度是否达到了预设阈值,例如是否达到95%,若达到,则将与检索语句的相似度达到预设阈值的二级关键字作为检索结果。如“keepalived服务重启方案”与“keepalived服务意外关闭后重启方案”的相似度达到97%,则此时将“keepalived服务重启方案”作为检索结果。相反,若直到迭代次数达到预设值时仍不存在与检索语句相似度达到预设阈值的二级关键字,则反馈检索失败。

综上所述,本申请所提供的数据检索方法,包括:对输入的检索语句进行拆分得到一级关键字;将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标;每次碰撞生成所述二级坐标后,计算所述二级坐标与所述检索语句对应的头坐标的距离,并根据所述距离计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度;将与所述检索语句的相似度达到预设阈值的所述二级关键字作为检索结果。该数据检索方法,将数据坐标化,通过坐标的迭代、距离计算、比较等实现数据检索,可以极大的提高检索效率,减少资源占用。

参考图2所示,在虚拟资源运维场景中,当触发自动修复后,需要在告警修复方案库中进行数据检索,判断是否存在匹配的解决方案,在此过程可以采用本申请所提供的数据检索方法,从而提高自动化运维效率,解决告警上报不及时、告警修复效率低的问题。当检索到数据就表明告警修复方案库中不存在匹配的解决方法。相反则表明告警修复方案库中存在匹配的解决方法。进一步可对执行后服务恢复正常的方案进行标记,以及对执行后服务无法恢复正常的方案进行标记并降低其优先级,以避免下次在相同问题出现时执行到不可行的方案。

本申请还提供了一种数据检索装置,下文描述的该装置可以与上文描述的方法相互对应参照。请参考图3,图3为本申请实施例所提供的一种数据检索装置的示意图,结合图3所示,该装置包括:

拆分模块10,用于对输入的检索语句进行拆分得到一级关键字;

迭代模块20,用于将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标;

计算模块30,用于每次碰撞生成所述二级坐标后,计算所述二级坐标与所述检索语句对应的头坐标的距离,并根据所述距离计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度;

确定模块40,用于将与所述检索语句的相似度达到预设阈值的所述二级关键字作为检索结果。

在上述实施例的基础上,作为一种具体的实施方式,所述迭代模块20用于依据

其中,

在上述实施例的基础上,作为一种具体的实施方式,所述计算模块30包括:

欧式距离计算单元,用于计算所述二级坐标与所述检索语句对应的头坐标的欧式距离;

相似度计算单元,用于根据所述二级坐标与所述头坐标的欧式距离以及本次迭代碰撞的最大步长计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度。

在上述实施例的基础上,作为一种具体的实施方式,还包括:

取舍模块,用于每次进行碰撞得到所述二级坐标后,保留与所述检索语句相似度最高的二级关键字对应的所述二级坐标,并销毁其余的所述二级坐标。

在上述实施例的基础上,作为一种具体的实施方式,还包括:

反馈模块,用于当迭代次数达到预设值时,若仍不存在与所述检索语句相似度达到所述预设阈值的所述二级关键字,则反馈检索失败。

本申请还提供了一种数据检索设备,参考图4所示,该设备包括存储器1和处理器2。

存储器1,用于存储计算机程序;

处理器2,用于执行计算机程序实现如下的步骤:

对输入的检索语句进行拆分得到一级关键字;将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标;每次碰撞生成所述二级坐标后,计算所述二级坐标与所述检索语句对应的头坐标的距离,并根据所述距离计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度;将与所述检索语句的相似度达到预设阈值的所述二级关键字作为检索结果。

对于本申请所提供的设备的介绍请参照上述方法实施例,本申请在此不做赘述。

本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下的步骤:

对输入的检索语句进行拆分得到一级关键字;将各所述一级关键字对应的一级坐标进行迭代碰撞生成二级坐标;每次碰撞生成所述二级坐标后,计算所述二级坐标与所述检索语句对应的头坐标的距离,并根据所述距离计算得到所述二级坐标对应的二级关键字与所述检索语句的相似度;将与所述检索语句的相似度达到预设阈值的所述二级关键字作为检索结果。

该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

对于本申请所提供的计算机可读存储介质的介绍请参照上述方法实施例,本申请在此不做赘述。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备以及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的数据检索方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围。

相关技术
  • 一种数据检索方法及相关装置
  • 数据库的构建方法、图像检索方法以及相关装置
技术分类

06120112258335