掌桥专利:专业的专利平台
掌桥专利
首页

一种基于标签对象的快速检索方法及设备

文献发布时间:2023-06-19 09:58:59


一种基于标签对象的快速检索方法及设备

技术领域

本申请涉及计算机领域,尤其涉及一种基于标签对象的快速检索方法及设备。

背景技术

传统的监控探头的检索方式,是采用条件检索方式:根据探头的名称、编号、安装地址等基础属性进行模糊匹配,返回命中探头记录。传统的检索方式返回的探头大多数是其安装地址相关的建设属性,检索出来的探头往往是安装在搜索区域附近,而监控画面中却没有目标区域,往往需要在搜索结果记录里面逐个打开探头的视频画面,人工逐一寻找所需的探头,该方式费时费力,极大影响了工作人员的日常工作的效率。而在实际应用中,往往是通过搜索的方式直接找到视频画面中能够监控到具体区域的探头,而传统的建设方式无法满足该检索需求。

发明内容

本申请的一个目的是提供一种基于标签对象的快速检索方法及设备,解决现有技术中搜索结果记录需要逐个打开探头的视频画面进行逐一寻找,费时费力,工作效率低的问题。

根据本申请的一个方面,提供了一种基于标签对象的快速检索方法,该方法包括:

获取监控探头对象的相关信息,对所述相关信息进行标签处理,生成标签数据,其中,所述相关信息包括基础属性数据、场景相关数据、监控探头所属的业务预案数据以及用户调阅的日志数据;

抽取所述基础属性数据和所述标签数据,生成对象的列式存储模型,其中,所述列式存储模型包括标签索引表;

对所述标签索引表中的探头记录进行分词,得到分词表;

根据获取到的用户的搜索关键词匹配所述分词表,得到搜索的排序结果。

进一步地,获取监控探头对象的基础属性数据,包括:

按照抽取周期为T+1进行抽取监控探头对象的基础属性数据,并以行式数据进行存储。

进一步地,对所述相关信息进行标签处理,生成标签数据,包括:

抽取所述基础属性数据的字段生成建设标签;

从所述场景相关数据中抽取监控场所、场所类型及场所部位的信息,根据探头监控区域标注所述监控场所、场所类型及场所部位标签,并实时同步标注数据,生成场景标签;

抽取监控探头所属的业务预案数据,根据所述业务预案数据生成业务标签;

采集监控探头的用户调阅的日志数据,离线分析预设时段内的调阅的日志数据,根据分析结果生成衍生标签。

进一步地,抽取所述基础属性数据和所述标签数据,生成对象的列式存储模型,包括:

将每一标签数据定义为一列,每一监控探头定义为一行;

将每个监控探头上多个标签采用数组存储,生成所述监控探头的标签索引表;

将每个监控探头按照列名和列值的格式进行存储,根据所有监控探头的存储结果生成对象的列式存储模型,其中,所述列名包括探头基础属性、建设标签、场景标签、业务标签及衍生标签。

进一步地,对所述标签索引表中的探头记录进行分词,得到分词表,包括:

基于词典将所述标签索引表中的探头记录切分成关键字,将所述关键字的字母大写变成小写;

将所述词典中没有的词切成单个字,删除所述单个字;

输出切词结果,得到分词表。

进一步地,根据获取到的用户的搜索关键词匹配所述分词表,得到搜索的排序结果,包括:

将所述用户的搜索关键词逐一匹配所述分词表,匹配出多条标签枚举值;

根据所述多条枚举值在所述标签索引表中检索探头记录,将检索结果按照预设的业务逻辑进行排序,生成搜索的排序结果。

进一步地,根据所述多条枚举值在所述标签索引表中检索探头记录,包括:

根据所述多条标签枚举值逐一在所述标签索引表中检索对应的探头记录,检索出的探头记录进行分组取并集;

分别计算分组取并集后的探头记录中每个探头记录命中的标签枚举值的数量,按照数量的倒序生成初始排序结果;

其中,将检索结果按照预设的业务逻辑进行排序,生成搜索的排序结果,包括:

在所述初始排序结果中对命中同一数量的探头记录按照预设的业务逻辑进行排序,生成搜索的排序结果。

进一步地,所述预设的业务逻辑包括:探头记录对应的自建属性排序大于非自建属性,高清属性的排序大于标清属性,可控属性的排序大于固定属性。

进一步地,离线分析预设时段内的用户的操作数据,根据分析结果生成衍生标签,包括:

将预设时间段内的用户的操作数据写入数据仓库;

对用户操作数据进行业务处理,并将处理的结果生成衍生标签打在相应的监控探头上,其中,不同的衍生标签对应不同的业务逻辑。

根据本申请又一个方面,还提供了一种基于标签对象的快速检索的设备,所述设备包括:

一个或多个处理器;以及

存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述所述方法的操作。

根据本申请再一个方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如前述所述的方法。

与现有技术相比,本申请通过获取监控探头对象的相关信息,对所述相关信息进行标签处理,生成标签数据,其中,所述相关信息包括基础属性数据、场景相关数据、监控探头所属的业务预案数据以及用户调阅的日志数据;抽取所述基础属性数据和所述标签数据,生成对象的列式存储模型,其中,所述列式存储模型包括标签索引表;对所述标签索引表中的探头记录进行分词,得到分词表;根据获取到的用户的搜索关键词匹配所述分词表,得到搜索的排序结果。从而可以按监控探头实际监控的区域进行探头的检索,该方法与传统的探头检索方法相比,检索效率更高、更精准。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1示出根据本申请的一个方面提供的一种基于标签对象的快速检索方法的流程示意图;

图2示出本申请一实施例中构建监控探头对象标签体系的示意图;

图3示出本申请一实施例中对标签索引表的探头记录进行分词的流程示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本申请作进一步详细描述。

在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如中央处理器(Central Processing Unit,CPU))、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-Change RAM,PRAM)、静态随机存取存储器(Static Random Access Memory,SRAM)、动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Versatile Disk,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

图1示出根据本申请的一个方面提供的一种基于标签对象的快速检索方法的流程示意图,该方法包括:步骤S11~步骤S14,

在步骤S11中,获取监控探头对象的相关信息,对所述相关信息进行标签处理,生成标签数据,其中,所述相关信息包括基础属性数据、场景相关数据、监控探头所属的业务预案数据以及用户调阅的日志数据;在此,抽取全部的监控探头的相关信息,包括探头的基础属性数据、场景相关数据、监控探头所属的业务预案数据以及用户调阅的日志数据,其中,基础属性数据包括设备编码、设备名称、设备厂商、行政区域、监控点位类型、设备型号、点位俗称、IPV4地址、IPV6地址、MAC地址、摄像机类型、功能类型、补光属性、摄像机编码格式、安装地址、经度、维度、可视距离、摄像机位置类型、监视方位、摄像机场景预设照片URL、联网属性、安装时间、管理单位、录像保存天数、设备状态、所属部门或行业、视频分辨率、对应存储通道IP、对应存储通道、视频信号类型、建设应用类别等。利用获得的相关信息构建监控探头对象的标签体系,该标签体系包括探头的多个维度的标签信息,如可包括四个维度的标签信息:建设标签、场景标签、业务标签及衍生标签。

在步骤S12中,抽取所述基础属性数据和所述标签数据,生成对象的列式存储模型,其中,所述列式存储模型包括标签索引表;在此,监控探头的标签体系构建完成之后,抽取对象的基础属性数据和标签数据,生成对象的列式存储模型,形成探头的标签索引表。

在步骤S13中,对所述标签索引表中的探头记录进行分词,得到分词表;在此,针对标签索引表的探头记录进行切词,可以采用正向匹配的分词算法进行分词,得到分词表。

在步骤S14中,根据获取到的用户的搜索关键词匹配所述分词表,得到搜索的排序结果。在此,根据用户的搜索关键词构建搜索策略和排序规则,从而匹配分词表进行检索过程,得到搜索的排序结果并返回该排序结果,即为用户展示检索出的结果。通过本申请所述的方法,可以按监控探头实际监控的区域进行探头的检索,该方法与传统的探头检索方法相比,检索效率更高、更精准。

在本申请一实施例中,在步骤S11中,按照抽取周期为T+1进行抽取监控探头对象的基础属性数据,并以行式数据进行存储。在此,抽取的周期为T+1,其中,T≥0,以行式数据进行存储,其数据格式如表1下:

表1

在本申请一实施例中,在步骤S11中,抽取所述基础属性数据的字段生成建设标签;从所述场景相关数据中抽取监控场所、场所类型及场所部位的信息,根据探头监控区域标注所述监控场所、场所类型及场所部位标签,并实时同步标注数据,生成场景标签;抽取监控探头所属的业务预案数据,根据探头所属业务预案数据生成业务标签;采集监控探头调阅的用户调阅的日志数据,离线分析预设时段内的调阅的日志数据,根据分析结果生成衍生标签。在此,如图2所示,构建监控探头对象标签体系,建设标签为从探头的基础属性数据中抽取基础属性字段自动形成的,具体地:获取T+1同步探头基础数据,抽取基础属性字段形成建设标签,从而实现将探头的基础属性字段转换成标签。通过批处理工具以离线方式分析生成建设标签,具体地将探头的属性字段抽取为标签定义,将探头具体的属性内容抽取为该标签定义下的标签枚举值,例如,“联网属性”是探头基础信息中的一个字段,每个探头对应该字段的内容为“已联网”或“未联网”,则将该字段抽取成一列建设标签为:联网属性:[已联网,未联网],其中,“联网属性”是标签定义,“已联网”和“未联网”是标签枚举值。

场景标签是通过人工标注的标签来结构化描述监控探头视频画面中的场景目标,包括监控场所、场所类型和监控部位,这三者构成了一组场景标签,监控场所的标注是对具体的建筑或道路或路口填写名称,场所类型的标注是根据标签字典中的场所类型或道路交通类型进行选择,场所部位的标注是根据标签字典中建筑空间类型或道路交通类型的部位进行选择,可以选择出口部位和建筑部位或路口部位、路段部位或方向部位;如一监控视频图片中得到的道路场景标签:监控场所:XX高速,场所类型:高速公路,场所部位:向西;又如建筑物的,监控场所:XX小区,场所类型:社区,场所部位:停车场。一个监控探头根据其监控画面中场所数量,可以打上多组场景标签,其中,场所数量是指一个探头的监控画面中存在的监控场所的数量,比如,一个探头的监控画面中可以看到XX道路、 XX学校和XX商铺三个场所,则该探头的场所数量为3个;具体地:根据探头监控区域,手动标注监控场所、场所类型、场所部位标签,实时同步标注数据形成场景标签。

T+1同步探头所属的业务预案数据,抽取探头所属预案的名称,形成业务标签,其中,业务预案是为满足同一个业务需求的监控探头的分组,预案名称为监控探头分组的名称,例如,预案名称为“XX安保预案”,该预案中所有的监控探头自动打上“XX安保预案”的业务标签。

采集监控探头的用户调阅的日志数据,T+1离线分析预设时间段内(如近三个月)用户调阅的日志数据,自动生成相应的衍生标签。其中,离线分析时,将预设时间段内的用户调阅的日志数据写入数据仓库;通过批处理工具进行业务逻辑处理,并将处理的结果生成衍生标签打在相应的监控探头上,其中,不同的衍生标签对应不同的业务逻辑。在此,通过业务系统采集用户调阅的日志数据,将日志数据通过数据抽取工具写入数据仓库,写入后通过批处理工具进行业务逻辑处理,并将处理的结果生成衍生标签打在相应的探头上;例如,从日志数据中抽出探头的播放记录数据,计算吃醋每个探头近三个月的播放次数,并根据播放次数进行排序,播放次数最多的前10%的探头打上“热播点位”的衍生标签,不同的衍生标签对应不同的业务处理逻辑。

在本申请一实施例中,在步骤S12中,将每一标签数据定义为一列,每一监控探头定义为一行;将每个监控探头上多个标签采用数组存储,生成所述监控探头的标签索引表;将每个监控探头按照列名和列值的格式进行存储,根据所有监控探头的存储结果生成对象的列式存储模型,其中,所述列名包括探头基础属性、建设标签、场景标签、业务标签及衍生标签。在此,抽取监控探头的基础属性数据和标签系统数据,构建列式存储模型,即每个标签定义一列,每个家监控探头定义一行,一个监控探头上多个标签采用数组存储,形成监控探头的标签索引表;单个监控探头的列式存储模型格式包括列名和列值,该列值为后续的标签枚举值,具体格式如表2 所示:

表2

在本申请一实施例中,在步骤S13中,基于词典将所述标签索引表中的探头记录切分成关键字,将所述关键字的字母大写变成小写;将所述词典中没有的词切成单个字,删除所述单个字;输出切词结果,得到分词表。在此,探头记录是指检索出来的探头的集合,为满足检索条件的一组监控探头。采用正向匹配的分词算法进行分词,具体如图3所示,基于词典将探头标签索引表内的记录切成关键字,把英文字母大写变成小写,将词典中没有的词切成单个字,删除在停用词库中的切出来的单个字,输出切词结果;通过上述分词过程,实现标签的全文检索。

在本申请一实施例中,在步骤S14中,将所述用户的搜索关键词逐一匹配所述分词表,匹配出多条标签枚举值;根据所述多条枚举值在所述标签索引表中检索探头记录,将检索结果按照预设的业务逻辑进行排序,生成搜索的排序结果。在此,针对用户输入的搜索关键词,逐一匹配标签分词表,模糊左匹配出最多1000条标签枚举值,该标签枚举值为上述列式存储模型中每一列中的枚举值,比如“已联网”、“固定枪机”、“XX饭店”等,在列式存储模型中列名为标签定义,列值为标签枚举值。同一标签定义下可以有多个标签枚举值,在检索时,通过根据输入的关键字去模糊左匹配标签枚举值,再通过匹配出的标签枚举值去查询出已经打上对应标签枚举值的监控探头,并对匹配的标签枚举值的数量上限进行控制,当上限为1000条时可以在业务和性能中取得平衡。对使用标签枚举值进行匹配查询的检索结果按照预设的业务逻辑进行排序,从而得到最终的搜索的排序结果。

具体地,根据所述多条标签枚举值逐一在所述标签索引表中检索对应的探头记录,检索出的探头记录进行分组取并集;分别计算分组取并集后的探头记录中每个探头记录命中的标签枚举值的数量,按照数量的倒序生成初始排序结果;其中,将检索结果按照预设的业务逻辑进行排序,生成搜索的排序结果,包括:在所述初始排序结果中对命中同一数量的探头记录按照预设的业务逻辑进行排序,生成搜索的排序结果。在此,可根据搜索的关键词构建搜索策略和排序规则,具体地,针对输入的搜索关键词,逐一匹配标签分词表,模糊左匹配出多条标签枚举值,在这里可以最多 1000条,根据匹配出的标签枚举值逐一去探头标签表中检索对应的探头记录。每一个标签枚举值检索出一组探头记录,最终所有检索出来的记录分组取并集;针对并集之后的探头记录,分别计算每个探头记录命中的标签枚举值的数量,按数量的倒序生成初始排序结果,按照预设的业务逻辑对初始排序结果进行排序,得到最终的排序结果。

具体地,所述预设的业务逻辑包括:探头记录对应的自建属性排序大于非自建属性,高清属性的排序大于标清属性,可控属性的排序大于固定属性。在此,针对命中同一数量的探头记录,按照“自建>非自建”、“高清>标清”、“可控>固定”的业务逻辑进行排序,生成最终的搜索排序结果并返回。

通过本申请所述的方法,建立起一种基于标签体系的对象的快速检索方法,可检索探头视频画面中的监控区域,显著提升监控探头检索的效率和精准度。

此外,本申请实施例还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述一种基于标签对象的快速检索方法。

在本申请一实施例中,还提供了一种基于标签对象的快速检索的设备,所述设备包括:

一个或多个处理器;以及

存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述所述方法的操作。

例如,计算机可读指令在被执行时使所述一个或多个处理器:

获取监控探头对象的相关信息,对所述相关信息进行标签处理,生成标签数据,其中,所述相关信息包括基础属性数据、场景相关数据、监控探头所属的业务预案数据以及用户调阅的日志数据;

抽取所述基础属性数据和所述标签数据,生成对象的列式存储模型,其中,所述列式存储模型包括标签索引表;

对所述标签索引表中的探头记录进行分词,得到分词表;

根据获取到的用户的搜索关键词匹配所述分词表,得到搜索的排序结果。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构) 可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。

另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

相关技术
  • 一种基于标签对象的快速检索方法及设备
  • 基于对象标签的视频内容快速检索方法
技术分类

06120112370749