掌桥专利:专业的专利平台
掌桥专利
首页

一种数据检索与可视化方法、装置、设备和存储介质

文献发布时间:2023-06-19 11:29:13


一种数据检索与可视化方法、装置、设备和存储介质

技术领域

本发明涉及主播话术语音识别统计,具体为一种数据检索与可视化方法、装置、设备和存储介质。

背景技术

通过在体育赛事如欧洲杯、美职篮、奥运的获得赞助资源是最优质的选择。如何通过体育知识图谱为客户提供借势“体育”,选择赞助、代言等品牌推广的解决方案,具体的比如如何评估明星(团队)的影响力和品牌契合度等,成为亟待解决的技术问题。

传统的数据检索结果的展示技术只能实现简单的信息展示,数量汇总等,不能直观的展示实体与实体之间的关联关系,因此很难掌握全面信息,达到辅助决策,提高效率的目的。

发明内容

为了解决上述技术问题,本发明的目的在于提供一种数据检索与可视化方法、装置、设备和存储介质,解决目前存在的问题。

为达到上述目的,本发明提供的技术方案如下:

根据本发明的一个方面,提供一种数据检索与可视化方法,包括:

预存储实体名称;

提取所述实体名称的实体类型,并基于实体类型获取各实体名称之间的关联关系;

接收输入信号;

判断预存储的实体名称中是否存在与输入信号相匹配的目标实体名称,若有,则获取目标实体名称的实体类型和/或目标实体名称与其他实体名称之间的关联关系;

将所述实体名称、实体类型、关联关系中至少一个按照预设条件基于第三方组件生成可视化信息。

进一步的,判断预存储的实体名称中是否存在与输入信号相匹配的目标实体名称,包括:

建立匹配规则;

识别所述输入信号的字符;

根据匹配规则将所述字符与预存储实体名称,若存在匹配成功的实体名称则判断预存储的实体名称中存在与输入信号相匹配的目标实体名称,所述实体类型包括运动员、运动项目、实体品牌、媒体、广告活动中的至少一个。

进一步的,

所述实体类型包括运动员、运动项目、实体品牌、媒体、广告活动中的至少一个;

和/或

所述关联关系包括合作关系、运动专长、是否参与、是否参演中的至少一个;

和/或

所述关联关系包括N级关联关系,其中N=1、2、3、4……n,

与目标实体名称具有直接关联关系的为1级关联关系,1级关联关系所对应的实体名称为一级关联实体;

与一级关联实体具有直接关联关系的为2级关联关系,2级关联关系所对应的实体名称为二级关联实体;

以此类推,至得到n级关联关系所对应的实体名称为N级关联实体。

进一步的,将所述实体名称、实体类型、关联关系中至少一个按照预设条件基于第三方组件生成可视化信息,包括:

首先显示第一节点和/或第二节点,第一节点表示实体名称,第二节点表示实体类型,用于实体扩展的操作节点;

若第二节点被触发,则按照该节点的一级关联实体进行扩展生成第三节点,展示一级关联实体;

若第三节点被触发,则按照该节点的二级关联实体进行扩展生成第四节点,展示二级关联实体;

以此类推,至展示出N级关联实体。

进一步的,还包括设置展示权重,所述展示权重包括实体名称首次出现的时间、搜索次数;

每次扩展,默认最大节点数为X,如果实际相关节点数大于X,则根据展示权重,选取权重和为前X个相关实体进行展示。

根据本发明的另一个方面,提供一种数据检索与可视化装置,包括

数据库,配置用于预存储实体名称;

信号接收模块,配置用于接收输入信号;

数据处理模块,配置用于判断预存储的实体名称中是否存在与输入信号相匹配的目标实体名称,若有,则获取目标实体名称的实体类型和/或目标实体名称与其他实体名称之间的关联关系;

可视化模块,配置用于将所述实体名称、实体类型、关联关系中至少一个按照预设条件基于第三方组件生成可视化信息。

进一步的,数据处理模块,包括

通信单元,配置用于获取输入信号中的实体关键字;

匹配单元,配置用于建立匹配规则,根据匹配规则将所述字符与预存储实体名称,若存在匹配成功的实体名称则判断预存储的实体名称中存在与输入信号相匹配的目标实体名称。

进一步的,数据处理模块,还包括

关联关系分类单元,配置用于将关联关系分为N级关联关系,其中N=1、2、3、4……n;

与目标实体名称具有直接关联关系的为1级关联关系,1级关联关系所对应的实体名称为一级关联实体;

与一级关联实体具有直接关联关系的为2级关联关系,2级关联关系所对应的实体名称为二级关联实体;

以此类推,至得到n级关联关系所对应的实体名称为N级关联实体。

进一步的,数据处理模块,还包括:

实体扩展展示单元,配置用于

首先显示第一节点、第二节点,第一节点表示实体名称,第二节点表示实体类型,用于实体扩展的操作节点;

若触发第二节点后,按照该节点的一级关联实体进行扩展生成第三节点,展示一级关联实体;

若触发第三节点,按照该节点的二级关联实体进行扩展生成第四节点,展示二级关联实体;

以此类推,至展示出N级关联实体。

进一步的,数据处理模块,还包括:

权重设置单元,配置用于设置展示权重,所述展示权重包括实体名称首次出现的时间、搜索次数;

实体扩展展示单元每次扩展,默认最大节点数为X,如果实际相关节点数大于X,则根据展示权重,选取权重和为前X个相关实体进行展示。

根据本发明的另一个方面,提供了一种设备,包括:

一个或多个处理器;

存储器,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上任一项所述的方法。

根据本发明的另一个方面,提供了一种存储有计算机程序的计算机可读存储介质,该程序被处理器执行时实现如上任一项所述的方法。

与现有技术相比,本发明具有以下有益效果:

1、本发明示例的数据检索与可视化方法,可将检索结果直观高效的展示给用户,给用户提供全面、直观、可靠的知识服务。用户可在图谱上清晰直观的看出检索目标实体和其他相关实体的关联关系,并可以按照实体名称继续扩展实体类型或者关联关系。

通过第三方图谱可视化组件生成可视化图谱信息为客户提供选择赞助、代言等品牌推广的解决方案,尤其适用于体育领域,如:评估明星(团队)的影响力和品牌契合度,通过知识图谱展现包括历史的表现、了解历史参赛、节目参与、广告代言及相关资料、品牌或粉丝的画像重合差异分析、带货能力、推荐代言人候选,已有候选的评估、组合。帮助品牌了解行业内体育赛事、体育类节目赞助分布、投入和声量。

2、本发明示例的数据检索与可视化装置,可以实现数据检索与可视化方法,将检索结果直观高效的展示给用户,给用户提供全面、直观、可靠的知识服务。用户可在图谱上清晰直观的看出检索目标实体和其他相关实体的关联关系,并可以按照实体名称继续扩展实体类型或者关联关系。

3、本发明设备执行如上任一项所述的方法实现图谱可视化信息的展现,将检索结果直观高效的展示给用户,给用户提供全面、直观、可靠的知识服务。用户可在图谱上清晰直观的看出检索目标实体和其他相关实体的关联关系,并可以按照实体名称继续扩展实体类型或者关联关系。

4、本发明设备计算机可读存储介质,该程序被处理器执行时实现如上任一项所述的方法,将检索结果直观高效的展示给用户,给用户提供全面、直观、可靠的知识服务。用户可在图谱上清晰直观的看出检索目标实体和其他相关实体的关联关系,并可以按照实体名称继续扩展实体类型或者关联关系。

附图说明

图1 为本发明数据检索与可视化方法的流程图;

图2为本发明的设备的结构框图。

具体实施方式

为了更好的了解本发明的技术方案,下面结合说明书附图和具体实施例对本发明作进一步说明。

实施例1

本实施例提供一种数据检索与可视化方法,包括:

步骤1:预存储实体名称,实体名称优选自体育领域;

步骤2:提取所述实体名称的实体类型,并基于实体类型获取各实体名称之间的关联关系;

步骤3:接收输入信号,本实施例提供一种接收输入信号的方案,提供搜索入口和显示界面,以供使用者输入检索信息;

步骤4:判断预存储的实体名称中是否存在与输入信号相匹配的目标实体名称,若有,则获取目标实体名称的实体类型和/或目标实体名称与其他实体名称之间的关联关系;本实施例中,所述实体类型包括运动员、运动项目、实体品牌、媒体、广告活动中的至少一个;所述关联关系包括合作关系、运动专长、是否参与、是否参演中的至少一个;

具体包括:

步骤41:建立匹配规则;

步骤42:识别所述输入信号中的字符;

步骤43:根据匹配规则将所述字符与预存储实体名称进行匹配,若存在匹配成功的实体名称,则判断预存储的实体名称中存在与输入信号相匹配的目标实体名称;

步骤44:根据目标实体查找目标实体名称的实体类型及其与其他实体名称之间的关联关系。

作为一种优选实施方式,所述关联关系包括N级关联关系,其中N=1、2、3、4……n,与目标实体名称具有直接关联关系的为1级关联关系,1级关联关系所对应的实体名称为一级关联实体;与一级关联实体具有直接关联关系的为2级关联关系,2级关联关系所对应的实体名称为二级关联实体;以此类推,至得到n级关联关系所对应的实体名称为N级关联实体。

步骤5:将所述实体名称、实体类型、关联关系中至少一个按照预设条件基于第三方组件生成可视化信息,具体的可视化信息可以通过显示界面进行展示,本实施例中的第三方组件为cytoscape.js的图谱可视化组件。显示过程包括:

步骤51:首先显示第一节点、第二节点,第一节点表示实体名称,第二节点表示实体类型,用于实体扩展的操作节点;

步骤52:若触发第二节点后,按照该节点的一级关联实体进行扩展生成第三节点,展示一级关联实体;节点的触发方式为点击如通过触屏设备或外接设备在显示界面中点击需要触发的节点即可。

步骤53:若触发第三节点,按照该节点的二级关联实体进行扩展生成第四节点,展示二级关联实体;

步骤54:以此类推,至展示出N级关联实体。

本实施例作为优选方案,还包括设置展示权重,所述展示权重包括实体名称首次出现的时间、搜索次数;

为避免关联实体数量太多造成图谱显示不清晰的问题,每次扩展,默认最大节点数为X,如果实际相关节点数大于X,本实施例X选取20,当然用户可根据实际需求增大或者减少用于图谱展示的相关节点数,则根据展示权重,选取权重和为前20个相关实体进行展示。

每次实体扩展之后,将获取到的数据处理成cytoscape.js的图谱可视化组件所适配的数据格式,追加到图谱上,最后默认通过自动排布算法呈现出圆形图谱效果。为尽可能的完善可视化效果,该组件可提供多种布局方式:

1.自动布局:采用力导向算法将各个元素进行排布展示

2.网络布局:以网络形式自动展示图析

3.层次布局:以层次关系展示图析

4.环形布局:以环形方式展示图析

本实施例尤其适用于体育领域,同时为了更直观的说明以上解决方案,在这举个例子,搜索到目标实体“姚明”后,首次上图谱,只展示节点“姚明”以及其实体扩展操作节点“名人”,“品牌”和“媒体”。设置了最大相关节点数为20。点击操作节点“名人”可自动进行实体扩展,可获取到20个与“姚明”相关联的一级实体,并以自动排布算法呈现在图谱上。选择任意一个一级实体节点,则同样会出现该实体的实体扩展操作节点,以此类推,逐层扩展。

本实施例提供一种实现上述数据检索与可视化方法的装置,包括

数据库,配置用于预存储实体名称;

信号接收模块,配置用于接收输入信号;

数据处理模块,配置用于判断预存储的实体名称中是否存在与输入信号相匹配的目标实体名称,若有,则获取目标实体名称的实体类型和/或目标实体名称与其他实体名称之间的关联关系;所述实体类型包括运动员、运动项目、实体品牌、媒体、广告活动中的至少一个;所述关联关系包括合作关系、运动专长、是否参与、是否参演中的至少一个;

可视化模块,配置用于将所述实体名称、实体类型、关联关系中至少一个按照预设条件基于第三方组件生成可视化信息,本实施例提供一种接收输入信号的方案,提供搜索入口和显示界面,以供使用者输入检索信息,检索信息作为输入信号,进一步优选的,信号接收模块的搜索入口和显示界面与可视化模块通过同一显示界面显示,以供使用者输入检索信息,然后通过显示界面显示搜索结果,即按照预设条件基于第三方组件生成可视化信息。

具体的,数据处理模块,包括

通信单元,配置用于获取输入信号中的实体关键字;

匹配单元,配置用于建立匹配规则,根据匹配规则将所述字符与预存储实体名称,若存在匹配成功的实体名称则判断预存储的实体名称中存在与输入信号相匹配的目标实体名称。

关联关系分类单元,配置用于将关联关系分为N级关联关系,其中N=1、2、3、4……n;与目标实体名称具有直接关联关系的为1级关联关系,1级关联关系所对应的实体名称为一级关联实体;与一级关联实体具有直接关联关系的为2级关联关系,2级关联关系所对应的实体名称为二级关联实体;以此类推,至得到n级关联关系所对应的实体名称为N级关联实体。

实体扩展单元,配置用于首先显示第一节点、第二节点,第一节点表示实体名称,第二节点表示实体类型,用于实体扩展的操作节点;若触发第二节点后,按照该节点的一级关联实体进行扩展生成第三节点,展示一级关联实体;若触发第三节点,按照该节点的二级关联实体进行扩展生成第四节点,展示二级关联实体;以此类推,至展示出N级关联实体。

权重设置单元,配置用于设置展示权重,所述展示权重包括实体名称首次出现的时间、搜索次数;实体扩展展示单元每次扩展,默认最大节点数为X,如果实际相关节点数大于X,则根据展示权重,选取权重和为前X个相关实体进行展示。本实施例X选取20,当然用户可根据实际需求增大或者减少用于图谱展示的相关节点数,能够为避免关联实体数量太多造成图谱显示不清晰的问题。

本实施例的一种设备,所述设备包括:一个或多个处理器;

存储器,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行上述任一项所述的方法,可将检索结果包括但不限于实体名称、实体类型、关联关系,直观高效的展示给用户,给用户提供全面、直观、可靠的知识服务。用户可在图谱上清晰直观的看出检索目标实体和其他相关实体的关联关系,并可以按照实体名称继续扩展实体类型或者关联关系。

本实施例的一种存储有计算机程序的计算机可读存储介质,该程序被处理器执行时实现上述任一项所述的方法,可将检索结果包括但不限于实体名称、实体类型、关联关系,直观高效的展示给用户,给用户提供全面、直观、可靠的知识服务。用户可在图谱上清晰直观的看出检索目标实体和其他相关实体的关联关系,并可以按照实体名称继续扩展实体类型或者关联关系。进一步介绍如下:

计算机系统包括中央处理单元(CPU)101,其可以根据存储在只读存储器(ROM)102中的程序或者从存储部分加载到随机访问存储器(RAM)103中的程序而执行各种适当的动作和处理。在RAM103 中,还存储有系统操作所需的各种程序和数据。CPU 101、ROM 102以及RAM 103通过总线104彼此相连。输入/输出(I/O)接口105也连接至总线104。

以下部件连接至I/O接口105:包括键盘、鼠标等的输入部分106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分109。通信部分109经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口105。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分108。

特别地,根据本发明的实施例,上文参考流程图1描述的过程可以被实现为计算机软件程序。例如,本发明的实施例1包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)101执行时,执行本申请的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的框图2,图示了按照本发明各种实施例1的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种数据检索与可视化装置,包括:可视化模块、数据处理模块、数据库,其中,这些模块的名称在某种情况下并不构成对该单元本身的限定,例如,可视化模块还可以被描述为“,用于提供搜索入口和显示界面,以供使用者输入检索信息的模块”。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,将所述实体名称、实体类型、关联关系按照预设条件基于第三方图谱可视化组件生成可视化图谱信息,以供通过显示界面进行展示。

例如,所述电子设备可以实现如图1中所示的 :步骤S1:预存储实体名称;步骤S2:提取所述实体名称的实体类型,并基于实体类型获取各实体名称之间的关联关系;步骤S3:接收输入信号;步骤4:判断预存储的实体名称中是否存在与输入信号相匹配的目标实体名称,若有,则获取目标实体名称的实体类型和/或目标实体名称与其他实体名称之间的关联关系;步骤5:将所述实体名称、实体类型、关联关系中至少一个按照预设条件基于第三方组件生成可视化信息。

应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能。

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

相关技术
  • 一种数据检索与可视化方法、装置、设备和存储介质
  • 一种数据检索方法、装置、电子设备以及存储介质
技术分类

06120112941672