掌桥专利:专业的专利平台
掌桥专利
首页

信息的查询方法、电子设备、存储介质及计算机程序产品

文献发布时间:2023-06-19 19:28:50


信息的查询方法、电子设备、存储介质及计算机程序产品

技术领域

本公开特别涉及一种信息的查询方法、电子设备、存储介质及计算机程序产品。

背景技术

在信息的搜索查询过程中,通常对用户的查询指令进行相关的意图理解,进而在数据库中提取名称与查询指令完全匹配的信息作为查询结果,以实现对查询结果的精准呈现。以房产领域的查询场景为例,当用户输入“橡树湾五期”时,相关技术将提取并展示名称为“橡树湾五期”的在售楼盘,以完成对查询指令的响应以及精确查询结果的推送。

但是,相关技术中,只能推送名称与查询指令完全匹配的信息作为查询结果,并不会对查询结果作相关扩充,推送给用户的查询结果中信息的丰富度不够。尤其是在物料的命中数量较少或没有的情况下,会降低用户的查询体验。还是以房产领域的查询场景为例,当用户查询“橡树湾五期”的在售楼盘时,若“橡树湾五期”中无在售楼盘,那么反馈给用户的查询结果则为“无”,那么用户将无法再本次搜索查询中获得有效信息。当然,相关技术对于同样的查询指令,将反馈相同的查询结果,并不会进行个性化排序。

发明内容

本公开提供了一种信息的查询方法、电子设备、存储介质及计算机程序产品。

根据本公开的一个方面提供了一种信息的查询方法,可包括:提取查询指令的核心词,其中所述核心词为所述查询指令中用于指示实体数据的部分;根据所述核心词,确定所述查询指令对应的实体数据;以及在信息数据库中提取对应所述实体数据的多个候选信息作为目标信息,其中所述目标信息包括强相关信息和中相关信息。

在一些实施方式中,所述提取查询指令的核心词,包括:利用正则匹配模块判断所述查询指令是否存在公共后缀,响应于所述查询指令存在所述公共后缀的判断结果,去除所述公共后缀,以在所述查询指令中提取所述核心词。

在一些实施方式中,所述提取查询指令的核心词,包括:在核心词数据库中筛选与所述查询指令相匹配的候选信息,并以所述候选信息的核心词作为所述查询指令的核心词。

在一些实施方式中,在所述在信息数据库中提取对应所述实体数据的多个候选信息作为目标信息之后,包括:判断各个所述目标信息与所述查询指令之间的匹配程度,根据所述匹配程度对所述目标信息进行分类。

在一些实施方式中,所述判断各个所述目标信息与所述查询指令之间的匹配程度,根据所述匹配程度对所述目标信息进行分类,包括:响应于所述目标信息与所述查询指令完全匹配的判断结果,将所述目标信息作为所述强相关信息;和/或响应于所述目标信息与所述查询指令未完全匹配的判断结果,将所述目标信息作为所述中相关信息。

在一些实施方式中,在所述判断各个所述目标信息与所述查询指令之间的匹配程度,根据所述匹配程度对所述目标信息进行分类之后,还包括:对多个所述目标信息进行排序,以获得目标信息序列,其中,在所述目标信息序列中,所述强相关信息位于所述中相关信息之前。

在一些实施方式中,所述对多个所述目标信息进行排序,以获得目标信息序列,包括:根据所述查询指令的查询主体的历史点击数据,确定所述查询主体的点击特征;将所述点击特征与各个所述目标信息进行相似度计算,依相似度降序分别对多个所述强相关信息和多个所述中相关信息进行排序,获得强相关信息序列和中相关信息序列;以及将所述强相关信息序列设置于所述中相关信息序列之前,以形成所述目标信息序列。

根据本公开的另一个方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,以实现如上述任一实施方式所述的信息的查询方法。

根据本公开的又一个方面提供了一种可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如上述任一实施方式所述的信息的查询方法。

根据本公开的再一个方面提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述任一实施方式所述的信息的查询方法。

附图说明

附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。

图1为本公开示例性实施方式的信息的查询方法流程图。

图2为本公开示例性实施方式的目标信息序列的示意图。

图3为本公开示例性实施方式的信息的查询装置框图。

附图标记说明

1000 信息的查询装置

1002 核心词提取模块

1004 实体数据确定模块

1006 目标信息筛选模块

1100 总线

1200 处理器

1300 存储器

1400 其他电路。

具体实施方式

下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分。

需要说明的是,在不冲突的情况下,本公开中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本公开的技术方案。

除非另有说明,否则示出的示例性实施方式/实施例将被理解为提供可以在实践中实施本公开的技术构思的一些方式的各种细节的示例性特征。因此,除非另有说明,否则在不脱离本公开的技术构思的情况下,各种实施方式/实施例的特征可以另外地组合、分离、互换和/或重新布置。

本文使用的术语是为了描述具体实施例的目的,而不是限制性的。如这里所使用的,除非上下文另外清楚地指出,否则单数形式“一个(种、者)”和“所述(该)”也意图包括复数形式。此外,当在本说明书中使用术语“包含”和/或“包括”以及它们的变型时,说明存在所陈述的特征、整体、步骤、操作、部件、组件和/或它们的组,但不排除存在或附加一个或更多个其它特征、整体、步骤、操作、部件、组件和/或它们的组。还要注意的是,如这里使用的,术语“基本上”、“大约”和其它类似的术语被用作近似术语而不用作程度术语,如此,它们被用来解释本领域普通技术人员将认识到的测量值、计算值和/或提供的值的固有偏差。

图1为本公开示例性实施方式的信息的查询方法流程图。下面将结合图1对信息的查询方法S100进行阐述。

步骤S102,提取查询指令的核心词。

其中,查询指令是查询主体发出的用于查询期望信息的指令,查询指令可例如“橡树湾五期”,那么查询主体的期望信息是名称为“橡树湾五期”的相关信息。

核心词是查询指令中用于指示实体数据的部分。以查询指令为“橡树湾五期”为例,那么核心词可为“橡树湾”。

步骤S104,根据核心词,确定查询指令对应的实体数据。

其中,实体数据用于表征查询指令对应的期望信息的属性。当查询指令为小区名称时,实体数据用于表征小区名称的地理属性,包括小区名称、区域名称、城市名称、国家名称等。

以查询指令为“大兴小区”为例,那么核心词为“大兴”,实体数据为小区名称,即表征名称中包含核心词“大兴”的小区;也可为区域名称,即表征“大兴”区域内所有的小区。

查询过程可采用ElasticSearch(ES)索引,ES索引擅长海量数据存储、数据分析以及全文检索查询,能够充分查询具有相同实体数据的目标信息。

步骤S106,在信息数据库中提取对应实体数据的多个候选信息作为目标信息。

其中,信息数据库是存储大量候选信息的数据库,信息数据库可为楼盘信息数据库,其内部可存储有大量的在售楼盘信息。信息数据库可通过网络实时更新。

候选信息是预先存储在信息数据库中的对应有实体数据的信息,当信息数据库为楼盘信息数据库时,候选信息可为在售楼盘信息,每个在售楼盘信息均对应有小区名称、区域名称、城市名称和国家名称等实体数据。以名称为“橡树湾五期”的候选信息为例,那么“橡树湾五期”对应的实体数据为:“橡树湾”小区。

目标信息是信息数据库中与查询指令具有相同实体数据的候选信息。以查询指令为“橡树湾五期”为例,实体数据则为:“橡树湾”小区,那么目标信息可为名称包含“橡树湾”的所有小区,例如“橡树湾一期”、“橡树湾二期”、“橡树湾三期”、“橡树湾四期”和“沈阳橡树湾”。

目标信息根据其与查询指令的匹配程度被划分为强相关信息和中相关信息。强相关信息指的是与查询指令完全匹配的目标信息,也即名称与查询指令完全一致的目标信息;例如查询指令为“橡树湾五期”,那么强相关信息为“橡树湾五期”。中相关信息指的是与查询指令不完全匹配,但是与核心词匹配的目标信息;例如查询指令为“橡树湾五期”,核心词为“橡树湾”,目标信息的名称为“橡树湾一期”,那么该目标信息为中相关信息。

一般来说,强相关信息即为查询指令的期望信息,筛选中相关信息的目的是为了丰富查询结果,避免出现强相关信息数量少或者没有,而造成的查询体验不好的情况。

在一些实施方式中,步骤S102中核心词的具体提取方式可为:利用正则匹配模块判断查询指令是否存在公共后缀,响应于查询指令存在公共后缀的判断结果,去除公共后缀,以在查询指令中提取核心词。

其中,正则匹配模块是执行正则表达式的虚拟模块,用于根据预设的公共后缀规则,对输入的查询指令进行是否存在公共后缀的判断。正则表达式是用于筛选符合某预定规则的文本的一种方式,为常规筛选方式,不再赘述。

公共后缀是候选信息常见的名称后缀,其不能够表征期望信息的属性,例如“一期”、“二期”、“北院”、“南苑”、“北区”和“南区”等。

当查询指令为“橡树湾五期”时,利用正则匹配模块可查询到其具有公共后缀,且公共后缀为“五期”;进一步地,去除公共后缀,以获得核心词“橡树湾”。

当然,查询指令不具有公共后缀时,不进行公共后缀的剔除,直接以查询指令作为核心词。

在一些实施方式中,步骤S102中核心词的具体提取方式还可为:在核心词数据库中筛选与查询指令相匹配的候选信息,并以候选信息的核心词作为查询指令的核心词。

其中,核心词数据库中包含有大量的已进行核心词提取的候选信息,可作为执行离线挖掘的数据支撑。通过离线挖掘的逻辑对输入的查询指令进行核心词的提取,以在核心词数据库中筛选与查询指令相匹配的候选信息,由于该候选信息已存在对应的核心词,那么以该核心词作为查询指令的核心词。

例如,当查询指令为“光华城堒庭”时,那么由于其不具备明显的公共后缀,或者公共后缀没有被正则匹配模块收录,因此可在核心词数据库中查找名称为“光华城堒庭”的候选信息,以其核心词“光华城”为查询指令的核心词。

在一些实施方式中,在步骤S106之后,还包括:判断各个目标信息与查询指令之间的匹配程度,根据匹配程度对目标信息进行分类。

由于目标信息是通过查询指令中的核心词而获得的,因此存在部分目标信息的名称与查询指令一致,而另外部分目标信息的名称仅具有核心词,但是与查询指令不同。此时,需要判断目标信息与查询指令之间的匹配程度,将名称与查询指令完全一致的目标信息作为强相关信息,该强相关信息即为期望信息。其他的目标信息则为中相关信息。

具体地,响应于目标信息与查询指令完全匹配的判断结果,将目标信息作为强相关信息;和/或响应于目标信息与查询指令未完全匹配的判断结果,将目标信息作为中相关信息。

例如,查询指令为“橡树湾五期”,那么强相关信息为“橡树湾五期”,中相关信息为“橡树湾一期”、“橡树湾二期”、“橡树湾三期”和“橡树湾四期”等。

通过对目标信息的分类,便于后面将其呈现给查询主体时,可以依相关程度进行展示,进一步提高查询主体的查询体验。

在一些实施方式中,在判断各个目标信息与查询指令之间的匹配程度,根据匹配程度对目标信息进行分类之后,还包括:对多个目标信息进行排序,以获得目标信息序列。

其中,目标信息序列为根据各个目标信息与查询指令、查询主体的匹配程度展示给查询主体的目标信息列表,其按照匹配程度降序对目标信息进行排列,位于目标信息序列第一位的目标信息的匹配程度最高,位于最后一位的目标信息的匹配程度最低。基于此,在目标信息序列中,强相关信息位于中相关信息之前。

具体地,根据查询指令的查询主体的历史点击数据,确定查询主体的点击特征;将点击特征与各个目标信息进行相似度计算,依相似度降序分别对多个强相关信息和多个中相关信息进行排序,获得强相关信息序列和中相关信息序列;以及将强相关信息序列设置于中相关信息序列之前,以形成目标信息序列。

其中,历史点击数据体现查询主体在历史查询过程中对各种信息的点击情况。

由于不同的查询主体对信息的感兴趣程度不同(点击特征不同),因此在进行目标信息的展示时,属于同一匹配程度的多个目标信息也应进行个性化排序,以匹配不同查询主体的查询需求。

例如,基于历史点击数据,某查询主体的点击特征为低价格房楼

盘,那么在进行中相关信息的排序时,以价格升序对各个中相关信息5进行排序,以使得中相关信息序列为价格升序的排列方式。

图2为本公开示例性实施方式的目标信息序列的示意图100。

如图2所示,当查询指令为“橡树湾五期”时,目标信息序列的第一个目标信息为“橡树湾五期”,且示出了该目标信息的关键数据,

以便查询主体的查询。其余中相关信息,例如“橡树湾二期”、“橡树0湾四期”、“橡树湾三期”和“橡树湾一期”根据查询主体历史点击数

据中的点击特征,进行个性化排序,且位于强相关信息“橡树湾五期”

之后。

本公开的信息的查询方法,利用实体数据为查询指令匹配多个目

标信息,丰富了目标信息的种类,避免了目标信息少或者没有的情况5下,查询主体的查询体验降低的情况。另外,对于根据查询主体的历

史点击数据,为目标信息进行排序,不同的查询主体对应不同的目标信息序列,这种个性化展示方式也更便于查询主体对期望信息的查询,进一步提升了查询主体的查询体验。

图3为本公开示例性实施方式的信息的查询装置框图。

0如图3所示,根据本公开的一个方面提供了一种信息的查询装置1000,可包括:核心词提取模块1002,用于提取查询指令的核心词,其中核心词为查询指令中用于指示实体数据的部分。实体数据确定模块1004,用于根据核心词,确定查询指令对应的实体数据。目标信息

筛选模块1006在信息数据库中提取对应实体数据的多个候选信息作5为目标信息,其中目标信息包括强相关信息和中相关信息。

信息的查询装置1000是为了实现信息的查询方法而设置的,其各个模块用于执行信息的查询方法的各个步骤,具体实现方式和原理可参见上文,不再赘述。

该装置1000可以包括执行上述流程图中各个或几个步骤的相应0模块。因此,可以由相应模块执行上述流程图中的每个步骤或几个步骤,并且该装置可以包括这些模块中的一个或多个模块。模块可以是专门被配置为执行相应步骤的一个或多个硬件模块、或者由被配置为执行相应步骤的处理器来实现、或者存储在计算机可读介质内用于由处理器来实现、或者通过某种组合来实现。

该硬件结构可以利用总线架构来实现。总线架构可以包括任何数量的互连总线和桥接器,这取决于硬件的特定应用和总体设计约束。总线1100将包括一个或多个处理器1200、存储器1300和/或硬件模块的各种电路连接到一起。总线1100还可以将诸如外围设备、电压调节器、功率管理电路、外部天线等的各种其它电路1400连接。

总线1100可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,Peripheral Component)总线或扩展工业标准体系结构(EISA,Extended Industry Standard Component)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,该图中仅用一条连接线表示,但并不表示仅有一根总线或一种类型的总线。

本公开的信息的查询装置,利用实体数据为查询指令匹配多个目标信息,丰富了目标信息的种类,避免了目标信息少或者没有的情况下,查询主体的查询体验降低的情况。另外,对于根据查询主体的历史点击数据,为目标信息进行排序,不同的查询主体对应不同的目标信息序列,这种个性化展示方式也更便于查询主体对期望信息的查询,进一步提升了查询主体的查询体验。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施方式所属技术领域的技术人员所理解。处理器执行上文所描述的各个方法和处理。例如,本公开中的方法实施方式可以被实现为软件程序,其被有形地包含于机器可读介质,例如存储器。在一些实施方式中,软件程序的部分或者全部可以经由存储器和/或通信接口而被载入和/或安装。当软件程序加载到存储器并由处理器执行时,可以执行上文描述的方法中的一个或多个步骤。备选地,在其他实施方式中,处理器可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述方法之一。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,可以具体实现在任何可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。

就本说明书而言,“可读存储介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,可读存储介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在存储器中。

应当理解,本公开的各部分可以用硬件、软件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施方式方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种可读存储介质中,该程序在执行时,包括方法实施方式的步骤之一或其组合。

此外,在本公开各个实施方式中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读存储介质中。存储介质可以是只读存储器,磁盘或光盘等。

本公开还提供了一种电子设备,包括:存储器,存储器存储执行指令;以及处理器或其他硬件模块,处理器或其他硬件模块执行存储器存储的执行指令,使得处理器或其他硬件模块执行上述的方法。

本公开还提供了一种可读存储介质,可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现信息的查询方法,该方法可包括:提取查询指令的核心词,其中核心词为查询指令中用于指示实体数据的部分;根据核心词,确定查询指令对应的实体数据;以及在信息数据库中提取对应实体数据的多个候选信息作为目标信息,其中目标信息包括强相关信息和中相关信息。

本公开还提供了一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现本公开任一个实施方式的信息的查询方法。

在本说明书的描述中,参考术语“一个实施方式/方式”、“一些实施方式/方式”、“具体示例”、或“一些示例”等的描述意指结合该实施方式/方式或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施方式/方式或示例中。在本说明书中,对上述术语的示意性表述不必须是相同的实施方式/方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施方式/方式或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施方式/方式或示例以及不同实施方式/方式或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本公开的范围内。

技术分类

06120115920192