掌桥专利:专业的专利平台
掌桥专利
首页

一种领域模型检索方法、装置、设备及存储介质

文献发布时间:2024-04-18 20:02:18


一种领域模型检索方法、装置、设备及存储介质

技术领域

本发明涉及数据检索技术领域,特别涉及一种领域模型检索方法、装置、设备及存储介质。

背景技术

软件研发的一般流程需要经过:需求分析、架构设计、概要设计、详细设计、编码、测试、上线运维7个主要阶段。程序员会通过引用领域模型开发应用在平台进行测试,最后通过平台提供的运行管理能力完成上线运维的流程。

现有技术中,主要通过精确查询或模糊查询对领域模型检索,精确查询是指使用与数据库某字段的数据值完全一致的文字作为查询条件所进行的查询,模糊查询是指使用数据库某字段的数据值的片段文字作为查询条件所进行的查询。现有技术中,还通过标签辅助检索,即先为数据额外绑定标签,然后根据用户的描述进行数据检索时,采取对标签进行精确/模糊查询获得标签清单,再通过清单上的具体标签关联查询与之绑定的领域模型。但由于用户自然语言描述的多样性,用户描述语言很难与标签和数据库字段完全一致。以需求关键字“添加新菜品”为例,这个关键字的检索期望是“添加菜品”领域函数,但由于需求关键字中多了个“新”字,导致无法与模型的名称/标签对应,进而导致实际检索中无法找到该领域函数。降低了领域函数检索的能力。

发明内容

有鉴于此,本发明的目的在于提供一种领域模型检索方法、装置、设备及存储介质,能够提高领域模型的检索能力和复用率。其具体方案如下:

第一方面,本申请公开了一种领域模型检索方法,包括:

获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表;

若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;

利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。

可选的,所述基于所述需求文本确定检索文本,包括:

将所述需求文本作为所述检索文本;

或,将所述需求文本的关键词作为所述检索文本;

或,以句子为单位对所述需求文本进行切分得到语句清单,将所述语句清单作为所述检索文本。

可选的,所述利用向量模型对所述检索文本进行向量转换得到对应的目标向量,包括:

根据预设文本长度阈值确定所述检索文本的文本类型;所述文本类型包括单词、句子和段落;

利用所述文本类型对应的向量模型对所述检索文本进行向量转换,得到对应的目标向量。

可选的,所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述利用所述文本类型对应的向量模型对所述检索文本进行向量转换,包括:

若所述检索文本为单词,则利用所述词检索嵌入模型将所述检索文本转换为词向量;

若所述检索文本为句子,则利用所述句检索嵌入模型将所述检索文本转换为句向量

若所述检索文本为段落,则利用所述段检索嵌入模型将所述检索文本转换为段向量。

可选的,所述基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型之前,还包括:

获取多个领域模型,并将所述领域模型转换为领域文档;

利用预先特化训练得到的所述向量模型,对所述领域文档进行向量转换得到对应的领域向量;所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述领域向量包括所述词检索嵌入模型输出的词向量、所述句检索嵌入模型输出的句向量、所述段检索嵌入模型输出的段向量;

将所述领域向量和所述领域模型存储至所述向量数据库。

可选的,所述将所述领域模型转换为领域文档,包括:

利用领域函数文档转换模板将所述领域函数转换为第一文档;

利用领域数据库表文档转换模板将所述领域数据表转换为第二文档;

基于所述第一文档和所述第二文档得到所述领域文档。

可选的,所述基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型,包括:

确定所述目标向量的向量类型;所述向量类型包括词向量、句向量、段向量;

若所述目标向量为词向量,则依次比较所述目标向量与向量数据库中的所有词向量的相似度,根据相似度确定出所述需求文本对应的领域模型;

若所述目标向量为句向量,则依次比较所述目标向量与向量数据库中的所有句向量的相似度,根据相似度确定出所述需求文本对应的领域模型;

若所述目标向量为段向量,则依次比较所述目标向量与向量数据库中的所有段向量的相似度,根据相似度确定出所述需求文本对应的领域模型。

第二方面,本申请公开了一种领域模型检索装置,包括:

关键词匹配模块,用于获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表;

检索文本确定模块,用于若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;

向量检索模块,用于利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。

第三方面,本申请公开了一种电子设备,包括:

存储器,用于保存计算机程序;

处理器,用于执行所述计算机程序,以实现前述的领域模型检索方法。

第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中计算机程序被处理器执行时实现前述的领域模型检索方法。

本申请中,获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表;若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。可见,通过向量模型将领域模型进行向量表示建立向量索引,保存在向量数据库中,可以准确地通过自然语言进行语义检索,即用户直接使用需求文本对构建的领域模型进行检索,提高应用开发效率,提高领域模型的检索能力和复用率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请提供的一种领域模型检索方法流程图;

图2为本申请提供的一种具体的领域模型检索方法流程图;

图3为本申请提供的一种具体的领域模型检索系统结构示意图;

图4为本申请提供的一种具体的向量增强辅助检索装置子系统结构示意图;

图5为本申请提供的一种领域模型检索装置结构示意图;

图6为本申请提供的一种电子设备结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

现有技术中,主要通过精确查询或模糊查询对领域模型检索,精确查询是指使用与数据库某字段的数据值完全一致的文字作为查询条件所进行的查询,模糊查询是指使用数据库某字段的数据值的片段文字作为查询条件所进行的查询。现有技术中,还通过标签辅助检索,即先为数据额外绑定标签,然后根据用户的描述进行数据检索时,采取对标签进行精确/模糊查询获得标签清单,再通过清单上的具体标签关联查询与之绑定的领域模型。但由于用户自然语言描述的多样性,用户描述语言很难与标签和数据库字段完全一致。降低了领域函数检索的能力。为克服上述技术问题,本申请提出一种领域模型检索方法,能够提高领域模型的检索能力和复用率。

本申请实施例公开了一种领域模型检索方法,参见图1所示,该方法可以包括以下步骤:

步骤S11:获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表。

首先,获取用户输入的需求文本,即用户使用自然语言输入的针对领域模型的检索需求,获取到需求文本后,通过关键词提取技术提取出需求文本中的关键词,然后利用关键词通过文本检索方式从存储有领域模型的数据库中查询该需求文本对应的领域模型。其中,领域模型包括领域函数和/或领域数据表。

步骤S12:若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本。

如果根据关键词通过文本检索查询到对应的领域模型,则将查询结果输出,以便用户调用相应的领域模型使用。若根据关键词没有匹配到领域模型,则基于需求文本确定检索文本,然后根据确定出的检索文本进行向量检索。

其中,上述基于所述需求文本确定检索文本,可以包括:将所述需求文本作为所述检索文本;或,将所述需求文本的关键词作为所述检索文本;或,以句子为单位对所述需求文本进行切分得到语句清单,将所述语句清单作为所述检索文本。即可以直接根据需求文本进行检索,也可以根据步骤S11中需求文本的关键词进行检索,也可以以句子为单位对需求文本进行切分得到语句清单,根据语句清单进行检索。当然,也可以多种类型同时进行检索,并综合检索结果作为最终检索结果,如针对需求文本为段落时,利用段落进行向量检索,并根据该段落对应的语句清单进行向量检索。即上述基于所述需求文本确定检索文本,可以包括:将所述需求文本作为所述检索文本;和/或,将所述需求文本的关键词作为所述检索文本;和/或,以句子为单位对所述需求文本进行切分得到语句清单,将所述语句清单作为所述检索文本。

步骤S13:利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。

为了实现向量检索,需要预先将领域模型的向量表示存储在向量数据库中,并在确定检索文本后,将检索文本转换为向量,以便通过向量检索方式进行领域模型查询。需要说明的是,若需求文本中包含对领域函数和领域数据表的查询需求,而通过关键词的文本查询匹配出部分结果,则向量查询阶段只需查询没有通过关键词匹配出的需求即可。

其中,所述利用向量模型对所述检索文本进行向量转换得到对应的目标向量,可以包括:根据预设文本长度阈值确定所述检索文本的文本类型;所述文本类型包括单词、句子和段落;利用所述文本类型对应的向量模型对所述检索文本进行向量转换,得到对应的目标向量。即为了提高向量检索的准确性,本实施例中针对单词、句子和段落这三类形式预先训练了对应的向量模型,即预先特化训练得到3个向量模型,分别针对单词、句子和段落进行向量转换,提高转换的精确度。文本类型确定过程具体可以通过设定2个阈值,例如,阈值a和阈值b,阈值a小于阈值b。文本长度不超过a时,认为当前文本是一个单词;文本长度超过a但不超过b时,认为当前文本是一个语句;文本长度超过b时,认为当前文本是一个段落。针对性地根据检索输入内容的长度部署了3种不同的向量模型,有效提高向量检索的准确性。

具体的,上述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,上述利用所述文本类型对应的向量模型对所述检索文本进行向量转换,可以包括:若所述检索文本为单词,则利用所述词检索嵌入模型将所述检索文本转换为词向量;若所述检索文本为句子,则利用所述句检索嵌入模型将所述检索文本转换为句向量若所述检索文本为段落,则利用所述段检索嵌入模型将所述检索文本转换为段向量。

上述基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型之前,还可以包括:获取多个领域模型,并将所述领域模型转换为领域文档;利用预先特化训练得到的所述向量模型,对所述领域文档进行向量转换得到对应的领域向量;所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述领域向量包括所述词检索嵌入模型输出的词向量、所述句检索嵌入模型输出的句向量、所述段检索嵌入模型输出的段向量;将所述领域向量和所述领域模型存储至所述向量数据库。

向量模型(即语言大模型向量空间),用于将自然语言转换为向量Vec。需要注意的是,通过不同训练数据得到向量模型,其所擅长的转换能力不一样。本申请中采用了3种不同的能力的向量模型:词检索嵌入模型(w2p,word2passage),擅长通过单词找到语义近似的段落;句检索嵌入模型(s2p,sentence2passage),擅长通过句子找到语义近似的段落;段检索嵌入模型(p2p,passage2passage),擅长通过段落找到语义近似的段落;转换后同时得到3种不同向量模型的向量Vec。

例如图2所示,使用预设的存储格式进行向量存储即先将领域模型转换为文档形式,然后将文档分别输入至词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,并综合各模型的输出,得到领域模型对应的领域向量,也即领域模型的向量表示,然后将领域向量和领域模型存储至向量数据库。,具体按照数据协议名将领域模型ID、领域模型类型、向量模型代号、领域文档、领域向量Vec以及模型数据保存到向量数据库中,数据协议名由模型类型和向量模型代号组成。

其中,所述将所述领域模型转换为领域文档,可以包括:利用领域函数文档转换模板将所述领域函数转换为第一文档;利用领域数据库表文档转换模板将所述领域数据表转换为第二文档;基于所述第一文档和所述第二文档得到所述领域文档。即根据预先构建的文档转换模板执行领域模型到文档的转换。

具体的,获取多个领域模型以及模型ID,首先将领域模型按照JSON格式进行结构化存储。领域函数对应的JSON格式可以为:“函数中文名”,“函数功能描述”,“函数入参定义”,“函数返参定义”,“函数归属”,“扩展信息”,“无关字段”。领域数据表对应的JSON格式可以为:“数据表中文名”,“数据表功能描述”,“表字段定义”,“数据库表主键”,“数据库表功能描述”,“所属数据库中文名”,“扩展信息”,“无关字段”。

由于JSON格式下存在大量重复的值(key),会对后续向量化造成干扰,故需要将JSON转换为自然语言文档,具体可以使用文档转换模板。领域函数文档转换模板可以为:“函数中文名”是一个使用“函数入参定义”来完成“函数功能描述”的函数,函数执行后会返回“函数返参定义”数据,这个函数属于“函数归属”服务,这个函数需要在“扩展信息”的约束下使用。扩展信息是函数的其他如函数英文名、运行环境、是否幂等等信息。需要注意的是,函数无返参时,函数返参定义所在语句不生成。领域数据库表文档转换模板可以为:“数据表中文名”是一个通过“表字段定义”来保存“数据表功能描述”的数据表,这个数据表属于“所属数据库中文名”,使用“数据库表主键”作为主键,存在“数据库表功能描述”作为外键,需要在“扩展信息”的约束下使用。其中,扩展信息是数据表的其他如数据表英文名、数据表类型、数据库类型等信息。

本实施例中,所述基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型,可以包括:确定所述目标向量的向量类型;所述向量类型包括词向量、句向量、段向量;若所述目标向量为词向量,则依次比较所述目标向量与向量数据库中的所有词向量的相似度,根据相似度确定出所述需求文本对应的领域模型;若所述目标向量为句向量,则依次比较所述目标向量与向量数据库中的所有句向量的相似度,根据相似度确定出所述需求文本对应的领域模型;若所述目标向量为段向量,则依次比较所述目标向量与向量数据库中的所有段向量的相似度,根据相似度确定出所述需求文本对应的领域模型。

根据需求文本的文本类型或向量模型可以确定目标向量的类型,进一步按照预设格式生成查询条件,查询条件基础模板为:<<模型类型,向量模型代号>,进行查询的向量Vec>,其中对模型类型进行设置可针对需要对不同类型领域模型进行查询:若判断描述是单词,则查询条件为<<模型类型,w2p>,向量Vec>;若判断描述是句子,则查询条件为<<模型类型,s2p>,向量Vec>;若判断描述是段落,则查询条件为<<模型类型,p2p>,向量Vec>。由此根据查询条件从向量数据库中查询。查询后可以得到多个查询结果,向查询条件中追加相似性得分阈值,使得查询结果可以得到最多K个最符合的,且相似度得分不低于相似性得分阈值的结果。最后,对查询结果取合集,并提取各结果中的领域模型进行汇总,完成基于向量增强的领域模型辅助检索。

由上可见,本实施例中获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表;若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。可见,通过向量模型将领域模型进行向量表示建立向量索引,保存在向量数据库中,可以准确地通过自然语言进行语义检索,即用户直接使用需求文本对构建的领域模型进行检索,提高应用开发效率,提高领域模型的检索能力和复用率。

相应的,本申请实施例还公开了一种领域模型检索系统,参见图3所示。需求文本,即用自然语言描述的用户需求,是核心算法装置前半的输入数据。还将输入到向量增强辅助检索装置进行增强检索。核心算法装置前半,即原核心算法的前半部分,主要包括对需求文本进行词分析、句分析,并获得领域函数、领域数据表的过程。领域函数1,表示原核心算法装置前半使用分析得出的关键词进行检索得到的领域函数,将参与核心算法装置后半的方案数据整合。领域数据表1,表示原核心算法装置前半使用分析得出的关键词进行检索得到的领域数据表,将参与核心算法装置后半的方案数据整合。未匹配到领域函数的关键词即为原核心算法装置前半使用分析得出的关键词进行检索后,未检索到对应的领域函数的关键词(主要包括动词、谓语等),将输入到向量增强辅助检索装置进行增强检索。未匹配到领域数据表的关键词,即为原核心算法装置前半使用分析得出的关键词进行检索后,无检索到对应的领域数据表的关键词(主要包括名词、主语、宾语等),将输入到向量增强辅助检索装置进行增强检索。

新核心算法装置1是本申请新增的模块,在原有的词分析、句分析的基础上,新增的需求卡片分析装置,装置可以将需求文本以句子为单位切分成语句清单。语句清单是需求文本以句子为单位切分而成的清单,将输入到向量增强辅助检索装置进行增强检索。向量增强辅助检索装置是本申请新增的模块,新核心算法集成的增强检索装置,通过将输入的文本转化为语义向量,并利用向量相似度检索向量数据库并返回相关的领域模型。领域函数2,表征新核心算法使用关键词、语句清单、需求文本进行向量增强检索得到的领域函数,将参与核心算法装置后半的方案数据整合。领域数据表2,表征新核心算法使用关键词、语句清单、需求文本进行向量增强检索得到的领域数据表,将参与核心算法装置后半的方案数据整合。核心算法装置后半是原核心算法的后半部分,将分析得到的领域函数、领域数据表等数据整合并输出方案草稿。

其中,向量增强辅助检索装置子系统结构如图4所示。领域模型为需要导入到检索装置的领域模型。领域文档转化器,用于使用转化模板,将领域模型使用自然语言重新进行描述。领域文档为领域模型使用自然语言重新描述形成的文档。向量转换器用于将文本转换为语义向量的装置,当前子系统内置了3种不同能力的向量模型,能将文本转化为3组不同的向量。向量存储器,用于将领域文档经过向量转换形成的3组向量写入向量数据库的装置。检索文本为进行增强检索时输入的文本。向量相似性查询器,用于使用检索文本经过向量转换形成的3组向量,基于向量相似度查询向量数据库的装置。向量数据库专门用来存储和查询向量。

其中,向量转换器还包括以下组件:词检索嵌入模型:嵌入(Embedding)模型又称向量库,主要用于将文本转换为对应的向量;当前组件是使用<词,段>特化训练得到的向量库,在语义接近的<词语,段落>两组文本中,该组件能得到向量相似度更接近的2组向量。句检索嵌入模型:与词检索嵌入模型类似,在语义接近的<句子,段落>两组文本中,该组件能得到向量相似度更接近的2组向量。段检索嵌入模型:与词检索嵌入模型类似,在语义接近的<段落,段落>两组文本中,该组件能得到向量相似度更接近的2组向量。词向量为文本经过词检索特化向量库转换得到的向量;句向量为文本经过句检索特化向量库转换得到的向量;段向量为文本经过段检索特化向量库转换得到的向量。

通过向量模型将领域模型进行向量表示建立向量索引,保存在向量数据库中,可以准确地通过自然语言进行语义检索,即用户直接使用需求文本对构建的领域模型进行检索,提高应用开发效率,提高领域模型的检索能力和复用率。

相应的,本申请实施例还公开了一种领域模型检索装置,参见图5所示,该装置包括:

关键词匹配模块11,用于获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表;

检索文本确定模块12,用于若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;

向量检索模块13,用于利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。

由上可见,本实施例中获取需求文本,根据所述需求文本的关键词通过文本检索方式查询所述需求文本对应的领域模型;所述领域模型包括领域函数和/或领域数据表;若未查询到所述需求文本对应的领域模型,则基于所述需求文本确定检索文本;利用向量模型对所述检索文本进行向量转换得到对应的目标向量,基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型;所述向量数据库包含领域模型的向量表示数据。可见,通过向量模型将领域模型进行向量表示建立向量索引,保存在向量数据库中,可以准确地通过自然语言进行语义检索,即用户直接使用需求文本对构建的领域模型进行检索,提高应用开发效率,提高领域模型的检索能力和复用率。

在一些具体实施例中,所述检索文本确定模块12具体可以包括:

第一检索文本确定单元,用于将所述需求文本作为所述检索文本;

第二检索文本确定单元,用于将所述需求文本的关键词作为所述检索文本;

第三检索文本确定单元,用于以句子为单位对所述需求文本进行切分得到语句清单,将所述语句清单作为所述检索文本。

在一些具体实施例中,所述向量检索模块13具体可以包括:

文本类型确定单元,用于根据预设文本长度阈值确定所述检索文本的文本类型;所述文本类型包括单词、句子和段落;

向量转换单元,用于利用所述文本类型对应的向量模型对所述检索文本进行向量转换,得到对应的目标向量。

在一些具体实施例中,所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述向量转换单元具体可以包括:

第一向量转换单元,用于若所述检索文本为单词,则利用所述词检索嵌入模型将所述检索文本转换为词向量;

第二向量转换单元,用于若所述检索文本为句子,则利用所述句检索嵌入模型将所述检索文本转换为句向量

第三向量转换单元,用于若所述检索文本为段落,则利用所述段检索嵌入模型将所述检索文本转换为段向量。

在一些具体实施例中,所述领域模型检索装置具体可以包括:

领域模型获取单元,用于在基于所述目标向量通过向量检索方式查询向量数据库,以确定所述需求文本对应的领域模型之前,获取多个领域模型,并将所述领域模型转换为领域文档;

向量转换单元,用于利用预先特化训练得到的所述向量模型,对所述领域文档进行向量转换得到对应的领域向量;所述向量模型包括词检索嵌入模型、句检索嵌入模型、段检索嵌入模型,所述领域向量包括所述词检索嵌入模型输出的词向量、所述句检索嵌入模型输出的句向量、所述段检索嵌入模型输出的段向量;

存储单元,用于将所述领域向量和所述领域模型存储至所述向量数据库。

在一些具体实施例中,所述领域模型获取单元具体可以包括:

第一文档转换单元,用于利用领域函数文档转换模板将所述领域函数转换为第一文档;

第二文档转换单元,用于利用领域数据库表文档转换模板将所述领域数据表转换为第二文档;

领域文档确定单元,用于基于所述第一文档和所述第二文档得到所述领域文档。

在一些具体实施例中,所述向量检索模块13具体可以包括:

向量类型确定单元,用于确定所述目标向量的向量类型;所述向量类型包括词向量、句向量、段向量;

第一向量检索单元,用于若所述目标向量为词向量,则依次比较所述目标向量与向量数据库中的所有词向量的相似度,根据相似度确定出所述需求文本对应的领域模型;

第二向量检索单元,用于若所述目标向量为句向量,则依次比较所述目标向量与向量数据库中的所有句向量的相似度,根据相似度确定出所述需求文本对应的领域模型;

第三向量检索单元,用于若所述目标向量为段向量,则依次比较所述目标向量与向量数据库中的所有段向量的相似度,根据相似度确定出所述需求文本对应的领域模型。

进一步的,本申请实施例还公开了一种电子设备,参见图6所示,图中的内容不能被认为是对本申请的使用范围的任何限制。

图6为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的领域模型检索方法中的相关步骤。

本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。

另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统221、计算机程序222及包括需求文本在内的数据223等,存储方式可以是短暂存储或者永久存储。

其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中海量数据223的运算与处理,其可以是WindowsServer、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的领域模型检索方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。

进一步的,本申请实施例还公开了一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现前述任一实施例公开的领域模型检索方法步骤。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种领域模型检索方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种在线文档检索方法、装置、存储介质及电子设备
  • 一种特征检索方法及装置、存储介质和计算机设备
  • 一种索引数据存储及检索方法、装置及存储介质
  • 一种后端存储设备的管理方法、装置、设备以及存储介质
  • 一种数据存储方法及装置、一种计算设备及存储介质
  • 领域模型的构建方法、装置、存储介质及电子设备
  • 领域模型生成方法、装置、设备以及存储介质
技术分类

06120116583870