掌桥专利:专业的专利平台
掌桥专利
首页

一种模型选择方法及装置

文献发布时间:2024-04-18 20:01:55


一种模型选择方法及装置

技术领域

本说明书涉及数据处理技术领域,尤其涉及一种模型选择方法及装置。

背景技术

随着运算技术的发展,基于自然语言处理和机器学习技术的智能对话系统应运而生,通过对大数据模型的训练,使系统能够模拟人类的语言交流,实现智能对话。

在该智能对话系统中,包含两类模型的训练过程,通用大模型和特殊任务模型,其中,大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义,特殊任务模型是指针对特殊的某一种功能进行优化,在该功能领域具有较强能力的模型,比如代码生成模型和绘图模型等。在应用智能对话系统时,用户输入信息时需要指定模型,输入信息根据用户的指定发送至对应的模型进行处理,降低了应用智能对话系统的效率。

发明内容

为克服相关技术中存在的问题,本说明书提供了一种模型选择方法及装置。

根据本说明书实施例的第一方面,提供了一种模型选择方法,包括:

通过预设接口接收用户发送的请求消息,其中,预设接口的模型参数具有唯一值,请求消息携带有输入信息;

根据输入信息对请求消息进行分类,确定处理请求消息的模型,其中,模型,包含通用模型和特殊任务模型;

将请求消息分配至模型所对应的工作器进行处理,其中,智能对话系统中部署有若干工作器,通用模型和特殊任务模型分别被部署于不同的工作器。

可选的,根据输入信息对请求消息进行分类,确定处理请求消息的模型,包括:

对输入信息进行解析,提取输入信息中所携带的关键词;

根据提取的关键词进行关键词匹配,确定处理请求消息的模型的类型。

进一步的,根据提取的关键词进行关键词匹配,确定处理请求消息的模型,包括:

若提取的关键词包含于关键词表中,则确定处理请求消息的模型为该关键词所对应的特殊任务模型;

若提取的关键词未包含于全部关键词表中,则确定处理请求消息的模型为通用模型。

可选的,根据输入信息对请求消息进行分类,确定处理请求消息的模型,包括:

将输入信息输入到部署的分类模型对请求消息进行分类,确定处理请求消息的模型;

在将请求消息分配至模型所对应的工作器进行处理之后,还包括:

在向预设接口发送与请求消息相对应的反馈消息的过程中,将反馈消息中所携带的模型类型和请求消息中的输入信息输入到分类模型,以对分类模型进行训练。

可选的,将请求消息分配至模型所对应的工作器进行处理,包括:

从若干工作器中确定与模型相对应的至少一个工作器;

将请求消息分配给确定出的至少一个工作器中负载最小的工作器。

根据本说明书实施例的第二方面,提供了一种模型选择装置,包括:

接收单元,用于通过预设接口接收用户发送的请求消息,其中,预设接口的模型参数具有唯一值,请求消息携带有输入信息;

分类单元,用于根据输入信息对请求消息进行分类,确定处理请求消息的模型,其中,模型,包含通用模型和特殊任务模型;

处理单元,用于将请求消息分配至模型所对应的工作器进行处理,其中,智能对话系统中部署有若干工作器,通用模型和特殊任务模型分别被部署于不同的工作器。

可选的,分类单元,包括:

提取模块,用于对输入信息进行解析,提取输入信息中所携带的关键词;

确定模块,用于根据提取的关键词进行关键词匹配,确定处理请求消息的模型的类型。

进一步的,第一提取模块,包括:

第一匹配子模块,用于若提取的关键词包含于关键词表中,则确定处理请求消息的模型为该关键词所对应的特殊任务模型;

第二匹配子模块,用于若提取的关键词未包含于全部关键词表中,则确定处理请求消息的模型为通用模型。

可选的,分类单元,具体用于将输入信息输入到部署的分类模型对请求消息进行分类,确定处理请求消息的模型;

该装置,还包括:

训练单元,用于在向预设接口发送与请求消息相对应的反馈消息的过程中,将反馈消息中所携带的模型类型和请求消息中的输入信息输入到分类模型,以对分类模型进行训练。

可选的,处理单元,包括:

选择模块,用于从若干工作器中确定与模型相对应的至少一个工作器;

分配模块,用于将请求消息分配给确定出的至少一个工作器中负载最小的工作器。

根据本说明书实施例的第三方面,提供了一种服务器,包括收发器、处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现上述任一项所述的方法步骤。

根据本说明书实施例的第四方面,提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现上述任一项所述的方法步骤。

本说明书的实施例提供的技术方案可以包括以下有益效果:

本说明书实施例中,通过向用户提供唯一值的模型参数的接口,接收用户发送的请求消息,根据请求消息中的输入信息对请求消息进行分类,以将请求消息传送到与分类结果的类型相对应的工作器进行处理,使得用户在与智能对话系统进行互动时,通过请求消息中携带的输入信息确定输入的模型所对应的工作器,提升了智能对话系统的对话处理效率。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。

图1是本申请所涉及的一种模型选择方法的流程图;

图2是本申请一实施方式所涉及的一种模型选择方法中智能对话系统的结构示意图;

图3是本申请一实施方式所涉及的一种模型选择方法中智能对话系统的结构示意图;

图4是本申请一实施方式所涉及的一种模型选择方法中智能对话系统的结构示意图;

图5是本申请所涉及的一种模型选择装置的结构示意图;

图6是本申请所涉及的一种服务器的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。

在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

本申请提供了一种模型选择方法,如图1所示,包括:

S100、通过预设接口接收用户发送的请求消息。

该方法可以应用于智能对话系统,如图2所示,智能对话系统可以是由一台服务器或一个服务器集群提供服务。智能对话系统可以被划分为前端和后台,前端用于向用户提供UI(用户接口,User Interface)界面,获取用户所输入信息,并形成请求消息,请求消息携带有输入信息,在后台形成有若干虚拟实例对外提供运算等功能。该虚拟实例在形成时被配置有标识,在每一个虚拟实例上部署有模型。模型可以包含通用模型和特殊任务模型,相对应的,该模型的类型可以包含有通用模型和特殊任务模型。一般来说,在一个智能对话系统中,可以包含一个通用模型和若干特殊任务模型,当然,具体的模型设置可以根据实际需求设置,对此不做限制。

前端通过调用预设接口与后台交互消息,比如前端向后台发送请求消息,并从后台接收反馈消息。该预设接口配置有若干参数,比如,模型参数、角色参数、用户参数等,此处,为了使用户无需对模型类型进行感知,在预设接口上将模型参数设置为唯一值,该唯一值使得后台在接收到请求消息时不通过模型参数来进行用户选择模型的区分。以图2为例,在后台可以设置有门控(Gating)和虚拟实例,其中,虚拟实例也可以表现为工作器(worker),智能对话系统在形成时,可以创建若干工作器,并为这些工作器分配运算资源,智能对话系统可以对工作器的运算资源的使用状态进行监测。每一个工作器在创建时被配置有一个工作器标识。工作器和门控可以通过容器技术或者虚拟技术形成于服务器或服务器集群中,对此不做限制,工作器和门控等之间可以通过接口的调用实现数据的传输。

通用模型和特殊任务模型分别被部署于不同的工作器。智能对话系统可以通过工作器标识和部署的模型的类型确定出工作器和模型的对应关系。

该虚拟实例分为三组,一组部署通用模型,也可以称为大语言模型,另外两组部署特殊任务模型,分为特殊任务模型1和特殊任务模型2,特殊任务模型1可以用于进行代码生成,特殊任务模型2可以用于其他业务。

也就是说,在通过预设接口接收到请求消息后,由于该预设接口的模型参数具有唯一值,用户在UI(用户界面,User Interface)上编辑输入信息时,无需进行模型类型的选择。

在接收到请求消息后,对该请求消息进行解析,获取其中所携带的输入信息,该输入信息中包含但不限于用户在UI上所填写的信息,比如,输入信息可以是“编写一个功能,这个功能能够将两个列表形成一个列表,实现两个列表中的元素交替出现”。

S101、根据输入信息对请求消息进行分类,确定处理请求消息的模型。

在获取到输入信息后,后台可以对该输入信息进行分解和重组,并通过分析的方式确定出该输入信息所表达的语义,这些被确定出的语义可以被称为关键词。这里可以采用当前常见的智能对话系统的语义分析方式,对此不做限制,能够确认出用户的输入信息的语义即可。

在获知输入信息的语义后,可以通过调用门控根据输入信息的语义进行分类,来确定请求消息所需求的模型。比如,门控可以根据输入信息的语义与为每一个模型所分配的关键词表进行匹配,以确定出输入信息所对应的模型,或者,也可以为门控配置一个分类神经网络,通过输入信息以及反馈消息中所携带的模型类型进行训练,从而使得后续向分类神经网络导入输入信息时能够确定出该输入信息所对应的模型类型,当然,在进行分类时还可以包含其他方式,对此不做限制。

S102、将请求消息分配至模型所对应的工作器进行处理。

在门控根据输入信息确定出请求消息对应的模型后,将该请求消息输入到确定出的模型进行处理。如图2所示的智能对话系统中,经过门控对请求消息进行分类,确定“编写”和“实现”等关键词,确定特殊任务模型1能够对应到这些关键词,将该请求消息分配到特殊任务模型1所对应的工作器中进行处理。

通过向用户提供唯一的模型参数的接口,接收用户发送的请求消息,根据请求消息中的输入信息对请求消息进行分类,以将请求消息传送到与分类结果的类型相对应的工作器进行处理,使得用户在与智能对话系统进行互动时,通过请求消息中携带的输入信息确定输入的模型所对应的工作器,提升了应用智能对话系统的效率。

为了能够提升多个工作器的并行处理效率,可选的,步骤S102、将请求消息分配至模型所对应的工作器进行处理,包括:

S1020、从若干工作器中确定与模型相对应的至少一个工作器。

S1021、将所述请求消息分配给确定出的至少一个工作器中负载最小的工作器。

在门控确定请求消息的分类后,可以根据模型类型确定出能够被分配的工作器的工作器标识,被部署了相同模型的工作器可以被称为一个工作器组。

如图2所示,工作器1至工作器4被部署了通用模型,工作器5、工作器6被部署了特殊任务模型1,工作器7、工作器8被部署了特殊任务模型2。

在通过门控确定需要将请求消息分配到特殊任务模型1后,智能对话系统可以根据模型的类型与工作器标识的对应关系,确定出本次的请求消息需要被分配到工作器5或工作器6上。

在智能对话系统确认出工作器5和工作器6运算资源的使用状态后,可以确定出工作器5当前的负载较小,确定本次的请求消息应该被分配到工作器5上进行处理。

当然,如果在部署模型时,一个类型的模型只部署到了一个工作器上,则该唯一的工作器就可以理解为是负载最小的工作器。

通过上述方式,可以实现工作器之间的负载分担,以提升智能对话系统对请求消息的处理效率。

可选的,步骤S101,根据输入信息对请求消息进行分类,确定处理请求消息的模型,包括:

S1010、对输入信息进行解析,提取输入信息中所携带的关键词。

S1011、根据提取的关键词进行关键词匹配,确定处理请求消息的模型的类型。

在后台接收到请求消息后,根据输入信息进行分解和重组等操作,获取到输入信息中的字、词和短语等,这些字、词和短语中的部分即指输入信息中的关键词,通过组合能够确定出该输入信息所表达的语义。需要说明的是,在输入信息中关键词的总量会少于输入信息中全部字、词和短语。

在后台中,可以预先设置有与若干特殊任务模型的关键词表,该关键词表中包含有若干关键词。智能对话系统可以根据提取到的关键词在关键词表中进行查找,并确定提取的关键词是否能够匹配到关键词表,来确定包含这些关键词的请求消息所对应的模型的类型。

具体而言,步骤S1011,根据提取的关键词进行关键词匹配,确定处理请求消息的模型,包括:

S1011A、若提取的关键词包含于关键词表中的关键词,则确定处理请求消息的模型为该关键词所对应的特殊任务模型。

如图2所示的情况下,特殊任务模型1对应于关键词表1,特殊任务模型2对应于关键词表2,其中,在关键词表1中包含有关键词“编写”和“实现”,可以确定本次的请求消息应该匹配到特殊任务模型1。后续,可以将该请求消息输入到部署特殊任务模型1的工作器(比如工作器5),在处理后将结果携带在反馈消息中,通过预设接口发送回用户。

S1011B、若提取的关键词未包含于全部关键词表中,则确定处理请求消息的模型为通用模型。

如图3所示,若另一个请求消息中包含有关键词“撰写”和“方案”,通过这两个关键词在关键词表1和关键词表2进行查找,在这两个关键词表中无法匹配到这两个关键词。此时,后台可以需要将本次请求消息输入到通用模型进行处理,通过通用模型对请求消息进行处理。

可选的,可选的,步骤S101、根据输入信息对请求消息进行分类,确定处理请求消息的模型,包括:

S1012、将输入信息输入到部署的分类模型对请求消息进行分类,确定处理请求消息的模型。

如图4所示,在后台中,门控可以是以功能模块的形式设置,在该门控中可以预先部署有一分类模型,在请求消息分类时,可以在解析出输入信息后,将输入信息输入到分类模型中进行分类,从而确定处理请求消息的模型。该分类模型可以认为是分类神经网络,该分类神经网络可以通过模型训练提升请求消息分类的准确性。

在步骤S102、将请求消息分配至模型所对应的工作器进行处理之后,还包括:

S103、在向预设接口发送与请求消息相对应的反馈消息的过程中,将反馈消息中所携带的模型类型和请求消息中的输入信息输入到分类模型,以对分类模型进行训练。

在后台对一个请求消息进行处理后,生成反馈消息,通过预设接口将反馈消息发送至用户,以在前端显示处理结果。在该反馈消息中除了结果外,还可以包含输入信息以及处理本次请求消息的模型的类型。

在门控接收到反馈消息后,可以清洗掉反馈消息中所携带的结果,通过输入信息和模型的类型进行分类模型的训练,从而使分类模型能够进一步提升请求消息分类的可靠性。

相对应的,本申请还提供了一种模型选择装置,如图5所示,包括:

接收单元,用于通过预设接口接收用户发送的请求消息,其中,预设接口具有唯一的模型参数,请求消息携带有输入信息;

分类单元,用于根据输入信息对请求消息进行分类,确定处理请求消息的模型,其中,模型,包含通用模型和特殊任务模型;

处理单元,用于将请求消息分配至模型所对应的工作器进行处理,其中,智能对话系统中部署有若干工作器,通用模型和所述特殊任务模型分别被部署于不同的工作器。

可选的,分类单元,包括:

提取模块,用于对输入信息进行解析,提取输入信息中所携带的关键词;

确定模块,用于根据提取的关键词进行关键词匹配,确定处理请求消息的模型的类型。

可选的,第一提取模块,包括:

第一匹配子模块,用于若提取的关键词包含于关键词表中,则确定处理请求消息的模型为该关键词所对应的特殊任务模型;

第二匹配子模块,用于若提取的关键词未包含于全部关键词表中,则确定处理请求消息的模型为通用模型。

可选的,分类单元,具体用于将输入信息输入到部署的分类模型对请求消息进行分类,确定处理请求消息的模型;

该装置,还包括:

训练单元,用于在向预设接口发送与请求消息相对应的反馈消息的过程中,将反馈消息中所携带的模型类型和请求消息中的输入信息输入到分类模型,以对分类模型进行训练。

可选的,处理单元,包括:

选择模块,用于从若干工作器中确定与模型相对应的至少一个工作器;

分配模块,用于将请求消息分配给确定出的至少一个工作器中负载最小的工作器。

相对应的,本申请还提供了一种网络设备,包括收发器、处理器和机器可读存储介质,机器可读存储介质存储有能够被处理器执行的机器可执行指令,处理器被机器可执行指令促使:实现上述任一项的方法步骤。

相对应的,本申请还提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,机器可执行指令促使处理器:实现上述任一项的方法步骤。

本说明书的实施例提供的技术方案可以包括以下有益效果:

本说明书实施例中,通过向用户提供唯一值的模型参数的接口,接收用户发送的请求消息,根据请求消息中的输入信息对请求消息进行分类,以将请求消息传送到与分类结果的类型相对应的工作器进行处理,使得用户在与智能对话系统进行互动时,通过请求消息中携带的输入信息确定输入的模型所对应的工作器,提升了智能对话系统的对话处理效率。

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的真正范围和精神由下面的权利要求指出。

应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。

以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

相关技术
  • 麦克纳姆轮小辊轮安装机构、麦克纳姆轮
  • 麦克纳姆轮车的控制方法和麦克纳姆轮车
技术分类

06120116570873