掌桥专利:专业的专利平台
掌桥专利
首页

一种信息处理方法、装置、电子设备及存储介质

文献发布时间:2024-04-18 19:52:40


一种信息处理方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机技术领域,具体而言,涉及一种信息处理方法、装置、电子设备及存储介质。

背景技术

目前,用户可以在不同平台进行内容创作,随着人工智能发展,可以利用人工智能生成内容(AI Generated Content,AIGC)技术来快速生成所需内容,但是相关技术中,针对不同类型的内容创作,用户需要使用不同的创作工具,效率较低。

发明内容

本公开实施例至少提供一种信息处理方法、装置、电子设备及存储介质。

第一方面,本公开实施例提供了一种信息处理方法,包括:

获取输入的待处理语句;

对所述待处理语句进行意图识别,确定所述待处理语句的目标意图类别,其中不同意图类别表征处理所述待处理语句的功能需求;

根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型,并根据所述目标功能模型,确定所述待处理语句的处理回复结果,其中,不同功能模型用于实现不同的功能,所述目标功能模型所实现的功能与所述目标意图类别的功能需求匹配。

第二方面,本公开实施例还提供一种信息处理装置,包括:

获取模块,用于获取输入的待处理语句;

第一确定模块,用于对所述待处理语句进行意图识别,确定所述待处理语句的目标意图类别,其中不同意图类别表征处理所述待处理语句的功能需求;

第二确定模块,用于根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型,并根据所述目标功能模型,确定所述待处理语句的处理回复结果,其中,不同功能模型用于实现不同的功能,所述目标功能模型所实现的功能与所述目标意图类别的功能需求匹配。

第三方面,本公开可选实现方式还提供一种电子设备,包括处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述处理器执行上述第一方面中任一种可能的实施方式中的步骤。

第四方面,本公开可选实现方式还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面,中任一种可能的实施方式中的步骤。

本公开实施例中,获取输入的待处理语句;对所述待处理语句进行意图识别,确定所述待处理语句的目标意图类别;根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型,并根据所述目标功能模型,确定所述待处理语句的处理回复结果,这样,连接多个不同功能模型,通过识别待处理语句的目标意图类别,可以使用对应的目标功能模型进行处理,使得用户只需通过一个交互接口输入信息,就可以返回多模态、多功能的处理回复结果,而不需要切换不同功能交互接口,提高了效率,并且提升了用户体验。

关于上述信息处理装置、电子设备、及计算机可读存储介质的效果描述参见上述信息处理方法的说明,这里不再赘述。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开的技术方案。

为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种信息处理方法的流程图;

图2示出了本公开实施例所提供的板块识别模型的原理示意图;

图3示出了本公开实施例所提供的信息处理方法的实现原理示意图;

图4示出了本公开实施例所提供的第一意图识别模型的原理示意图;

图5示出了本公开实施例所提供的第二意图识别模型的训练原理示意图;

图6示出了本公开实施例所提供的文本生成模型的原理示意图;

图7示出了本公开实施例所提供的文本生成模型的训练原理示意图;

图8示出了本公开实施例所提供的图片生成模型的原理示意图;

图9示出了本公开实施例所提供的板块识别模型的原理示意图;

图10示出了本公开实施例所提供的另一种信息处理方法的流程图;

图11示出了本公开实施例所提供的一种文本生成界面示例图;

图12示出了本公开实施例所提供的一种图片生成界面示例图;

图13示出了本公开实施例所提供的一种板块识别界面示例图;

图14示出了本公开实施例所提供的一种信息处理装置的示意图;

图15示出了本公开实施例所提供的另一种信息处理装置的示意图;

图16示出了本公开实施例所提供的一种电子设备的示意图。

具体实施方式

可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。

为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。

经研究发现,随着人工智能发展,目前人工智能生成内容(AI GeneratedContent,AIGC)技术领域也快速发展和一些实用性的功能落地,利用AIGC技术可以快速生成所需内容,但是相关技术中,针对不同类型的内容创作,用户需要使用不同的创作工具,效率较低。

基于上述研究,本公开提供了一种信息处理方法,获取输入的待处理语句;对待处理语句进行意图识别,确定待处理语句的目标意图类别;根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型,并根据目标功能模型,确定待处理语句的处理回复结果,这样,连接多个不同功能模型,通过识别输入的待处理语句的目标意图类别,就可以使用对应的目标功能模型进行处理以返回相应的处理回复结果,使得用户只需通过一个交互接口输入信息,可以获得多模态、多功能的处理回复结果,不需要切换不同功能交互接口,提高了效率。

针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

为便于对本实施例进行理解,首先对本公开实施例所公开的一种信息处理方法进行详细介绍,本公开实施例所提供的信息处理方法的执行主体一般为具有一定计算能力的电子设备,该电子设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、蜂窝电话、无绳电话、个人数字助理(PersonalDigital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等,其中,个人数字助理是一种手持式电子设备,具有电子计算机的某些功能,可以用来管理个人信息,也可以上网浏览,收发电子邮件等,一般不配备键盘,也可以称为掌上电脑。在一些可能的实现方式中,该信息处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

下面以执行主体为服务器为例对本公开实施例提供的信息处理方法加以说明。参见图1所示,为本公开实施例提供的一种信息处理方法的流程图,该方法包括:

S101:获取输入的待处理语句。

其中,用户可以通过输入法手动输入,或者语音输入该待处理语句,本公开实施例中并不进行限制。本公开实施例中,可以适用于内容创作场景,例如文章创作、图片创作等,可以根据用户输入的文本语句描述信息,自动生成文章或图片,当然也可以适用于搜索场景或问答对话场景等,本公开实施例中并不进行限制。

并且,本公开实施例中,在面向用户的应用侧可以提供一个统一的交互接口,针对不同的场景需求,用户都可以通过该交互接口输入待处理语句,进而可以自动识别不同的意图类别,返回不同的多模态结果,而不需要用户切换不同场景或功能的入口再输入,提高了效率。

S102:对待处理语句进行意图识别,确定待处理语句的目标意图类别,其中不同意图类别表征处理待处理语句的功能需求。

针对该步骤S102,本公开提供了几种可能的实施方式:

一种可能的实施方式中,执行该步骤S102,对待处理语句进行意图识别,确定待处理语句的目标意图类别,包括:

1)基于第一意图识别模型,以待处理语句为输入,对待处理语句进行编码,获得待处理语句的第一目标特征编码向量。

其中,第一意图识别模型可以是基于未标注的词语训练样本进行无监督训练获得的,可以用于进行特征编码。

这样,将待处理语句输入第一意图识别模型,获得待处理语句的第一目标特征编码向量,另外由于待处理语句可能是一个长文本,在进行编码时,可以先对待处理语句进行分词,然后针对每个分词进行编码,最终根据每个分词的特征编码向量,获得整个待处理语句的第一目标特征编码向量。

2)获得各预设意图类别的特征编码向量,其中,各预设意图类别的特征编码向量是基于第一意图识别模型,对各预设意图类别下的目标词进行编码后获得的。

本公开实施例中,为提高效率,可以预先基于第一意图识别模型,获得各预设意图类别的特征编码向量,具体地,(1)确定各预设意图类别下的目标词,例如,预设意图类别包括文本生成意图类别、图片生成意图类别、板块搜索意图类别和对话聊天意图类别,其中,文本生成意图类别下的目标词包括文本生成、内容生成、文字生成、文字创作、写作等,图片生成意图类别下的目标词包括图片生成、画图、画画、图片制作等,板块搜索意图类别下的目标词包括板块咨询、功能检索、功能咨询等,对话聊天意图类别下的目标词包括聊天、无意义、对话等。(2)然后基于第一意图识别模型对目标词进行编码,将每个预设意图类别下的目标词的特征编码向量进行加权平均,可以获得每个预设意图类别对应的特征编码向量。

当然,本公开实施例中,对于预设意图类别并不进行限制,还可以根据需求而预设其它不同的意图类别,并且对于意图类别下的目标词,也不进行限制,可以根据经验和实际情况而进行筛选获得。

3)确定第一目标特征编码向量,分别与各预设意图类别的特征编码向量之间的向量距离。

4)根据确定出的各向量距离,筛选出最小的向量距离,并将筛选出的向量距离对应的预设意图类别,确定为待处理语句的目标意图类别。

另外本公开实施例中,还提供了一种可能的实施方式,获得每个预设意图类别下的目标词的特征编码向量,进而在针对待处理语句进行编码时,获得待处理语句的每个分词的特征编码向量,将待处理语句的每个分词的特征编码向量和每个预设意图类别下的目标词的特征编码向量,进行向量距离判断,从而确定出向量距离最小的所对应的预设意图类别,即为待处理语句的目标意图类别。

即本公开实施例中,可以基于无监督训练的第一意图识别模型,通过编码后的向量距离的判断,从而确定出待处理语句的目标意图类别,实现无监督意图识别方案,无需预先标注训练样本,提高了效率。

另一种可能的实施方式中,执行该步骤S102,对待处理语句进行意图识别,确定待处理语句的目标意图类别,包括:

1)基于第二意图识别模型,以待处理语句为输入,通过第二意图识别模型的编码器,获得待处理语句的第二目标特征编码向量,其中,第二意图识别模型是根据标注有意图类别标签的语句样本集进行训练后获得的。

2)通过第二意图识别模型的分类器,根据第二目标特征编码向量,确定待处理语句的目标意图类别。

本公开中该实施方式中,主要实现了有监督意图识别方案,根据标注有意图类别标签的语句样本集,进行训练获得第二意图识别模型,进而将待处理语句输入该第二意图识别模块,即可以获得待处理语句的目标意图类别,提高了准确性,并且可适用场景更灵活。

S103:根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型,并根据目标功能模型,确定待处理语句的处理回复结果,其中,不同功能模型用于实现不同的功能,目标功能模型所实现的功能与目标意图类别的功能需求匹配。

执行该步骤S103时,本公开提供了可能的实施方式,具体包括:

S1、根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型。

本公开实施例中,可以连接用于实现不同功能的功能模型,通过意图识别,确定匹配的目标功能模型,进而可以使用该目标功能模型进行后续处理。

例如,功能模型包括文本生成模型、图片生成模型、板块识别模型等,其分别对应意图类别为文本生成意图类别、图片生成意图类别、板块搜索意图类别。当然也可以根据所需提供的能力,而连接其它的功能模型,本公开实施例中并不进行限制。

具体针对确定目标意图类别匹配的目标功能模型,本公开提供了几种可能的实施方式:

1)在目标意图类别为文本生成意图类别的情况下,确定目标意图类别匹配的目标功能模型为文本生成模型。

例如,待处理语句为:给我生成一篇关于夏天的500字作文,确定该待处理语句的目标意图类别为文本生成意图类别,则确定对应的目标功能模型为文本生成模型。

其中,文本生成模型是分别基于模糊文本样本集进行训练、基于标注有质量标签的文本样本集训练、对话文本样本对集进行训练后获得的;并且该文本生成模型可以为生成式模型,本公开实施例中并不进行限制。

2)在目标意图类别为图片生成意图类别的情况下,确定目标意图类别匹配的目标功能模型为图片生成模型。

其中,图片生成模型是根据标注有文本标签的图片样本集进行训练后获得的,该图片生成模型用于基于文本生成图片。

例如,待处理语句为:给我画一只猫,需要毕加索风格,色彩明亮一些,通过意图识别,确定该待处理语句的目标意图类别为图片生成意图类别,则确定对应的目标功能模型为图片生成模型。

3)在目标意图类别为板块搜索意图类别的情况下,确定目标意图类别匹配的目标功能模型为板块识别模型。

其中,板块识别模型用于识别所需搜索的板块,板块即可以了解为功能板块,表示所提供的用于实现不同功能的功能区。例如,待处理语句为:哪个板块可以看到话题挖掘,确定该待处理语句的目标意图类别为板块搜索意图类别,则确定对应的目标功能模型为板块识别模型。

S2、根据目标功能模型,确定待处理语句的处理回复结果。

本公开实施例中,根据不同的目标功能模型,即可以相应地确定待处理语句的不同的处理回复结果。

本公开实施例中,针对用户输入的待处理语句,基于不同的目标意图类别和匹配的目标功能模型,即可以返回相应的处理回复结果,例如,在目标意图类别为文本生成意图类别情况下,基于文本生成模型返回的处理回复结果即为文本生成结果,又例如,在目标意图类别为图片生成意图类别情况下,基于图片生成模型返回的处理回复结果即为图片生成结果,又例如,在目标意图类别为板块搜索意图类别情况下,基于板块识别模块返回的处理回复结果即为目标板块的目标板块名称和/或地址链接信息。

本公开实施例中,获取输入的待处理语句,对待处理语句进行意图识别,确定待处理语句的目标意图类别,进而根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型,并根据目标功能模型,确定待处理语句的处理回复结果,这样,将多个功能模型进行连接,通过意图识别可以使用相应的目标功能模型进行处理,用户只需在一个统一的交互接口输入待处理语句,即可以将待处理语句自动连接到相应的目标功能模型进行处理,可以实现通过一个交互接口即可使用户获得多模态多功能的返回结果,提高了效率,也提升了用户体验。

基于上述实施例,针对上述实施例中步骤S103中根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型,并根据目标功能模型,确定待处理语句的处理回复结果,具体本公开提供了几种可能的实施方式:

1)一种可能实施例中,目标功能模型为文本生成模型,则具体包括:在目标意图类别为文本生成意图类别的情况下,根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型为文本生成模型;基于训练后的文本生成模型,对待处理语句进行语义分析,生成待处理语句的文本生成结果。

2)一种可能实施例中,目标功能模型为图片生成模型,则具体包括:在目标意图类别为图片生成意图类别的情况下,根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型为图片生成模型,其中,图片生成模型是根据标注有文本标签的图片样本集进行训练后获得的;基于训练后的图片生成模型,对待处理语句进行语义分析,获得待处理语句的文本特征,并根据文本特征,获得文本特征关联的图像特征,根据图像特征生成待处理语句的图片生成结果。

3)一种可能实施例中,在目标功能模型为板块识别模型情况下,则根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型,并根据目标功能模型,确定待处理语句的处理回复结果,包括:在目标意图类别为板块搜索意图类别的情况下,根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型为板块识别模型;基于训练后的板块识别模型,对待处理语句进行编码,获得待处理语句的第三目标特征编码向量,并基于板块识别模型,对各板块的功能介绍信息进行编码,获得各板块的特征编码向量,其中,各板块表示所提供的用于实现不同功能的功能区;根据第三目标特征编码向量与各板块的特征编码向量,确定与待处理语句匹配的目标板块;获得目标板块的地址链接信息和/或目标板块名称,根据目标板块名称和/或地址链接信息,确定待处理语句的处理回复结果。

例如,参阅图2所示,为本公开实施例中板块识别模型的原理示意图,如图2所示,本公开实施例中平台所提供的功能板块有k个,分别为板块1、板块2、板块3、…板块k,基于板块识别模型分别对板块1、板块2、板块3、…板块k的功能介绍信息进行编码,并且对待处理语句进行编码,进而将待处理语句编码后的第三目标特征编码向量,分别与板块1、板块2、板块3、…板块k对应的特征编码向量进行向量距离判断,确定出向量距离符合条件的所对应的板块,例如该条件为向量距离最小或者向量距离小于等于预设阈值等,即是与待处理语句匹配的目标板块,进而可以获取该目标板块的目标板块名称和地址链接信息,可以向用户返回目标板块的目标板块名称和地址链接信息。

这样,本公开实施例中,可以对用户的板块搜索需求进行识别分析,并返回相应的目标板块名称和地址链接信息,从而可以实现将用户快速有效地导流到目标板块上,也提升用户的搜索效率和使用体验。

进一步地,为了进一步提高准确性,在确定目标意图类别匹配的目标功能模型之后,在根据目标功能模型,确定待处理语句的处理回复结果之前,可以基于不同目标功能模型,对输入到该目标功能模型的待处理语句进行文本转换,以更符合该目标功能模型的要求,提高回复准确性,具体地,本公开提供了可能的实施方式:获得目标功能模型对应的目标优化引导语句,其中,目标优化引导语句用于指示语句优化要求;根据目标优化引导语句,对待处理语句进行优化,获得待处理语句优化后的目标语句,以将目标语句输入目标功能模型,确定处理回复结果。

基于此,针对确定处理回复结果的方式,本公开还提供了几种可能的实施方式:

一种可能的实施方式中,在目标功能模型为图片生成模型情况下,为了进一步提高准确性,还可以先对待处理语句进行文本转换,将待处理语句转换为符合图片生成模型的输入条件的输入语句,然后再输入图片生成模型以获得图片生成结果,则该实施例中,获得目标功能模型对应的目标优化引导语句,根据目标优化引导语句,对待处理语句进行优化,获得待处理语句优化后的目标语句,以将目标语句输入目标功能模型,确定处理回复结果,具体包括:

在确定目标功能模型为图片生成模型的情况下,获得图片生成模型对应的第一优化引导语句,其中,第一优化引导语句用于指示进行图片内容和图片风格提取;将第一优化引导语句和待处理语句,输入第一文本理解模型,根据第一优化引导语句,从待处理语句中提取所关联的图片内容文本信息和图片风格文本信息,并根据图片内容文本信息和图片风格文本信息,获得待处理语句转换后的第一目标语句,以将第一目标语句输入基于训练后的图片生成模型,生成图片生成结果。

其中,可以将待处理语句和第一优化引导语句按照一定顺序或格式组合起来,然后输入第一文本理解模型,例如,在待处理语句前置固定的第一优化引导语句。

例如,第一优化引导语句为:“提取画作的内容和风格:”,待处理语句为:“帮我画一只毕加索风格的猫”,则第一文本理解模型的输入即为“提取画作的内容和风格:帮我画一只毕加索风格的猫”,进而第一文本理解模型,根据第一优化引导语句的指示,从“帮我画一只毕加索风格的猫”提取图片内容文本信息和图片风格文本信息,可以输出第一目标语句,例如为“一个毕加索风格的猫”。

又例如,待处理语句为:“画一幅画:赛博朋克风格的特斯拉实验室,要科幻效果”,则第一文本理解模型的输入即为“提取画作的内容和风格:画一幅画:赛博朋克风格的特斯拉实验室,要科幻效果”,进而第一文本理解模型,根据第一优化引导语句的指示,提取图片内容文本信息和图片风格文本信息,可以输出第一目标语句,如“科幻和赛博朋克风格的特斯拉实验室”。

这样,本公开实施例中,通过第一优化引导语句和第一文本理解模型,对待处理语句进行转换,可以去除待处理语句中对于图片描述无意义的信息,进而可以将待处理语句转换为对于图片生成模型更加友好的第一目标语句,从而将第一目标语句输入图片生成模型,基于图像生成模型对第一目标语句进行语义分析,生成对应的图片生成结果,可以提高图片生成模型生成图片的准确性和处理效率。

一种可能实施例中,在目标功能模型为板块识别模型情况下,为了进一步提高准确性,也可以先将待处理语句转换为符合板块识别模型的输入条件的输入语句,然后再输入板块识别模型,则该实施例中,获得目标功能模型对应的目标优化引导语句,根据目标优化引导语句,对待处理语句进行优化,获得待处理语句优化后的目标语句,以将目标语句输入目标功能模型,确定处理回复结果,具体包括:在确定目标功能模型为板块识别模型的情况下,获得板块识别模型对应的第二优化引导语句,其中,第二优化引导语句用于指示进行板块名称识别;将第二优化引导语句和待处理语句,输入第二文本理解模型,根据第二优化引导语句,从处理语句中识别出搜索板块名称,以将搜索板块名称输入基于训练后的板块识别模型,确定目标板块。

其中,可以将待处理语句和第二优化引导语句按照一定顺序或格式组合起来,例如基于一种可能的第二优化引导语句,第二优化引导语句和待处理语句的组合方式为:“如果用户问:”+待处理语句+“那么用户想要询问的板块是什么”。

例如,待处理语句为:“哪个板块可以进行话题挖掘”,则第二文本理解模型的输入即为“如果用户问:哪个板块可以进行话题挖掘,那么用户想要询问的板块是什么”,进而第二文本理解模型,根据第二优化引导语句的指示,从“哪个板块可以进行话题挖掘”识别出用户想要搜索的搜索板块名称,如为“话题挖掘板块”。

例如,待处理语句为:“哪个功能可以看到大盘指标”,则第二文本理解模型的输入即为“如果用户问:哪个功能可以看到大盘指标,那么用户想要询问的板块是什么”,进而第二文本理解模型输出的搜索板块名称为“大盘指标板块”。

这样,本公开实施例中,通过第二优化引导语句和第二文本理解模型,可以去除待处理语句中对于板块识别无意义的信息,可以将待处理语句转换为对于板块搜索更加有效的语句,从而将识别出的搜索板块名称输入板块识别模型,即如图2所示,输入板块识别模块的即为该搜索板块名称,基于板块识别模型对搜索板块名称进行编码,并与预设的各板块对应的特征编码向量,进行向量距离判断,从预设的各板块中确定出匹配的目标板块,进而可以向用户返回该目标板块的目标板块名称和/或地址链接信息,可以提高板块识别模型的准确性和处理效率。

下面以功能模型包括文本生成模型、图片生成模型和板块识别模型为例,并且为便于描述,上述第一意图识别模型和第二意图识别模型,可以统称为意图识别模型,则对本公开实施例中的信息处理方法进行说明,参阅图3所示,为本公开实施例中信息处理方法的实现原理示意图。

本公开实施例中,该信息处理方法可以部署在某平台中,平台面向用户的交互界面上可以提供一个交互接口,例如输入框或操作控件等,用户可以在输入框中输入待处理语句,进而参阅图3所示,服务器获取输入的待处理语句,基于意图识别模型对待处理语句进行意图识别,进而基于识别出的不同的目标意图类别,可以采用不同的匹配的目标功能模型进行处理,具体可以分为以下几部分进行介绍。

第一部分:意图识别模型。

本公开实施例中,针对待处理语句的意图识别,提供了两种可能的实施方式,即基于无监督的第一意图识别模型方案和有监督训练的第二意图识别模型方案。

1)基于无监督的第一意图识别模型方案。

参阅图4所示,为本公开实施例中第一意图识别模型的原理示意图,如图4所示,例如,预设意图类别有四个,分别为文本生成意图类别、图片生成意图类别、板块搜索意图类别和对话聊天意图类别,每个预设意图类别下可以预先筛选出一些能够表示对应意图类别的目标词,然后基于第一意图识别模型,分别对每个预设意图类别下的目标词进行编码,进而获得每个预设意图类别对应的特征编码向量。

获取到待处理语句后,将待处理语句输入第一意图识别模型,进行编码后获得待处理语句的第一目标特征编码向量,进而分别确定第一目标特征编码向量,与每个预设意图类别对应的特征编码向量之间的向量距离,确定出最小的向量距离所对应的预设意图类别,即确定为待处理语句的目标意图类别。

2)基于有监督训练的第二意图识别模型方案。

本公开实施例中,由于第二意图识别模型是根据标注有意图类别标签的语句样本集进行训练后获得的,因此将待处理语句输入第二意图识别模型,即可以输出该待处理语句的目标意图类别。

其中,针对第二意图识别模型的训练方法,本公开还提供了一种可能的实施方式,参阅图5所示,为本公开实施例中第二意图识别模型的训练原理示意图,获取标注有意图类别标签的语句样本集,为了提高样本数量和多样性,可以采用文本增强方式,对语句样本集中各语句样本进行泛化处理,例如文本增强方式为同义词替换、随机插入、随机删除等,然后基于第二意图分类模型中编码器对泛化处理后的语句样本集进行编码,基于泛化处理后的语句样本集编码后的特征编码向量,基于第二意图识别模型中分类器获得预测意图类别,进而根据预测意图类别和对应的意图类别标签,对第二意图识别模型进行训练,从而获得训练后的第二意图识别模型,该第二意图识别模型即可以用于意图类别识别。

第二部分:文本生成模型。

例如,如图3中,确定目标意图类别为文本生成意图类别或对话聊天意图类别的情况下,将待处理语句输入文本生成模型,获得待处理语句的文本生成结果。

具体参阅图6所示,为本公开实施例中文本生成模型的原理示意图,将待处理语句输入文本生成模型,基于文本生成模型,对待处理语句进行语义分析,例如,文本生成模型为大语言模型(Large Language Model,LLM),如图6所示,文本生成模型针对待处理语句,文本生成模型可以根据学习到的概率分布参数信息生成一个词语token,然后使用生成的token作为输入,继续生成下一个token,直至达到所需的终止条件,最终可以输出所生成的文本句子,即获得文本生成结果。

其中,本公开实施例中,针对文本生成模型的训练方法,可以通过微调(FineTune)一个LLM而获得,这样可以提高效率,参阅图7所示,为本公开实施例中文本生成模型的训练原理示意图,在进行微调训练时,可以基于模糊文本样本集进行预训练,其中,模糊文本样本集中的模糊文本样本是根据对完整语句或文本去掉部分字或词后获得的,然后再基于标注有质量标签的文本样本集和对话文本样本对集进行有监督训练,另外还可以进行基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)再进行训练,以提高文本生成模型的准确性和性能,以更加符合人类偏好。

第三部分:图片生成模型。

例如,如图3中,确定目标意图类别为图片生成意图类别的情况下,根据图片生成模型,获得待处理语句的图片生成结果。

本公开提供的一种较佳的实施方式中,先根据第一优化引导语句,将待处理语句转换为对于图片生成模型更友好的第一目标语句。具体参阅图8所示,为本公开实施例中图片生成模型的原理示意图,对待处理语句进行文本清洗转换,提取图片内容文本信息和图片风格文本信息,进而将待处理语句转换为第一目标语句,将第一目标语句输入图片生成模型,基于图片生成模型,对第一目标语句进行语义分析,图片生成模型在生成图片时,加入随机噪声,根据第一目标语句和随机噪声,最终输出图片生成结果。

其中,本公开实施例中,针对图片生成模型的训练方法,也可以通过对例如StableDiffusion模型进行微调(Fine Tune)后获得,这样可以提高效率,并且还可以更加满足所实际应用场景的内容需求。

第四部分:板块识别模型。

例如,如图3中,确定目标意图类别为板块搜索意图类别的情况下,根据板块识别模型,获得待处理语句所对应搜索的目标板块的目标板块名称和/或地址链接信息。

本公开提供的一种较佳的实施方式中,先根据第二优化引导语句,对待处理语句进行文本清洗转换,具体参阅图9所示,为本公开实施例中板块识别模型的原理示意图,基于第二优化引导语句,对待处理语句进行文本清洗转换,识别待处理语句所对应的搜索板块名称,将搜索板块名称输入板块识别模型,编码获得搜索板块名称的特征编码向量,将搜索板块名称的特征编码向量与预设的各板块的特征编码向量进行匹配,进而确定与搜索板块名称语义匹配的目标板块,匹配出的目标板块可以是一个或多个,例如图9中最终匹配出的目标板块有四个。

这样,本公开实施例中,通过意图识别,可以自动确定匹配的目标功能模型,进而可以基于目标功能模型进行处理,获得处理回复结果,例如文本生成结果、图片生成结果、目标版本名称和地址链接信息等,可以针对输入的待处理语句而返回多模态结果,提高了交互效率,并且也提升了用户体验。

下面以执行主体为终端设备为例对本公开实施例提供的信息处理方法加以说明。参见图10所示,为本公开实施例提供的另一种信息处理方法的流程图,该方法包括:

S1001:接收输入的待处理语句。

S1002:获取待处理语句的处理回复结果,其中,处理回复结果是确定待处理语句的目标意图类别,并根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型,以及根据目标功能模型确定的。

其中,其中不同意图类别表征处理待处理语句的功能需求,不同功能模型用于实现不同的功能,目标功能模型所实现的功能与目标意图类别的功能需求匹配。

本公开实施例中,终端设备接收到用户输入的待处理语句后,将待处理语句发送给服务器,进而服务器可以对待处理语句进行分析处理,以获得处理回复结果,其中,待处理语句的处理回复结果的确定方式,同上述服务器侧信息处理方法中的实施方式,这里就不再重复赘述了。

S1003:展示处理回复结果。

本公开实施例中,接收输入的待处理语句,获取待处理语句的处理回复结果,进而展示处理回复结果,这样可以使用一个交互接口,连接多个功能模块,针对用户输入的待处理语句,可以准确地理解用户的输入,而返回多模态多功能的结果,实现了多模态生成能力的方案,并且提高了效率。

下面采用具体应用场景进行说明,本公开实施例中信息处理方法可以集成在某平台中,在该平台中部署AIGC功能,例如文本AIGC能力、图片AIGC能力,并且还提供了平台板块导流功能,则所连接的多个功能模型包括文本生成模型、图片生成模型和板块识别模型,在终端设备侧,平台面向用户的交互界面上可以提供一个交互接口,用户可以通过该交互接口输入待处理语句,进而进行意图识别并进行后续操作。

例如,参阅图11所示,为本公开实施例中一种文本生成界面示例图,如图11所示,用户输入待处理语句为:“给我生成5个有关‘小吃游记’的创作方向引导,方便我创作一篇高质量的互联网内容”,平台服务器识别出是文本生成意图类别,并基于文本生成模型获得文本生成结果,并返回该文本生成结果,如返回的文本生成结果为:

1、寻找‘小吃美景’的踪迹,如有名的小吃街、夜市等,通过拍摄视频或图片展示当地特色美食,吸引关注和流量。

2、了解小吃的历史文化,探索传统小吃如何融入现代生活,包括如何结合食材或食材加工方法,让美食更加新潮美味。

3、分享各种本地小吃的做法,对比不同店面或菜谱的味道,以及新、奇、巧的创新搭配,吸引读者尝试的兴趣。

4、从小吃商家、老字号到特色餐厅,全方位介绍小吃,包括各种烹饪技法、特色食材、配方等,让读者了解北京小吃的博大精深,并得到细致的指导。

5、推出‘小吃文化’的专题,介绍与之相关的传统工艺、历史事件、文学作品等,让读者了解小吃背后的故事和文化底蕴。

进一步地,还可以展示后续创作的提示信息,例如“仅供参考,还需根据实际情况进行具体规划和写作”。

又例如,参阅图12所示,为本公开实施例中一种图片生成界面示例图,如图12所示,用户输入待处理语句为:“给我画一只猫,需要毕加索风格,色彩明亮一些”,平台服务器识别出是图片生成意图类别,并基于图片生成模型获得图片生成结果,并返回图片生成结果,如图12所示,展示服务器返回的图片生成结果,即一张毕加索风格的猫的图片,并且该图片是色彩明亮的(图12中灰色仅是一种示例说明,实际上是具有色彩的)。

又例如,参阅图13所示,为本公开实施例中一种板块识别界面示例图,如图13所示,用户输入待处理语句为:“平台在哪里可以查看话题的投放效果”,平台服务器识别出是板块搜索意图类别,并基于板块识别模型确定所匹配的目标板块,进而返回目标板块的目标板块名称和地址链接信息,例如,确定该待处理语句匹配的目标板块有五个,分别为话题规模化板块、话题生成板块、人群偏好挖掘板块、话题画风板块和作者流量诊断板块,如图13所示,可以展示该五个目标板块的目标板块名称和地址链接信息,进而用户可以根据需求,直接点击某目标板块的地址链接信息,即可以跳转到该目标板块,提高了搜索效率,并且还可以有效地将用户导流到目标板块。

需要说明的是,本公开实施例中,上述界面示例图仅是一种可能的示例,不应对本公开实施例中进行限制,本公开实施例中,用户输入待处理语句后,可以跳转到另一页面来展示所返回的文本生成结果、图片生成结果或目标板块,也可以类似于聊天界面,在同一页面中直接展示所返回的文本生成结果、图片生成结果或目标板块,本公开实施例中并不进行限制,另外对于界面展示形式,本公开实施例中也不进行限制。

这样,本公开实施例中,通过对输入的待处理语句进行意图识别,进而可以使用相应的目标功能模型进行处理,可以实现利用简单的交互方式在平台中部署多模态的AIGC功能,提高了效率,并且提升了平台的用户使用体验。

本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

基于同一发明构思,本公开实施例中还提供了与信息处理方法对应的信息处理装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述信息处理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

参照图14所示,为本公开实施例提供的一种信息处理装置的示意图,该装置包括:

获取模块1401,用于获取输入的待处理语句;

第一确定模块1402,用于对所述待处理语句进行意图识别,确定所述待处理语句的目标意图类别,其中不同意图类别表征处理所述待处理语句的功能需求;

第二确定模块1403,用于根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型,并根据所述目标功能模型,确定所述待处理语句的处理回复结果,其中,不同功能模型用于实现不同的功能,所述目标功能模型所实现的功能与所述目标意图类别的功能需求匹配。

一种可选的实施方式中,所述根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型,并根据所述目标功能模型,确定所述待处理语句的处理回复结果时,第二确定模块1403用于:在所述目标意图类别为文本生成意图类别的情况下,根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型为文本生成模型;基于训练后的所述文本生成模型,对所述待处理语句进行语义分析,生成所述待处理语句的文本生成结果。

一种可选的实施方式中,所述根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型,并根据所述目标功能模型,确定所述待处理语句的处理回复结果时,第二确定模块1403用于:

在所述目标意图类别为图片生成意图类别的情况下,根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型为图片生成模型,其中,所述图片生成模型是根据标注有文本标签的图片样本集进行训练后获得的;

基于训练后的所述图片生成模型,对所述待处理语句进行语义分析,获得所述待处理语句的文本特征,并根据所述文本特征,获得所述文本特征关联的图像特征,根据所述图像特征生成所述待处理语句的图片生成结果。

一种可选的实施方式中,所述根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型,并根据所述目标功能模型,确定所述待处理语句的处理回复结果时,第二确定模块1403用于:

在所述目标意图类别为板块搜索意图类别的情况下,根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型为板块识别模型;

基于训练后的所述板块识别模型,对所述待处理语句进行编码,获得所述待处理语句的第三目标特征编码向量,并基于所述板块识别模型,对各板块的功能介绍信息进行编码,获得各板块的特征编码向量,其中,所述各板块表示所提供的用于实现不同功能的功能区;

根据所述第三目标特征编码向量与所述各板块的特征编码向量,确定与所述待处理语句匹配的目标板块;

获得所述目标板块的目标板块名称和/或地址链接信息,根据所述目标板块名称和/或所述地址链接信息,确定所述待处理语句的处理回复结果。

一种可选的实施方式中,所述确定所述目标意图类别匹配的目标功能模型之后,所述根据所述目标功能模型,确定所述待处理语句的处理回复结果之前,第二确定模块1403还用于:

获得所述目标功能模型对应的目标优化引导语句,其中,所述目标优化引导语句用于指示语句优化要求;

根据所述目标优化引导语句,对所述待处理语句进行优化,获得所述待处理语句优化后的目标语句,以将所述目标语句输入所述目标功能模型,确定所述处理回复结果。

一种可选的实施方式中,所述获得所述目标功能模型对应的目标优化引导语句,根据所述目标优化引导语句,对所述待处理语句进行优化,获得所述待处理语句优化后的目标语句,以将所述目标语句输入所述目标功能模型,确定所述处理回复结果时,第二确定模块1403用于:

在确定所述目标功能模型为图片生成模型的情况下,获得所述图片生成模型对应的第一优化引导语句,其中,所述第一优化引导语句用于指示进行图片内容和图片风格提取;

将所述第一优化引导语句和所述待处理语句,输入第一文本理解模型,根据所述第一优化引导语句,从所述待处理语句中提取所关联的图片内容文本信息和图片风格文本信息,并根据所述图片内容文本信息和所述图片风格文本信息,获得所述待处理语句转换后的第一目标语句,以将所述第一目标语句输入基于训练后的所述图片生成模型,生成图片生成结果。

一种可选的实施方式中,所述获得所述目标功能模型对应的目标优化引导语句,根据所述目标优化引导语句,对所述待处理语句进行优化,获得所述待处理语句优化后的目标语句,以将所述目标语句输入所述目标功能模型,确定所述处理回复结果时,第二确定模块1403用于:

在确定所述目标功能模型为板块识别模型的情况下,获得所述板块识别模型对应的第二优化引导语句,其中,所述第二优化引导语句用于指示进行板块名称识别;

将所述第二优化引导语句和所述待处理语句,输入第二文本理解模型,根据所述第二优化引导语句,从所述处理语句中识别出搜索板块名称,以将所述搜索板块名称输入基于训练后的所述板块识别模型,确定目标板块。

一种可选的实施方式中,所述对所述待处理语句进行意图识别,确定所述待处理语句的目标意图类别时,第一确定模块1402用于:

基于第一意图识别模型,以所述待处理语句为输入,对所述待处理语句进行编码,获得所述待处理语句的第一目标特征编码向量;

获得各预设意图类别的特征编码向量,其中,所述各预设意图类别的特征编码向量是基于所述第一意图识别模型,对所述各预设意图类别下的目标词进行编码后获得的;

确定所述第一目标特征编码向量,分别与所述各预设意图类别的特征编码向量之间的向量距离;

根据确定出的各所述向量距离,筛选出最小的所述向量距离,并将筛选出的所述向量距离对应的预设意图类别,确定为所述待处理语句的目标意图类别。

一种可选的实施方式中,所述对所述待处理语句进行意图识别,确定所述待处理语句的目标意图类别时,第一确定模块1402用于:

基于第二意图识别模型,以所述待处理语句为输入,通过所述第二意图识别模型的编码器,获得所述待处理语句的第二目标特征编码向量,其中,所述第二意图识别模型是根据标注有意图类别标签的语句样本集进行训练后获得的;

通过所述第二意图识别模型的分类器,根据所述第二目标特征编码向量,确定所述待处理语句的目标意图类别。

参照图15所示,为本公开实施例提供的另一种信息处理装置的示意图,该装置包括:

接收模块1501,用于接收输入的待处理语句;

获取模块1502,用于获取待处理语句的处理回复结果,其中,处理回复结果是确定待处理语句的目标意图类别,并根据目标意图类别,以及意图类别与功能模型的关联关系,确定目标意图类别匹配的目标功能模型,以及根据目标功能模型确定的;

展示模块1503,用于展示所述处理回复结果。

关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。

本公开实施例还提供了一种电子设备,如图16所示,为本公开实施例提供的电子设备结构示意图,包括:

处理器161和存储器162;所述存储器162存储有处理器161可执行的机器可读指令,处理器161用于执行存储器162中存储的机器可读指令,所述机器可读指令被处理器161执行时,处理器161用于执行下述步骤:

获取输入的待处理语句;

对所述待处理语句进行意图识别,确定所述待处理语句的目标意图类别,其中不同意图类别表征处理所述待处理语句的功能需求;

根据所述目标意图类别,以及意图类别与功能模型的关联关系,确定所述目标意图类别匹配的目标功能模型,并根据所述目标功能模型,确定所述待处理语句的处理回复结果,其中,不同功能模型用于实现不同的功能,所述目标功能模型所实现的功能与所述目标意图类别的功能需求匹配。

上述存储器162包括内存1621和外部存储器1622;这里的内存1621也称内存储器,用于暂时存放处理器161中的运算数据,以及与硬盘等外部存储器1622交换的数据,处理器161通过内存1621与外部存储器1622进行数据交换。

上述指令的具体执行过程可以参考本公开实施例中所述的信息处理方法的步骤,此处不再赘述。

本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的信息处理方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的信息处理方法的步骤,具体可参见上述方法实施例,在此不再赘述。

其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

相关技术
  • 一种新型脉冲热丝TIG堆焊工艺
  • 一种热丝TIG内孔堆焊及CMT法兰自动堆焊两用设备
技术分类

06120116331572