掌桥专利:专业的专利平台
掌桥专利
首页

目标模型训练方法及相关方法、装置、设备和介质

文献发布时间:2024-04-18 20:02:18


目标模型训练方法及相关方法、装置、设备和介质

技术领域

本申请涉及人工智能技术领域,特别是涉及一种目标模型训练方法及相关方法、装置、设备和介质。

背景技术

通过访问提升服务质量或了解受访者动态,为众多行业普遍采用。以医疗行业为例,通常会对曾在医疗机构就诊的病人以通讯或其他的方式进行医疗随访,以定期了解患者病情变化和指导患者康复。

近年来,随着生成式大规模语言模型在众多领域的推广应用,其在访问场景中如何推广应用,也逐渐受到关注。但是,现有技术受限于真实世界中稀缺的行业数据,难以训练得到可稳定用于自动访问的目标模型。有鉴于此,如何获取可稳定用于自动访问的目标模型,成为亟待解决的问题。

发明内容

本申请提供一种目标模型训练方法及相关方法、装置、设备和介质。

本申请第一方面提供了一种目标模型训练方法,包括:将报告模板和第一提示输入至大语言模型,得到样本模板;其中,第一提示用于指示大语言模型根据报告模板构造样本模板,且样本模板包含至少一个样本项目以及表征问询样本项目的样本问题;将样本模板和第二提示输入至大语言模型,得到样本实例;其中,第二提示用于指示大语言模型作为受访者回答样本问题,样本实例包含样本项目的样本回答;将样本实例和第三提示输入至大语言模型,得到样本对话;其中,第三提示用于指示大语言模型根据样本实例构造样本对话;基于样本对话和样本实例,对预设模型进行训练得到目标模型。

因此,将报告模板和第一提示输入至大语言模型,得到样本模板,且第一提示用于指示大语言模型根据报告模板构造样本模板,样本模板包含至少一个样本项目,再将样本模板和第二提示输入至大语言模型,得到样本实例,且第二提示用于指示大语言模型作为受访者回答样本项目以及表征问询样本项目的样本问题,样本实例包含样本项目的样本回答,从而将样本实例和第三提示输入至大语言模型,得到样本对话,且第三提示用于指示大语言模型根据样本实例构造样本对话,进而基于样本对话和样本实例,对预设模型进行训练得到目标模型,故相较于通用数据上训练的大规模语言模型而言,通过以依次在三个阶段采用不同提示,利用大语言模型最终构造出专用于访问场景的训练样本,以训练预设模型,能够获取可稳定用于自动访问的目标模型。

其中,将样本模板和第二提示输入至大语言模型,得到样本实例,包括:将样本项目的样本问题和第二提示输入至大语言模型,得到样本项目的样本回答;将样本模板中各个样本项目的样本回答,分别附于样本模板中对应的样本项目,得到样本实例。

因此,样本模板还定义有表征问询样本项目的样本问题,从而将样本项目的样本问题和第二提示输入至大语言模型,得到样本项目的样本回答,并将样本模板中各个样本项目的样本回答,分别附于样本模板中对应的样本项目,得到样本实例,从而能够尽可能地确保大语言模型作为受访者准确回答样本项目且样本实例保持与样本模板具有相同格式。

其中,样本对话包括分别与各个样本项目对应的至少一轮对话,且每轮对话包括样本问题和样本回答。

因此,样本对话包括分别与各个样本项目对应的至少一轮对话,且每轮对话包括样本问题和样本回答,故能够尽可能清楚地区分各个样本项目的相关对话。

其中,样本模板还定义有回答封闭式样本项目的候选回答和可选范围,在将样本模板和第二提示输入至大语言模型,得到样本实例之前,方法还包括:构造第二提示;其中,第二提示用于指示大语言模型作为受访者遵循可选范围选择样本项目的候选回答作为样本项目的样本回答。

因此,样本模板还定义有回答封闭式样本项目的候选回答和可选范围,从而据此构造第二提示,且第二提示用于指示大语言模型作为受访者遵循可选范围选择样本项目的候选回答作为样本项目的样本回答,故能够进一步使大语言模型尽可能准确地回答样本项目。

其中,基于样本对话和样本实例,对预设模型进行训练得到目标模型,包括:将样本对话输入至预设模型,得到预设模型生成的预测实例;基于样本实例与预测实例之间的差异,调整预设模型的网络参数,直至预设模型经若干轮训练收敛,得到目标模型。

因此,将样本对话输入至预设模型,得到预设模型生成的预测实例,并基于样本实例与预测实例之间的差异,调整预设模型的网络参数,直至预设模型经若干轮训练收敛,得到目标模型,故能够通过样本对话和样本实例进行有效训练,有助于进一步提升目标模型的稳定性和准确性。

其中,样本模板为结构化数据,且样本模板中各个样本项目分别为彼此独立的结构体;和/或,报告模板为病例报告模板,样本模板为样本随访模板,样本项目为所述样本随访项目,样本问题为样本随访问题。样本回答为所述样本受访回答,样本实例为样本随访实例,样本对话为样本随访对话。

因此,样本模板为结构化数据,且样本模板中各个样本项目分别为彼此独立的结构体,故能够使样本数据尽可能地便于被机器解析,有助于进一步提升目标模型的稳定性和准确性。此外,将报告模板设置为病例报告模板,样本模板设置为样本随访模板,样本项目设置为所述样本随访项目,样本问题设置为样本随访问题。样本回答设置为所述样本受访回答,样本实例设置为样本随访实例,样本对话设置为样本随访对话,能够使得目标模型进一步稳定适用于医疗随访场景。

本申请第二方面提供了一种自动访问方法,包括:确定目标对象;基于目标模型与目标对象进行交互,得到目标对象的访问实例;其中,目标模型基于上述第一方面中的训练方法训练得到。

因此,确定目标对象,并基于目标模型与目标对象进行交互,得到目标对象的访问实例,且目标模型基于上述目标模型训练方法训练得到,故一方面能够无需人工访问,有助于提高访问自动化程度,降低人力成本,另一方面通过上述目标模型训练方法所训练得到的目标模型与目标对象进行自动访问,也有助于提升访问稳定性。

其中,基于目标模型与目标对象进行交互,得到目标对象的访问实例,包括:获取与目标对象匹配的访问模板;其中,访问模板包括至少一个访问项目以及表征问询访问项目的访问问题;基于目标对象对模板中各个访问项目其访问问题的受访回答,得到目标模型与目标对象之间的问答对话;将问答对话输入至目标模型,得到访问实例。

因此,获取与目标对象匹配的访问模板,且访问模板包括至少一个访问项目以及表征问询访问项目的访问问题,再基于目标对象对访问模板中各个访问项目的受访回答,得到目标模型与目标对象之间的问答对话,从而将问答对话输入至目标模型,得到访问实例,故能够对目标对象进行个性化访问。

其中,获取与目标对象匹配的访问模板,包括:获取与目标对象的对象信息相匹配的报告模板;将与目标对象的对象信息相匹配的报告模板和第一提示输入至大语言模型,得到访问模板。

因此,获取与目标对象的对象信息相匹配的报告模板,并将与目标对象的对象信息相匹配的报告模板和第一提示输入至大语言模型,得到访问模板,故能够针对不同对象的对象信息通过目标模型自动开展个性化访问。

其中,在获取与目标对象匹配的访问模板之后,以及在基于目标对象对模板中各个访问项目的受访回答,得到目标模型与目标对象之间的问答对话之前,方法还包括:基于访问模板中访问项目其访问问题进行语音合成,得到用于向目标对象问询的访问语音;获取目标对象响应于访问语音的回答语音;基于回答语音进行语音识别,得到受访回答。

因此,基于访问模板中访问项目其访问问题进行语音合成,得到用于向目标对象问询的访问语音,获取目标对象响应于访问语音对访问项目的回答语音,并基于回答语音进行语音识别,得到受访回答,故目标模型能够结合语音合成和语音识别主动进行语音访问,有助于提升访问效率,并降低访问开销。

本申请第三方面提供了一种目标模型训练装置,包括:第一构造模块、第二构造模块、第三构造模块和模型训练模块,第一构造模块,用于将报告模板和第一提示输入至大语言模型,得到样本模板;其中,第一提示用于指示大语言模型根据报告模板构造样本模板,且样本模板包含至少一个样本项目以及表征问询样本项目的样本问题;第二构造模块,用于将样本模板和第二提示输入至大语言模型,得到样本实例;其中,第二提示用于指示大语言模型作为受访者回答样本问题,样本实例包含样本项目的样本回答;第三构造模块,用于将样本实例和第三提示输入至大语言模型,得到样本对话;其中,第三提示用于指示大语言模型根据样本实例构造样本对话;模型训练模块,用于基于样本对话和样本实例,对预设模型进行训练得到目标模型。

本申请第四方面提供了一种自动访问装置,包括:对象确定模块和访问交互模块,对象确定模块,用于确定目标对象;访问交互模块,用于基于目标模型与目标对象进行交互,得到目标对象的实例;其中,目标模型基于上述训练装置训练得到。

本申请第五方面提供了一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述第一方面中的目标模型训练方法,或上述第二方面中的自动访问方法。

本申请第六方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述第一方面中的目标模型训练方法,或上述第二方面中的自动访问方法。

上述方案,相较于通用数据上训练的大规模语言模型而言,通过以依次在三个阶段采用不同提示,利用大语言模型最终构造出专用于访问场景的训练样本,以训练预设模型,能够获取可稳定用于自动访问的目标模型。此外,基于以此训练得到的目标模型与目标对象进行交互,得到目标对象的访问实例,一方面能够无需人工访问,有助于提高访问自动化程度,降低人力成本,另一方面通过目标模型与目标对象进行自动访问,也有助于提升对目标对象进行访问的稳定性。

附图说明

图1是本申请目标模型训练方法一实施例的流程示意图;

图2是本申请自动访问方法一实施例的流程示意图;

图3是本申请目标模型训练装置一实施例的框架示意图;

图4是本申请自动访问装置一实施例的框架示意图;

图5是本申请电子设备一实施例的框架示意图;

图6是本申请计算机可读存储介质一实施例的框架示意图。

具体实施方式

下面结合说明书附图,对本申请实施例的方案进行详细说明。

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。

请参阅图1,图1是本申请目标模型训练方法一实施例的流程示意图。具体而言,可以包括如下步骤:

步骤S11:将报告模板和第一提示输入至大语言模型,得到样本模板。

本公开实施例中,第一提示用于指示大语言模型根据报告模板构造样本模板,且样本模板包含至少一个样本项目以及表征问询样本项目的样本问题。需要说明的是,上述报告模板可以根据实际应用场景进行设置,相应地,样本模板也可以随实际应用场景而改变。以医疗行业为例,报告模板可以设置为病例报告模板,病例报告模板可以包括但不限于CRF(Case Report Form,病例报告表),其具体含义可以参阅其相关细节,在此不再赘述。相应地,样本模板可以为样本随访模板。此外,大语言模型可以包括但不限于:LLAMA、GPT等,在此不做限定。当然,在其他应用场景可以以此类推,如在理财客服行业,报告模板可以为理财调查问卷等,相应地,样本模板可以为理财访问模板,在此对其他应用场景下的报告模板以及相应的样本模板,不再一一举例。

在一个实施场景中,可以预先收集各种报告模板,以充分训练得到目标模型。示例性地,仍以医疗行业为例,可以收集包括但不限于如下科室的病例报告模板:普外科、神外科、手外科、妇产科、五官科等,在此不做限定。此外,各个科室的病例报告模板其具体内容在此不做限定。在其他应用场景,可以以此类推,收集得到报告模板,在此不再一一举例。

在一个实施场景中,仍以医疗场景为例,第一提示可以包括但不限于以下内容:“请根据以下病例报告模板,构造一份用于收集随访信息的随访模板”、“以下是一份病例报告模板,请据此生成一份随访模板”等等,在此对第一提示的具体内容不做限定。示例性地,可以结合病例报告模板和第一提示,向大语言模型输入如下内容:

给你一段文字,这描述了一份病例报告模板:

//

此处为病例报告模板

//

请帮我根据以上病例报告模板,构造一份用于收集随访信息的随访模板。

当然,上述举例仅仅是应用于医疗行业时一种可能的实施方式,当应用于其他场景时可以以此类推,在此不再一一举例。此外,在对大语言模型所生成的样本模板还有其他要求时,也可以体现于第一提示中。示例性地,为了便于机器解析,可以要求大语言模型生成JSON(或XML、HTML等)特定文件后缀的样本模板。仍以医疗行业为例,此时,可以结合病例报告模板和第一提示,向大语言模型输入如下内容:

给你一段文字,这描述了一份病例报告模板:

//

此处为病例报告模板

//

请帮我根据以上病例报告模板,构造一份用于收集随访信息的随访模板,且要求随访模板的文件后缀为JSON。

进一步地,为了便于后续基于样本模板继续构造样本实例,还可以要求大语言模型所构造的样本模板以结构化形式定义更多内容,如可以包括但不限于:表征问询样本项目的样本问题、回答封闭式样本项目的候选回答和可选范围、回答开放式样本项目的字段标识等,在此不做限定。示例性地,仍以医疗行业为例,此时,可以结合病例报告模板和第一提示,向大语言模型输入如下内容:

也就是说,样本模板可以为结构化数据,且样本模板中各个样本项目可以分别为彼此独立的结构体,从而能够使样本数据尽可能地便于被机器解析,有助于进一步提升目标模型的稳定性和准确性。以医疗行业为例,样本项目具体可以为样本随访项目,具体可以包括但不限于:基本信息确认、目前身体反应、遵医嘱服药情况等等,在此不做限定。以样本随访项目“基本信息确认”为例,样本随访问题可以包括但不限于:“您好,XXX女士/先生,您于XX年XX月XX日于我院XX科接受XX手术后已出院XX天,为及时了解您康复情况,需与您沟通一些问题,请问您是XXX女士/先生本人吗”,该封闭式问题的候选回答包括:“是”、“不是”,且可选范围为“单选”。仍以医疗行业为例,样本随访模板中样本随访项目“基本信息确认”可以表示如下:

当然,上述举例仅仅是应用于医疗行业时一种可能的实施方式,并不因此而限定其他样本模板。此外,对于其他样本项目,也可以以此类推,在此不再一一举例。

步骤S12:将样本模板和第二提示输入至大语言模型,得到样本实例。

本公开实施例中,第二提示用于指示大语言模型作为受访者回答样本项目的样本问题,样本实例包含样本项目的样本回答。

在一个实施场景中,可以直接将样本模板和第二提示输入至大语言模型,从而使得大语言模型依据第二提示所指示模拟受访者回答样本模板中各个样本项目其样本问题,以得到对应样本项目的样本回答,进而可以将样本项目的样本回答附于样本模板中的对应样本项目,以得到样本实例。示例性地,仍以应用于医疗行业时前述样本随访模板为例,可以结合样本随访模板和第二提示,向大语言模型输入如下内容:

给你一段文字,这描述了一份用于收集随访信息的随访模板:

//

此处填写随访模板

//

请帮我根据以上随访模板,假设自己是受访者,回答其中每一个随访项目,并按随访模板原来的数据格式输出。

特别地,可以指示大语言模型在样本模板中新增一个字段(如,value),专用于填充大语言模型对样本项目的样本回答。以应用于医疗行业为例,样本实例可以为样本随访实例,其可以表示为:

当然,上述举例仅仅是实际应用过程中一种可能的实施方式,并不因此而限定样本实例的具体内容。

在另一个实施场景中,区别于前述实施方式,作为另一种可能的实施方式,如前所述,样本模板还定义有表征问询样本项目的样本问题。在此基础上,也可以将样本项目的样本问题和第二提示输入至大语言模型,得到样本项目的样本回答,再将样本模板中各个样本项目的样本回答,分别附于样本模板中对应的样本项目,得到样本实例。示例性地,仍以应用于医疗行业时前述结构化形式的样本随访模板为例,对于样本随访项目“基本信息确认”而言,其样本随访问题为“您好,XXX女士/先生,您于XX年XX月XX日于我院XX科接受XX手术后已出院XX天,为及时了解您康复情况,需与您沟通一些问题,请问您是XXX女士/先生本人吗”,则可以结合该样本随访问题和第二提示,向大语言模型输入如下内容:

请假设自己是XXX女士/先生本人,回答以下问题:您好,XXX女士/先生,您于XX年XX月XX日于我院XX科接受XX手术后已出院XX天,为及时了解您康复情况,需与您沟通一些问题,请问您是XXX女士/先生本人吗?

在此基础上,在得到大语言模型输出的样本回答“是”之后,可以将其附于前述结构化形式的样本随访模板中样本随访项目“基础信息确认”。其他情况可以以此类推,在此不再一一举例。上述方式,能够尽可能地确保大语言模型作为受访者准确回答样本项目且样本实例保持与样本模板具有相同格式。

在一个具体的实施场景中,在实际应用过程中,每个样本项目可以对应有至少一轮对话,且每轮对话可以包含样本提和样本回答。以应用于医疗行业为例,如前述样本随访项目“基础信息确认”就包含一轮对话:“您好,XXX女士/先生,您于XX年XX月XX日于我院XX科接受XX手术后已出院XX天,为及时了解您康复情况,需与您沟通一些问题,请问您是XXX女士/先生本人吗”—“是”。当然,也可以不局限于此,在此对样本随访项目对应的对话轮数不做限定。

在一个具体的实施场景中,如前所述,样本模板还定义有回答封闭式样本项目的候选回答和可选范围,则在所构造的第二提示可以具体用于指示大语言模型作为受访者遵循可选范围选择样本项目的候选回答作为样本项目的样本回答。示例性地,以应用于医疗行业为例,结合样本随访模板和第二提示,可以向大语言模型输入如下内容:

给你一段文字,这描述了一份用于收集随访信息的随访模板:

//

此处填写随访模板

//

请帮我根据以上随访模板,假设自己是受访者,回答其中每一个随访项目,回答时请遵循随访项目中option字段和type字段的定义内容,并按随访模板原来的数据格式输出。

当然,上述举例仅仅是实际应用过程中一种可能的实施方式,并不因此而限定第二提示的具体内容。上述方式,能够进一步使大语言模型尽可能准确地回答样本项目。

步骤S13:将样本实例和第三提示输入至大语言模型,得到样本对话。

本公开实施例中,第三提示用于指示大语言模型根据样本实例构造样本对话。示例性地,仍以应用于医疗行业为例,结合样本随访实例和第三提示,可以向大语言模型输入如下内容:

以下是一份随访实例:

//

随访实例

//

请帮我根据以上随访实例构造医患之间一问一答的随访对话。

当然,上述示例仅仅实际应用过程中一种可能的实施方式,并不因此而限定向大语言模型具体的输入内容。仍以应用于医疗行业为例,以前述构造随访模板类似地,在对随访对话有其他要求时,也可以在第三提示体现。示例性地,在要求随访对话尽可能贴近真实情况,如具有生活气息时,结合样本随访实例和第三提示,可以向大语言模型输入如下内容:

以下是一份随访实例:

//

随访实例

//

请帮我根据以上随访实例构造医患之间一问一答的随访对话,要求尽可能地贴近真实情况,患者回答具有生活气息。

此外,仍以应用于医疗行业为例,与前述随访模板类似,还可以在第三提示中规定大语言模型按照特定格式输出样本随访对话。示例性地,结合样本随访实例和第三提示,可以向大语言模型输入如下内容:

步骤S14:基于样本对话和样本实例,对预设模型进行训练得到目标模型。

在一个实施场景中,以应用于医疗行业为例,可以采用大量医疗文本(如,医疗书籍、医疗对话等)对大规模语言模型(如,LLAMA、GPT等)进行预训练,并将预训练之后的大规模语言模型,作为预设模型。其他场景可以以此类推,在此不再一一举例。

在另一个实施场景中,区别于前述实施方式,在应用于医疗行业时,为了进一步提升医疗大模型作为预设模型在医疗对话时稳定性和准确性,也可以结合样本医疗问答和医疗回答检测模型一同训练得到医疗大模型,作为预设模型。具体来说,可以获取医疗回答检测模型,并获取第一样本医疗问题;基于医疗大模型对第一样本医疗问题进行分析,得到第一样本医疗问题的多个第一样本医疗回答;基于医疗回答检测模型分别对各个第一样本医疗回答进行检测,得到表征第一样本医疗回答优劣程度的第一检测分值;基于由第一检测分值所确定的学习率,调整医疗大模型的网络参数。

在一个具体的实施场景中,基于由第一检测分值所确定的学习率,调整医疗大模型的网络参数,包括:基于各个第一样本医疗回答的第一检测分值进行归一化,得到对应第一样本医疗回答的归一化分值;基于各个第一样本医疗回答的归一化分值,从多个第一样本医疗回答中筛选出第一样本医疗问题的样本优秀医疗回答;基于由样本优秀医疗回答的归一化分值所确定的学习率,调整医疗大模型的网络参数。

在一个具体的实施场景中,基于由样本优秀医疗回答的归一化分值所确定的学习率,调整医疗大模型的网络参数,包括:选择样本优秀医疗回答的归一化分值作为权重;基于权重获取医疗大模型对样本优秀医疗回答进行生成式学习的学习率;基于学习率,调整医疗大模型的网络参数。

在一个具体的实施场景中,在基于医疗回答检测模型分别对各个第一样本医疗回答进行检测,得到表征第一样本医疗回答优劣程序的第一检测分值之前,方法还包括:获取第二样本医疗问题和第二样本医疗问题的多个第二样本医疗回答;其中,第二样本医疗问题标注有多个第二样本医疗回答关于优劣程度的样本排序信息;将第二样本医疗回答和回答检测提示输入至医疗回答检测模型,得到表征第二样本医疗回答优劣程度的第二检测分值;其中,回答检测提示用于指示医疗回答检测模型检测第二样本医疗回答的优劣程度;基于样本排序信息和第二检测分值,调整医疗回答检测模型的网络参数。

在一个具体的实施场景中,将第二样本医疗回答和回答检测提示输入至医疗回答检测模型,得到表征第二样本医疗回答优劣程度的第二检测分值,包括:将第二样本医疗回答和回答检测提示输入至医疗回答检测模型,得到医疗回答检测模型输出的第一概率和第二概率;其中,第一概率表征第二样本医疗回答检测为优秀的可能性,第二概率表征第二样本医疗回答检测为拙劣的可能性;基于第一概率和第二概率,得到第二样本医疗回答的第二检测分值。

在一个具体的实施场景中,基于样本排序信息和第二检测分值,调整医疗回答检测模型的网络参数,包括:基于样本排序信息,将多个第二样本医疗回答划分至正例回答集合和负例回答集合;基于正例回答集合中第二样本医疗回答的第二检测分值,得到第一子损失,并基于负例回答集合中第二样本医疗回答的第二检测分值,得到第二子损失;基于第一子损失和第二子损失,调整医疗回答检测模型的网络参数;其中,第一子损失负相关于正例回答集合中第二样本医疗回答的第二检测分值,第二子损失正相关于负例回答集合中第二样本医疗回答的第二检测分值。

在一个具体的实施场景中,在基于第一子损失和第二子损失,调整医疗回答检测模型的网络参数之前,方法还包括:基于样本排序信息,选择两个第二样本医疗回答分别作为第二样本医疗问题的第一正例医疗回答和第一负例医疗回答;将第一正例医疗回答的第二检测分值,作为正例回答检测分值,并将第一负例医疗回答的第二检测分值,作为负例回答检测分值;基于负例回答检测分值与正例回答检测分值的分值之差,得到第一损失;其中,分值之差与第一损失正相关;基于第一子损失和第二子损失,调整医疗回答检测模型的网络参数,包括:获取第一子损失与第二子损失之和,得到第二损失,并基于第一损失和第二损失,调整医疗回答检测模型的网络参数。

在一个具体的实施场景中,获取第二样本医疗问题和第二样本医疗问题的多个第二样本医疗回答,包括:基于大语言模型对第二样本医疗问题进行分析,得到多个第二样本医疗回答;获取对多个第二样本医疗回答关于优劣程度的标注排序信息;基于标注排序信息,选择两个第二样本医疗回答分别作为第二样本医疗问题的第二正例医疗回答和第二负例医疗回答;基于大语言模型对第二正例医疗回答和第二负例医疗回答进行优劣校验,得到表征第二正例医疗回答和第二负例医疗回答孰优孰劣的校验结果;基于校验结果,确定是否提示修改标注排序信息。

在一个具体的实施场景中,基于校验结果,确定是否提示修改标注排序信息,至少包括:响应于校验结果与标注排序信息不符,提示修改标注排序信息。

具体地,在得到样本对话、样本实例和预设模型之后,即可开始训练。示例性地,可以将样本对话输入至预设模型,得到预设模型生成的预测实例,并基于样本实例与预测实例之间的差异,调整预设模型的网络参数,直至预设模型经若干轮训练收敛,得到目标模型。上述方式,能够通过样本对话和样本实例进行有效训练,有助于进一步提升目标模型的稳定性和准确性。

在一个实施场景中,为了便于预设模型理解自动访问的下游任务,也可以构造第四提示,且第四提示用于指示预设模型将对话构造为实例。示例性地,仍以应用于医疗行业时前述结构化的样本随访模板为例,结合样本随访对话和第四提示,可以向预设模型输入如下内容:

在一个实施场景中,在获取预设模型输出的预测实例之后,可以度量预测实例与样本实例之间的差异,得到预设模型的损失值。理论上,预设模型越适应于自动访问场景,上述损失值越小,反之,预设模型越不适应于自动访问场景,上述损失值越大。在此基础上,可以基于损失值,调整预设模型的网络参数,以次来对预设模型进行训练直至收敛为止,此时即可将训练收敛的预设模型作为适用于自动访问场景的目标模型。

上述方案,将报告模板和第一提示输入至大语言模型,得到样本模板,且第一提示用于指示大语言模型根据报告模板构造样本模板,样本模板包含至少一个样本项目以及表征问询样本项目的样本问题,再将样本模板和第二提示输入至大语言模型,得到样本实例,且第二提示用于指示大语言模型作为受访者回答样本问题,样本实例包含样本项目的样本回答,从而将样本实例和第三提示输入至大语言模型,得到样本对话,且第三提示用于指示大语言模型根据样本实例构造样本对话,进而基于样本对话和样本实例,对预设模型进行训练得到目标模型,故相较于通用数据上训练的大规模语言模型而言,通过以依次在三个阶段采用不同提示,利用大语言模型最终构造出专用于访问场景的训练样本,以训练预设模型,能够获取可稳定用于自动访问的目标模型。

请参阅图2,图2是本申请自动访问方法一实施例的流程示意图。

具体而言,可以包括如下步骤:

步骤S21:确定目标对象。

以应用于医疗行业为例,在执行医疗随访时,可以获取在医疗机构就诊或住院的患者已离开医疗机构预设天数的患者清单。在此基础上,可以将患者清单中各个患者分别作为目标对象执行医疗随访。

步骤S22:基于目标模型与目标对象进行交互,得到目标对象的访问实例。

本公开实施例中,目标模型基于上述目标模型训练方法实施例中步骤训练得到,具体训练过程可以参阅前述公开实施例,在此不再赘述。在获取目标模型之后,为了与目标对象开展与其匹配的个性化访问,具体来说,可以获取与目标对象匹配的访问模板,且访问模板包括至少一个访问项目以及表征问询访问项目的访问问题,再基于目标对象对模板中各个访问项目其访问问题的受访回答,得到目标模型与目标对象之间的问答对话,从而可以将问答对话输入至目标模型,得到访问实例。上述方式,通过获取与目标对象匹配的访问模板,并据此与目标对象展开问答交互,以获取与其之间的问答对话,从而通过目标模型将问答对话转换为访问实例,故能够对目标对象进行个性化访问。

在一个实施场景中,可以先获取目标对象的对象信息,如应用于医疗行业时,对象信息可以包括但不限于就诊/住院科室、治疗疾病等等,在此不做限定。当应用于其他行业时,可以以此类推,如应用于理财调查时,对象信息可以包括但不限于学历、投资经验等等,在此不再一一举例。在此基础上,可以获取与目标对象的对象信息相匹配的报告模板,再将与目标对象的对象信息相匹配的报告模板和第一提示输入至大语言模型,得到访问模板。示例性地,仍以应用于医疗行业为例,如在获取到目标对象的就诊科室为“五官科”时,可以获取五官科的病例报告模板。其他情况可以以此类推,在此不再一一举例。此外,构造访问模板的具体过程,可以参阅前述公开实施例中关于构造样本模板的具体过程,在此不再赘述。上述方式,能够针对不同对象的对象信息通过目标模型自动开展个性化访问。

在一个实施场景中,在得到访问模板之后,即可基于访问模板中访问项目其访问问题进行语音合成,得到用于向目标对象问询的访问语音。示例性地,如前述公开实施例所述,访问项目可以定义有访问问题,则可以基于访问问题进行语音合成,得到访问语音;或者,访问项目还可以定义有回答访问项目的相关要求(如,前述公开实施例中“候选回答”、“可选范围”等),则可以基于访问问题和相关要求进行语音合成,得到访问语音,在此不做限定。在此基础上,获取目标对象响应于访问语音对的回答语音,从而可以基于回答语音进行语音识别,得到受访回答,基于此即可将访问项目的访问问题和受访回答,作为对应访问项目的问答对话,直至访问模板中所有访问项目均访问完毕为止,即可基于访问模板中各个访问项目的问答对话,构造得到访问对话。示例性地,仍以应用于医疗行业为例,可以构造得到如前述公开实施例中下述格式的随访对话:

当然,上述问答对话的数据格式仅仅是实际应用过程中一种可能的实施方式,并不因此而限定问答对话的具体格式。需要说明的是,问答对话的数据格式以与前述公开实施例中样本对话的数据格式保持一致为宜。上述方式,目标模型能够结合语音合成和语音识别主动进行语音访问,有助于提升访问效率,并降低访问开销。

在一个实施场景中,在得到问答对话之后,即可将问答对话输入至目标模型,即可得到访问实例。当然,与前述公开实施例中获取预测实例类似地,为了便于目标模型理解,还可以构造第四提示,且第四提示用于指示目标模型将访问对话构造为访问实例,从而可以将访问对话和第四提示一同输入至目标模型,得到目标模型输出的访问实例。具体可以参阅前述公开实施例关于“预测实例”的相关描述,在此不再赘述。

上述方案,确定目标对象,并基于目标模型与目标对象进行交互,得到目标对象的访问实例,且目标模型基于上述目标模型训练方法训练得到,故一方面能够无需人工访问,有助于提高访问自动化程度,降低人力成本,另一方面通过上述目标模型训练方法所训练得到的目标模型与目标对象进行访问,也有助于提升访问稳定性。

请参阅图3,图3是本申请目标模型训练装置30一实施例的框架示意图。目标模型训练装置30包括:第一构造模块31、第二构造模块32、第三构造模块33和模型训练模块34,第一构造模块31,用于将报告模板和第一提示输入至大语言模型,得到样本模板;其中,第一提示用于指示大语言模型根据报告模板构造样本模板,且样本模板包含至少一个样本项目以及表征问询样本项目的样本问题;第二构造模块32,用于将样本模板和第二提示输入至大语言模型,得到样本实例;其中,第二提示用于指示大语言模型作为受访者回答样本问题,样本实例包含样本项目的样本回答;第三构造模块33,用于将样本实例和第三提示输入至大语言模型,得到样本对话;其中,第三提示用于指示大语言模型根据样本实例构造样本对话;模型训练模块34,用于基于样本对话和样本实例,对预设模型进行训练得到目标模型。

上述方案,目标模型训练装置30将报告模板和第一提示输入至大语言模型,得到样本模板,且第一提示用于指示大语言模型根据报告模板构造样本模板,样本模板包含至少一个样本项目以及表征问询样本项目的样本问题,再将样本模板和第二提示输入至大语言模型,得到样本实例,且第二提示用于指示大语言模型作为受访者回答样本问题,样本实例包含样本项目的样本回答,从而将样本实例和第三提示输入至大语言模型,得到样本对话,且第三提示用于指示大语言模型根据样本实例构造样本对话,进而基于样本对话和样本实例,对预设模型进行训练得到目标模型,故相较于通用数据上训练的大规模语言模型而言,通过以依次在三个阶段采用不同提示,利用大语言模型最终构造出专用于访问场景的训练样本,以训练预设模型,能够获取可稳定用于自动访问的目标模型。

在一些公开实施例中,第二构造模块32包括受访回答子模块,用于将样本项目的样本问题和第二提示输入至大语言模型,得到样本项目的样本回答;第二构造模块32包括实例获取子模块,用于将样本模板中各个样本项目的样本回答,分别附于样本模板中对应的样本项目,得到样本实例。

在一些公开实施例中,样本对话包括分别与各个样本项目对应的至少一轮对话,且每轮对话包括样本问题和样本回答。

在一些公开实施例中,样本模板还定义有回答封闭式样本项目的候选回答和可选范围,目标模型训练装置30包括提示构造模块,用于构造第二提示;其中,第二提示用于指示大语言模型作为受访者遵循可选范围选择样本项目的候选回答作为样本项目的样本回答。

在一些公开实施例中,模型训练模块34包括实例预测子模块,用于将样本对话输入至预设模型,得到预设模型生成的预测实例;模型训练模块34包括参数调整子模块,用于基于样本实例与预测实例之间的差异,调整预设模型的网络参数,直至预设模型经若干轮训练收敛,得到目标模型。

在一些公开实施例中,样本模板为结构化数据,且样本模板中各个样本项目分别为彼此独立的结构体;和/或,报告模板为病例报告模板,样本模板为样本随访模板,样本项目为所述样本随访项目,样本问题为样本随访问题。样本回答为所述样本受访回答,样本实例为样本随访实例,样本对话为样本随访对话。

请参阅图4,图4是本申请自动访问装置40一实施例的框架示意图。自动访问装置40包括:对象确定模块41和访问交互模块42,对象确定模块41,用于确定目标对象;访问交互模块42,用于基于目标模型与目标对象进行交互,得到目标对象的访问实例;其中,目标模型基于上述训练装置训练得到。

上述方案,自动访问装置40确定目标对象,并基于目标模型与目标对象进行交互,得到目标对象的访问实例,且目标模型基于上述目标模型训练方法训练得到,故一方面能够无需人工访问,有助于提高访问自动化程度,降低人力成本,另一方面通过上述目标模型训练方法所训练得到的目标模型与目标对象进行访问,也有助于提升访问稳定性。

在一些公开实施例中,访问交互模块42包括模板获取子模块,用于获取与目标对象匹配的访问模板;其中,访问模板包括至少一个访问项目以及表征问询访问项目的访问问题;访问交互模块42包括对话获取子模块,用于基于目标对象对访问模板中各个访问项目其访问问题的受访回答,得到目标模型与目标对象之间的问答对话;访问交互模块42包括实例获取子模块,用于将问答对话输入至目标模型,得到访问实例。

在一些公开实施例中,模板获取子模块包括模板匹配单元,用于获取与目标对象的对象信息相匹配的报告模板;模板获取子模块包括模板生成单元,用于将与目标对象的对象信息相匹配的报告模板和第一提示输入至大语言模型,得到访问模板。

在一些公开实施例中,访问交互模块42包括语音合成子模块,用于基于访问模板中访问项目其访问问题进行语音合成,得到用于向目标对象问询的访问语音;访问交互模块42包括语音接收子模块,用于获取目标对象响应于访问语音的回答语音;访问交互模块42包括语音识别子模块,用于基于回答语音进行语音识别,得到访问项目的受访回答。

请参阅图5,图5是本申请电子设备50一实施例的框架示意图。电子设备50包括相互耦接的存储器51和处理器52,处理器52用于执行存储器51中存储的程序指令,以实现上述任一目标模型训练方法实施例的步骤,或实现上述任一自动访问方法实施例中的步骤。在一个具体的实施场景中,电子设备50可以包括但不限于:微型计算机、服务器,此外,电子设备50还可以包括智能手机、平板电脑等移动设备,在此不做限定。

具体而言,处理器52用于控制其自身以及存储器51以实现上述任一目标模型训练方法实施例的步骤,或上述任一自动访问方法实施例中的步骤。处理器52还可以称为CPU(Central Processing Unit,中央处理单元)。处理器52可能是一种集成电路芯片,具有信号的处理能力。处理器52还可以是通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器52可以由集成电路芯片共同实现。

上述方案,电子设备50相较于通用数据上训练的大规模语言模型而言,通过以依次在三个阶段采用不同提示,利用大语言模型最终构造出专用于访问场景的训练样本,以训练预设模型,能够获取可稳定用于自动访问的目标模型。此外,基于以此训练得到的目标模型与目标对象进行交互,得到目标对象的访问实例,一方面能够无需人工访问,有助于提高访问的自动化程度,降低人力成本,另一方面通过目标模型与目标对象进行访问,也有助于提升对目标对象进行访问的稳定性。

请参阅图6,图6为本申请计算机可读存储介质60一实施例的框架示意图。计算机可读存储介质60存储有能够被处理器运行的程序指令601,程序指令601用于实现上述任一目标模型训练方法实施例的步骤,或实现上述任一自动访问方法实施例的步骤。

上述方案,计算机可读存储介质60相较于通用数据上训练的大规模语言模型而言,通过以依次在三个阶段采用不同提示,利用大语言模型最终构造出专用于自动访问场景的训练样本,以训练预设模型,能够获取可稳定用于自动访问的目标模型。此外,基于以此训练得到的目标模型与目标对象进行交互,得到目标对象的访问实例,一方面能够无需人工访问,有助于提高访问的自动化程度,降低人力成本,另一方面通过目标模型与目标对象进行访问,也有助于提升对目标对象进行访问的稳定性。

在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。

技术分类

06120116581366