掌桥专利:专业的专利平台
掌桥专利
首页

基于大语言模型的核保参考建议生成方法及相关装置

文献发布时间:2024-05-31 01:29:11


基于大语言模型的核保参考建议生成方法及相关装置

技术领域

本申请涉及人工智能领域,更具体的说,是涉及基于大语言模型的核保参考建议生成方法及相关装置。

背景技术

核保人员在向客户推荐保险产品时,通过客户的信息结合自身的知识和经验,确定核保参考建议,核保参考建议包括:适合客户的保险类型、核保结论和风险评估。这种方式不仅工作量大,而且容易受核保人员个体差异的影响,导致核保参考建议不准确。

发明内容

有鉴于此,本申请提供了一种基于大语言模型的核保参考建议生成方法及相关装置。

为实现上述目的,本申请提供如下技术方案:

根据本公开实施例的第一方面,提供一种基于大语言模型的核保参考建议生成方法,包括:

获取客户的属性信息,所述属性信息包括客户信息以及身体健康情况信息;

将所述属性信息替换预设提示工程模版中的第一替换符,以得到第一问题,所述预设提示工程模版包括表征从位于所述第一替换符所在位置的信息中获取核保关键信息的提示词;

将所述第一问题输入至预构建的保险领域大语言模型,通过所述保险领域大语言模型获得针对所述第一问题的第一答案,所述第一答案包括从所述属性信息中提取到的目标核保关键信息;

其中,所述保险领域大语言模型是以保险领域的样本问题作为输入,以人工标注答案作为训练目标训练大语言模型得到的;

从向量库中获取与所述第一答案相似度高于或等于预设阈值的历史核保关键信息对应的目标历史核保参考建议,所述向量库存储有历史核保关键信息与历史核保参考建议的对应关系;

将所述属性信息替换预设提示知识模版中的第二替换符,将所述目标历史核保参考建议替换所述预设提示知识模版中的第三替换符,以得到第二问题,所述预设提示知识模版包括表征基于位于所述第二替换符所在位置的信息以及位于所述第三替换符所在位置的信息生成核保参考建议的提示词;

将所述第二问题输入至所述保险领域大语言模型,通过所述保险领域大语言模型获取针对所述第二问题的第二答案,所述第二答案包括针对所述客户的核保参考建议;

获取第三问题,所述第三问题为核保人员基于所述属性信息、所述目标历史核保参考建议以及所述第二答案得到的;

将所述第二问题以及所述第三问题输入至所述保险领域大语言模型,通过所述保险领域大语言模型获取第三答案,所述第三答案包括针对所述第二答案更正后的核保参考建议。

根据本公开实施例的第二方面,提供一种基于大语言模型的核保参考建议生成装置,包括:

第一获取模块,用于获取客户的属性信息,所述属性信息包括客户信息以及身体健康情况信息;

第二获取模块,用于将所述属性信息替换预设提示工程模版中的第一替换符,以得到第一问题,所述预设提示工程模版包括表征从位于所述第一替换符所在位置的信息中获取核保关键信息的提示词;

第三获取模块,用于将所述第一问题输入至预构建的保险领域大语言模型,通过所述保险领域大语言模型获得针对所述第一问题的第一答案,所述第一答案包括从所述属性信息中提取到的目标核保关键信息;

其中,所述保险领域大语言模型是以保险领域的样本问题作为输入,以人工标注答案作为训练目标训练大语言模型得到的;

第四获取模块,用于从向量库中获取与所述第一答案相似度高于或等于预设阈值的历史核保关键信息对应的目标历史核保参考建议,所述向量库存储有历史核保关键信息与历史核保参考建议的对应关系;

第五获取模块,用于将所述属性信息替换预设提示知识模版中的第二替换符,将所述目标历史核保参考建议替换所述预设提示知识模版中的第三替换符,以得到第二问题,所述预设提示知识模版包括表征基于位于所述第二替换符所在位置的信息以及位于所述第三替换符所在位置的信息生成核保参考建议的提示词;

第六获取模块,用于将所述第二问题输入至所述保险领域大语言模型,通过所述保险领域大语言模型获取针对所述第二问题的第二答案,所述第二答案包括针对所述客户的核保参考建议;

第七获取模块,用于获取第三问题,所述第三问题为核保人员基于所述属性信息、所述目标历史核保参考建议以及所述第二答案得到的;

第八获取模块,用于将所述第二问题以及所述第三问题输入至所述保险领域大语言模型,通过所述保险领域大语言模型获取第三答案,所述第三答案包括针对所述第二答案更正后的核保参考建议。

根据本公开实施例的第三方面,提供一种服务器,包括:

处理器;

用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的基于大语言模型的核保参考建议生成。

根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如第一方面所述的基于大语言模型的核保参考建议生成。

根据本公开实施例的第五方面,提供一种计算机程序产品,可直接加载到计算机的内部存储器,并含有计算机程序,该计算机程序经由计算机载入并执行后能够实现如第一方面所述的基于大语言模型的核保参考建议生成。

经由上述的技术方案可知,本申请提供了一种基于大语言模型的核保参考建议生成方法,大语言模型可以对输入的问题中蕴含的关键信息进行精准概括;保险领域大语言模型是以保险领域的样本问题作为输入,以人工标注答案作为训练目标训练大语言模型得到的,所以保险领域大语言模型已经学了保险的相关知识;在保险领域大语言模型输入保险领域的问题后,可以输出答案,该答案包括问题中蕴含的关键信息;为了进一步使得保险领域大语言模型准确输出本申请想要的核保关键信息,输入至保险领域大语言模型的第一问题为客户的属性信息替换预设提示工程模版中的第一替换符得到的,预设提示工程模版包括表征从位于第一替换符所在位置的信息中获取核保关键信息的提示词,该提示词直接指出了保险领域大语言模型需要回答的问题,从而提高了保险领域大语言模型输出的核保关键信息的准确性。

可以理解的是,与第一答案相似度高于或等于预设阈值的历史核保关键信息对应的目标历史核保参考建议,很大概率上也是客户的核保参考建议;所以将包括属性信息、目标历史核保参考建议以及表征基于位于第二替换符所在位置的信息以及位于第三替换符所在位置的信息生成核保参考建议的提示词的第二问题输入至保险领域大语言模型。由于第二问题中的提示词直接指出了保险领域大语言模型需要回答的问题,所以提高了保险领域大语言模型从属性信息和历史核保参考建议学习到针对客户的核保参考建议的准确性。

可以理解的是,为了进一步提高保险领域大语言模型输出的包含针对客户的核保参考建议的第二答案,可以向核保人员展示属性信息、目标历史核保参考建议以及第二答案,若核保人员需要保险领域大语言模型进一步完善第二答案,则可以提出第三问题;将第二问题以及第三问题输入至险领域大语言模型,通过保险领域大语言模型获取第三答案,第三答案包括针对第二答案更正后的核保参考建议。

综上,本申请得到的第三答案包含的核保参考建议的准确度较高。而且需要人为参与的部分为提问第三问题的过程,该过程工作量小,而且由于保险领域大语言模型经过了大量的训练,得到的第二答案的准确度较高,所以即使在提问第三问题的过程中核保人员个体差异较大,也不会导致核保参考建议的准确度差距很大,从整体上看核保参考建议的准确度较高。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1是根据一示例性实施例示出的一种硬件架构的示意图;

图2是根据一示例性实施例示出的一种基于大语言模型的核保参考建议生成方法的流程图;

图3是根据一示例性实施例示出的一种预设提示工程模版的示意图;

图4是根据一示例性实施例示出的一种预设提示知识模版的示意图;

图5是根据一示例性实施例示出的一种基于大语言模型的核保参考建议生成装置框图;

图6是根据一示例性实施例示出的一种用于服务器的装置的框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本申请实施例提供了一种基于大语言模型的核保参考建议生成方法及相关装置,在对本申请实施例提供的技术方案说明之前,先对本申请涉及硬件架构进行说明。

图1是根据一示例性实施例示出的一种硬件架构的示意图,该硬件架构包括:电子设备11、向量库12、保险行业数据库13以及服务器14。

示例性的,电子设备11可以为任何一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品,例如,手机、平板电脑、掌上电脑、个人计算机、可穿戴设备、智能电视等。

电子设备11为核保人员持有的设备。

核保是指保险公司根据投保人给出的保险条件及投保证明等相关信息,通过核实及核保程序来确定投保是否符合保险合同的条件,并确定投保的岗位的过程。核保的过程是保险交易最重要的环节,能够确保保险公司及时获得准确的业务和损失信息,同时保证保险公司的稳定经营。

本申请实施例中将进行核保的人员称为核保人员。

示例性的,服务器14存储有保险领域大语言模型,可以执行本申请实施例提供的基于大语言模型的核保参考建议生成方法。

示例性的,服务器14可以为一台服务器,也可以是由多台服务器组成的服务器集群,或者,是一个云计算服务中心。

示例性的,保险行业数据库13存储有训练或更新保险领域答语言模型的样本数据。

示例性的,向量库12存储有历史核保关键信息与历史核保参考建议的对应关系。

示例性的,核保人员可以通过电子设备11输入客户的属性信息,所述属性信息包括客户信息以及身体健康情况信息。电子设备11可以将客户的属性信息发送至服务器14,服务器14与向量库12进行交互,可以得到针对客户的核保参考建议;示例性的,核保人员可以通过电子设备11查看核保参考建议,若认为仍旧需要完善,则可以提出问题,服务器通过保险领域大语言模型结合该问题对之前的核保参考建议进行完善,并发送至电子设备11;若核保人员仍然认为核保参考建议不准确,则再次提出问题,服务器通过保险领域大语言模型结合再次提出的问题对之前的核保参考建议进行完善,并发送至电子设备11,直至核保人员认为核保参考建议准确为止,所以通过保险领域大语言模型得到的核保参考建议比较准确。

示例性的,核保人员每次输入的问题可能不同,可能相同。

示例性的,核保人员通过电子设备11获得核保参考建议后,可以向客户进行反馈。

本领域技术人员应能理解上述电子设备和服务器仅为举例,其他现有的或今后可能出现的电子设备或服务器如可适用于本公开,也应包含在本公开保护范围以内,并在此以引用方式包含于此。

下面结合上述硬件架构对本申请实施例提供的基于大语言模型的核保参考建议生成方法进行说明。

图2是根据一示例性实施例示出的一种基于大语言模型的核保参考建议生成方法的流程图,如图2所示,基于大语言模型的核保参考建议生成方法用于服务器中,包括以下步骤S201至步骤S208。

步骤S201:获取客户的属性信息,所述属性信息包括客户信息以及身体健康情况信息。

示例性的,身体健康情况包括但不限于体检报告的内容。

示例性的,身体健康情况可以基于社保卡获得。

示例性的,客户信息包括但不限于:姓名、身份证号、联系方式、职业、生活习惯。

步骤S202:将所述属性信息替换预设提示工程模版中的第一替换符,以得到第一问题,所述预设提示工程模版包括表征从位于所述第一替换符所在位置的信息中获取核保关键信息的提示词。

为了本领域技术人员更加理解预设提示工程模版,下面举例进行说明。

图3是根据一示例性实施例示出的一种预设提示工程模版的示意图。

如图3所示,{content}为第一替换符。预设提示工程模版包括的提示词为“你是一名保险领域的专业人士,请根据以上内容,提取核保相关的关键信息,包括但不限于性别、年龄、疾病史等。要求专业且详细,禁止添加编造的成分”

可以理解的是,图3仅为示例,并不对预设提示工程模版的结构和内容进行限定。

若预设提示工程模版如图3所示,则第一问题包括属性信息以及“你是一名保险领域的专业人士,请根据以上内容,提取核保相关的关键信息,包括但不限于性别、年龄、疾病史等。要求专业且详细,禁止添加编造的成分”。

步骤S203:将所述第一问题输入至预构建的保险领域大语言模型,通过所述保险领域大语言模型获得针对所述第一问题的第一答案,所述第一答案包括从所述属性信息中提取到的目标核保关键信息。

其中,所述保险领域大语言模型是以保险领域的样本问题作为输入,以人工标注答案作为训练目标训练得到的。

下面举例对保险领域的样本问题和人工标注答案进行说明。

样本问题可以为:李先生购买了终身寿险20万元,意外伤害险30万元,在保险合同有效期内且观察期通过后,李先生感染肺炎,医治无效死亡,请问李先生的受益人可以获得多少赔款。该样本问题的人工标注答案可以为具体的款项金额。

下面对保险领域大语言模型为何可以从第一问题中分析得到目标核保关键信息的原因进行说明。

大语言模型(Large Language Model,LLM)是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译等。

示例性的,从大语言模型至保险领域大语言模型通过了3次训练,分别如下:

第一次训练为上下文语义训练。

第一次训练的训练集包括样本数据与标签的对应关系,该样本数据为文本信息,标签为文本信息的上文内容或下文内容。训练集并不限定是保险领域,可以为各个领域的样本数据。

经过第一次训练后,大语言模型具有强大的语言理解和生成能力,能够处理各种自然语言任务,如文本分类、实体识别、关系抽取等。

第二次训练为指令精调训练。

第二次训练的训练集包括样本问题和答案(即标签)的对应关系,该样本问题可以为各种领域中的各种各样的问题。

经过第二次训练后,大语言模型具有对内容进行深度解析、语义挖掘和提取关键信息的能力。

第三次训练为垂直领域的指令精调。

在本申请实施例中,垂直领域为保险领域。第三次训练的训练集包括保险领域的各种样本问题和答案。

经过第三次训练后,大语言模型已经学习了保险领域的知识。

经过上述三次训练后,得到的大语言模型为保险领域大语言模型,保险领域大语言模型具有泛化能力。

示例性的,训练的得到的保险领域大语言模型可以对于属性信息进行深度解析,可以对属性信息中蕴含的关键信息进行精准概括,例如,可以从属性信息中获得基本信息和风险信息,基本信息包括但不限于:姓名、性别、年龄、职业;风险信息包括但不限于:身体健康情况、既往病史、生活习惯。

步骤S204:从向量库中获取与所述第一答案相似度高于或等于预设阈值的历史核保关键信息对应的目标历史核保参考建议。

所述向量库存储有历史核保关键信息与历史核保参考建议的对应关系。

示例性的,历史核保关键信息是历史参保人的核保关键信息。历史参保人已经购买了保险产品,该历史参保人的历史核保参考建议是已知的。

可以理解是,与第一答案相似度高于或等于预设阈值的历史核保关键信息对应的目标历史核保参考建议,很大概率上是客户的核保参考建议。

示例性的,可以采用faiss检索算法计算第一答案和历史核保关键信息的相似度。

步骤S205:将所述属性信息替换预设提示知识模版中的第二替换符,将所述目标历史核保参考建议替换所述预设提示知识模版中的第三替换符,以得到第二问题。

所述预设提示知识模版包括表征基于位于所述第二替换符所在位置的信息以及位于所述第三替换符所在位置的信息生成核保参考建议的提示词。

为了让本领域技术人员更加理解预设提示知识模版,下面举例进行说明。

图4是根据一示例性实施例示出的一种预设提示知识模版的示意图。

图4是结合了保险人的特征、保险公司的具体产品以及以往的核保经验,得到的图4所示的提示词。

如图4所示,{content1}为第二替换符。{content2}为第三替换符。图4中显示的“核保经验参考”即为目标历史核保参考建议。预设提示知识模版包括的提示词为“你是一名保险领域的专业人士,请根据以上内容,生成核保参考意见。要求专业且详细,禁止添加编造的成分”

可以理解的是,图4仅为示例,并不对预设提示知识模版的结构和内容进行限定。

若预设提示知识模版如图4所示,则第二问题包括目标核保关键信息、目标历史核保参考建议以及“你是一名保险领域的专业人士,请根据以上内容,生成核保参考意见。要求专业且详细,禁止添加编造的成分”。

步骤S206:将所述第二问题输入至所述保险领域大语言模型,通过所述保险领域大语言模型获取针对所述第二问题的第二答案。

所述第二答案包括针对所述客户的核保参考建议。

步骤S207:获取第三问题,所述第三问题为核保人员基于所述属性信息、所述目标历史核保参考建议以及所述第二答案得到的。

步骤S208:将所述第二问题以及所述第三问题输入至所述保险领域大语言模型,通过所述保险领域大语言模型获取第三答案,所述第三答案包括针对所述第二答案更正后的核保参考建议。

示例性的,可以将所述属性信息、所述目标历史核保参考建议以及所述第二答案发送至电子设备11,核保人员通过电子设备11查看属性信息、所述目标历史核保参考建议以及所述第二答案,若核保人员认为第二答案需要进一步完善,则可以提出问题1;将第二问题和问题1输入至保险领域大语言模型,通过所述保险领域大语言模型输出答案1(称为一次迭代);将属性信息、所述目标历史核保参考建议以及答案1发送至电子设备11,若核保人员认为答案1需要进一步完善,则可以提出问题2;将第二问题和问题2输入至保险领域大语言模型,通过保险领域大语言模型输出答案2(称为一次迭代);将属性信息、所述目标历史核保参考建议以及答案2发送至电子设备11,若核保人员认为答案2需要进一步完善,则可以提出问题3;依次类推,不再赘述,直至核保人员认可包含核保参考建议的答案为止。

示例性的,第三问题包括一个或多个问题;不同的问题可以是不同迭代次数中由核保人员提出的。

示例性的,核保人员可以对保险领域大语言模型得到的包含核保参考建议的答案进行评分,若评分较高,则可以将客户的目标核保关键信息与核保参考建议存储至向量库。

本申请实施例提供了一种基于大语言模型的核保参考建议生成方法,大语言模型可以对输入的问题中蕴含的关键信息进行精准概括;保险领域大语言模型是以保险领域的样本问题作为输入,以人工标注答案作为训练目标训练大语言模型得到的,所以保险领域大语言模型已经学了保险的相关知识;在保险领域大语言模型输入保险领域的问题后,可以输出答案,该答案包括问题中蕴含的关键信息;为了进一步使得保险领域大语言模型准确输出本申请想要的核保关键信息,输入至保险领域大语言模型的第一问题为客户的属性信息替换预设提示工程模版中的第一替换符得到的,预设提示工程模版包括表征从位于第一替换符所在位置的信息中获取核保关键信息的提示词,该提示词直接指出了保险领域大语言模型需要回答的问题,从而提高了保险领域大语言模型输出的核保关键信息的准确性。

可以理解的是,与第一答案相似度高于或等于预设阈值的历史核保关键信息对应的目标历史核保参考建议,很大概率上也是客户的核保参考建议;所以将包括属性信息、目标历史核保参考建议以及表征基于位于第二替换符所在位置的信息以及位于第三替换符所在位置的信息生成核保参考建议的提示词的第二问题输入至保险领域大语言模型。由于第二问题中的提示词直接指出了保险领域大语言模型需要回答的问题,所以提高了保险领域大语言模型从属性信息和历史核保参考建议学习到针对客户的核保参考建议的准确性。

可以理解的是,为了进一步提高保险领域大语言模型输出的包含针对客户的核保参考建议的第二答案,可以向核保人员展示属性信息、目标历史核保参考建议以及第二答案,若核保人员需要保险领域大语言模型进一步完善第二答案,则可以提出第三问题;将第二问题以及第三问题输入至险领域大语言模型,通过保险领域大语言模型获取第三答案,第三答案包括针对第二答案更正后的核保参考建议。

综上,本申请得到的第三答案包含的核保参考建议的准确度较高。而且需要人为参与的部分为提问第三问题的过程,该过程工作量小,而且由于保险领域大语言模型经过了大量的训练,得到的第二答案的准确度较高,所以即使在提问第三问题的过程中核保人员个体差异较大,也不会导致核保参考建议的准确度差距很大,从整体上看核保参考建议的准确度较高。

在一可选实现方式中,获取历史核保关键信息与历史核保参考建议的对应关系的过程包括以下步骤A11至步骤A16。

步骤A11:获取历史参保人的核保参考文件,所述核保参考文件包括历史核保关键信息以及历史核保参考建议。

示例性的,核保参考文件的格式可以为任意格式,例如,PDF、WORD、TXT。

示例性的,非结构化加载器可以将任意格式的核保参考文件转换为纯文本格式的文件。

步骤A12:确定所述核保参考文件中包含所述历史核保关键信息的第一文件区域以及包含所述历史核保参考建议的第二文件区域。

可以理解的是,核保参考文件有自己的格式,历史核保关键信息和历史核保参考建议信息位于核保参考文件的不同文件区域。

步骤A13:将位于所述核保参考文件中所述第一文件区域的文本进行文本分割,以得到包含所述历史核保关键信息的第一文本块。

步骤A14:将位于所述核保参考文件中所述第二文件区域的文本进行文本分割,以得到包含所述历史核保参考建议的第二文本块。

示例性的,进行文本分割时可以按照语句分割,如一个或多个语句为一个文本块;示例性的,进行文本分割时,可以按照段落分割,如一个或多个段落为一个文本块;示例性的,进行文本分割时,可以按照字数分割,如设定字数的文本为一个文本块。

步骤A15:将所述第一文本块以及所述第二文本块输入至词嵌入模型,以得到所述第一文本块对应的第一向量和所述第二文本块对应的第二向量。

步骤A16:存储所述第一向量和所述第二向量至所述向量库。

示例性的,词嵌入模型可以为text2vec词嵌入模型。

可以理解的是,向量库中存储的历史核保关键信息与历史核保参考建议的对应关系越准确,从向量库中获取与第一答案相似度高于或等于预设阈值的历史核保关键信息对应的目标历史核保参考建议就越准确。为了能够获得准确的历史核保关键信息与历史核保参考建议的对应关系,对历史参保人的核保参考文件的格式有一定的要求。示例性的,具体要求如下:

所述核保参考文件中的所述历史核保关键信息包含第一字段和第一字段值的对应关系,所述核保参考文件中的所述历史核保参考建议包括第二字段和第二字段值的对应关系。

其中,每一所述第一字段和所述第一字段值的对应关系位于所述核保参考文件中的一行,不同所述第一字段和所述第一字段值的对应关系位于所述核保参考文件的不同行;每一所述第二字段和所述第二字段值的对应关系位于所述核保参考文件中的一行;不同所述第二字段和所述第二字段值的对应关系位于所述核保参考文件的不同行。

下面举例对“历史核保关键信息包含第一字段和第一字段值的对应关系”进行说明。

假设历史核保关键信息包括:姓名,张三;年龄,30,性别,男。则第一字段为姓名、年龄和性别;第一字段值为张三、30、男。“姓名,张三”为一个第一字段和第一字段值的对应关系;“年龄,30”为另一个第一字段和第一字段值的对应关系;“性别,男”为又一个第一字段和第一字段值的对应关系。

下面举例对“所述历史核保参考建议包括第二字段和第二字段值的对应关系”进行说明。

假设历史核保参考建议包括:核保结果,通过;风险信息,风险等级1;保险类型,保险类型2;则第二字段为核保结果、风险信息、保险类型;第二字段值为通过、风险等级1、保险类型2;“核保结果,通过”为一个第二字段和第二字段值的对应关系;“风险信息,风险等级1”为另一个第二字段和第二字段值的对应关系;“保险类型,保险类型2”为又一个第二字段和第二字段值的对应关系。

综上,第一字段和第一字段值采用键值对的形式对应存储,如第一字段为键,第一字段值为值;第二字段和第二字段值采用键值对的形式对应存储,如第二字段为键,第二字段值为值。示例性的,第一字段和第一字段值之间可以用设定符号进行分隔,如“,”;示例性的,第二字段和第二字段值之间可以用设定符号进行分隔,如“,”。

示例性的,每一第一字段和第一字段值为一个键值对,每一个第二字段和第二字段值为一个键值对。若不同的键值对位于不同行,则不同键值对之间用“换行符”分隔。从而明确了不同键值对之间的边界。在分割得到文本块的过程中可以有效的区分各个键值对,减低混淆键值对中键和值的情况,从而提高了获得历史核保关键信息与历史核保参考建议的准确度,也提高了获得准确的历史核保关键信息与历史核保参考建议的对应关系的准确度。

可以理解的是,若不同键值对位于不同行,则将位于所述核保参考文件中所述第一文件区域的文本进行文本分割,以得到包含所述历史核保关键信息的第一文本块步骤包括:确定所述第一文件区域中每一行所述第一字段和所述第一字段值的对应关系为一个所述第一文本块。

所述将位于所述核保参考文件中所述第二文件区域的文本进行文本分割,以得到包含所述历史核保参考建议的第二文本块步骤包括:确定所述第二文件区域中每一行所述第二字段和所述第二字段值的对应关系为一个所述第二文本块。

在一可选实现方式中,步骤S204的实现方式有多种,本申请实施例提供但不限于以下方法,该方法包括以下步骤B11至步骤B13。

步骤B11:将所述第一答案输入至所述词嵌入模型,以得到第三向量。

示例性的,词嵌入模型可以为ext2vec词嵌入模型。

示例性的,词嵌入模型是一种将文本映射到实数向量的方法,它捕获了文本的语义信息。词嵌入模型通过对大规模文本语料库进行训练,将每个单词表示为该单词在语料库中出现的上下文信息的密集向量表示。这种表示方法为单词的语义信息提供了连续的实数空间,使得语义相似的单词在空间中相互接近。

步骤B12:从所述向量库中获得与所述第三向量相似度高于或等于所述预设阈值的目标第一向量。

示例性的,预设阈值可以基于实际情况而定,这里不进行限定。

步骤B13:从所述向量库中获取所述目标第一向量对应的第二向量。

本申请实施例中的第一问题和第二问题中的提示词均为提示词,用于引导保险领域大语言模型完成逾期生成结果的输入语句。

本申请实施例使用保险领域大语言模型与向量库相结合,自动生成核保参考建议,提升了得到的核保参考建议的准确性和效率,减少了人工审查的成本和时间,适应大规模数据处理的需求,具有明显的经济和社会效益。

上述本申请公开的实施例中详细描述了方法,对于本申请的方法可采用多种形式的装置实现,因此本申请还公开了一种装置,下面给出具体的实施例进行详细说明。

图5是根据一示例性实施例示出的一种基于大语言模型的核保参考建议生成装置框图。参照图5,该装置包括:第一获取模块501、第二获取模块502、第三获取模块503、第四获取模块504、第五获取模块505、第六获取模块506、第七获取模块507以及第八获取模块508,其中:

第一获取模块501,用于获取客户的属性信息,所述属性信息包括客户信息以及身体健康情况信息;

第二获取模块502,用于将所述属性信息替换预设提示工程模版中的第一替换符,以得到第一问题,所述预设提示工程模版包括表征从位于所述第一替换符所在位置的信息中获取核保关键信息的提示词;

第三获取模块503,用于将所述第一问题输入至预构建的保险领域大语言模型,通过所述保险领域大语言模型获得针对所述第一问题的第一答案,所述第一答案包括从所述属性信息中提取到的目标核保关键信息;

其中,所述保险领域大语言模型是以保险领域的样本问题作为输入,以人工标注答案作为训练目标训练大语言模型得到的;

第四获取模块504,用于从向量库中获取与所述第一答案相似度高于或等于预设阈值的历史核保关键信息对应的目标历史核保参考建议,所述向量库存储有历史核保关键信息与历史核保参考建议的对应关系;

第五获取模块505,用于将所述属性信息替换预设提示知识模版中的第二替换符,将所述目标历史核保参考建议替换所述预设提示知识模版中的第三替换符,以得到第二问题,所述预设提示知识模版包括表征基于位于所述第二替换符所在位置的信息以及位于所述第三替换符所在位置的信息生成核保参考建议的提示词;

第六获取模块506,用于将所述第二问题输入至所述保险领域大语言模型,通过所述保险领域大语言模型获取针对所述第二问题的第二答案,所述第二答案包括针对所述客户的核保参考建议;

第七获取模块507,用于获取第三问题,所述第三问题为核保人员基于所述属性信息、所述目标历史核保参考建议以及所述第二答案得到的;

第八获取模块508,用于将所述第二问题以及所述第三问题输入至所述保险领域大语言模型,通过所述保险领域大语言模型获取第三答案,所述第三答案包括针对所述第二答案更正后的核保参考建议。

在一可选实现方式中,还包括:

第九获取模块,用于获取历史参保人的核保参考文件,所述核保参考文件包括历史核保关键信息以及历史核保参考建议;

第一确定模块,用于确定所述核保参考文件中包含所述历史核保关键信息的第一文件区域以及包含所述历史核保参考建议的第二文件区域;

第一分割模块,用于将位于所述核保参考文件中所述第一文件区域的文本进行文本分割,以得到包含所述历史核保关键信息的第一文本块;

第二分割模块,用于将位于所述核保参考文件中所述第二文件区域的文本进行文本分割,以得到包含所述历史核保参考建议的第二文本块;

第十获取模块,用于将所述第一文本块以及所述第二文本块输入至词嵌入模型,以得到所述第一文本块对应的第一向量和所述第二文本块对应的第二向量;

存储模块,用于存储所述第一向量和所述第二向量至所述向量库。

在一可选实现方式中,所述第四获取模块包括:

第一获取单元,用于将所述第一答案输入至所述词嵌入模型,以得到第三向量;

第二获取单元,用于从所述向量库中获得与所述第三向量相似度高于或等于所述预设阈值的目标第一向量;

第三获取单元,用于从所述向量库中获取所述目标第一向量对应的第二向量。

在一可选实现方式中,所述核保参考文件中的所述历史核保关键信息包含第一字段和第一字段值的对应关系,所述核保参考文件中的所述历史核保参考建议包括第二字段和第二字段值的对应关系;

其中,每一所述第一字段和所述第一字段值的对应关系位于所述核保参考文件中的一行,不同所述第一字段和所述第一字段值的对应关系位于所述核保参考文件的不同行;每一所述第二字段和所述第二字段值的对应关系位于所述核保参考文件中的一行;不同所述第二字段和所述第二字段值的对应关系位于所述核保参考文件的不同行。

在一可选实现方式中,所述第一分割模块包括:第一确定单元,用于确定所述第一文件区域中每一行所述第一字段和所述第一字段值的对应关系为一个所述第一文本块;所述第二分割模块包括:第二确定单元,用于确定所述第二文件区域中每一行所述第二字段和所述第二字段值的对应关系为一个所述第二文本块。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图6是根据一示例性实施例示出的一种用于服务器的装置的框图。

服务器包括但不限于:处理器61、存储器62、网络接口63、I/O控制器64以及通信总线65。

需要说明的是,本领域技术人员可以理解,图6中示出的服务器的结构并不构成对服务器的限定,服务器可以包括比图6所示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图6对服务器的各个构成部件进行具体的介绍:

处理器61是服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器62内的软件程序和/或模块,以及调用存储在存储器62内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。处理器61可包括一个或多个处理单元;示例性的,处理器61可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器61中。

处理器61可能是一个中央处理器(Central Processing Unit,CPU),或者是特定集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;

存储器62可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM)621和只读存储器(Read-Only Memory,ROM)622,也可能还包括大容量存储设备623,例如至少1个磁盘存储器等。当然,该服务器还可能包括其他业务所需要的硬件。

其中,上述的存储器62,用于存储上述处理器61可执行指令。上述处理器61具有执行基于大语言模型的核保参考建议生成方法的功能。

一个有线或无线网络接口63被配置为将服务器连接到网络。

处理器61、存储器62、网络接口63和I/O控制器64可以通过通信总线65相互连接,该通信总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。

在示例性实施例中,服务器可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述基于大语言模型的核保参考建议生成方法。

在示例性实施例中,本公开实施例提供了一种包括指令的存储介质,例如包括指令的存储器62,上述指令可由服务器的处理器61执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机可读存储介质,可直接加载到计算机的内部存储器,例如上述存储器62中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述基于大语言模型的核保参考建议生成方法。

在示例性实施例中,还提供一种计算机程序产品,可直接加载到计算机的内部存储器,例如所述服务器包含的存储器中,并含有软件代码,该计算机程序经由计算机载入并执行后能够实现上述所述基于大语言模型的核保参考建议生成方法。

需要说明的是,本说明书中的各个实施例中记载的特征可以相互替换或者组合。对于装置或系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 基于大数据的核保方法、装置、设备及可读存储介质
  • 基于AI大语言模型的数据大屏生成方法及系统
  • 一种基于大语言模型的知识库知识检索方法及相关装置
技术分类

06120116626530