掌桥专利:专业的专利平台
掌桥专利
首页

基于大语言模型的信息获取方法、装置、设备及介质

文献发布时间:2024-04-18 20:00:50


基于大语言模型的信息获取方法、装置、设备及介质

技术领域

本公开涉及大模型领域,具体涉及人工智能、大语言模型和人机交互领域,尤其涉及一种基于大语言模型的信息获取方法、装置、设备及介质。

背景技术

近年来,大语言模型的理解和生成能力大幅提升,其应用领域也得到了广泛的扩展。

大型语言模型(LLM,Large Language Model,其本质是生成式模型),是指使用大量文本数据训练的深度学习模型,可以理解语言文本的含义,并生成符合用户意图的内容,例如,执行任务、进行人机对话、问题解答和图像生成等。

发明内容

本公开提供了一种基于大语言模型的信息获取方法、装置、设备及介质。

根据本公开的一方面,提供了一种基于大语言模型的信息获取方法,包括:

获取自然语言内容;

将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态;

响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态;

将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态;

响应于确定所述第二中间状态中包括所述目标生成内容,根据所述第二中间状态得到所述自然语言内容的回复内容。

根据本公开的一方面,提供了一种基于大语言模型的信息获取装置,包括:

自然语言内容获取模块,用于获取自然语言内容;

当前中间状态获取模块,用于将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态;

输入状态更新模块,用于响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态;

中间状态更新模块,用于将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态;

回复内容输出模块,用于响应于确定所述第二中间状态中包括所述目标生成内容,根据所述第二中间状态得到所述自然语言内容的回复内容。

根据本公开的另一方面,提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述的基于大语言模型的信息获取方法。

根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开任一实施例所述的基于大语言模型的信息获取方法。

根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开任一实施例所述的基于大语言模型的信息获取方法。

本公开实施例可以提高大语言模型的输出结果准确性。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开实施例公开的一种基于大语言模型的信息获取方法的流程图;

图2是根据本公开实施例公开的另一种基于大语言模型的信息获取方法的流程图;

图3是根据本公开实施例公开的另一种基于大语言模型的信息获取方法的流程图;

图4是根据本公开实施例公开的一种基于大语言模型的信息获取方法的场景图;

图5是根据本公开实施例公开的基于大语言模型的信息获取装置的结构示意图;

图6是根据本公开实施例公开的基于大语言模型的信息获取方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

图1是根据本公开实施例公开的一种基于大语言模型的信息获取方法的流程图,本实施例可以适用于大语言模型执行推理任务,获取到自然语言内容对应的回复内容的情况。本实施例方法可以由基于大语言模型的信息获取装置来执行,该装置可采用软件和/或硬件的方式实现,并具体配置于具有一定数据运算能力的电子设备中,该电子设备可以是客户端设备或服务器设备,客户端设备例如手机、平板电脑、车载终端和台式电脑等。

S101、获取自然语言内容。

自然语言内容可以是指用户在人机交互过程中输入的自然语言内容。自然语言内容可以理解为为了调用大语言模型实现需求的功能,用户所提供的包含用户意图的内容。其中,用户可以以文本、图像、语音或视频等至少一个类型的方式输入数据,对直接输入的数据进行识别,得到自然语言内容。客户端可以接收用户输入数据,并发送至本公开实施例的电子设备,该电子设备根据输入数据获取自然语言内容。

可选的,自然语言内容为用户输入的问题内容。自然语言内容可理解为多个推理任务。在对自然语言内容理解时,可以仿照人类在遇到问题时所产生的思考和推理步骤,将自然语言内容的理解生成过程,拆分为多个子过程,每个子过程对应链式推理中的一个推理任务。以数学问题的解答过程为例,自然语言内容的理解生成过可以拆解得到从数学问题到最终答案之间的多个推理步骤。在一个具体的例子中,自然语言内容为问题文本。

S102、将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态。

大语言模型用于对自然语言内容进行理解,并生成对应的回复内容。可选的,大语言模型为问答模型,大语言模型用于对问题内容进行解答,并生成回复内容反馈给用户。其中,大语言模型可以替换为其他可以具有语义理解,并生成问题的答案的功能的模型。

中间状态可以是指生成自然语言内容对应的最终回复内容的过程中所产生的中间内容。实际上,大语言模型会模仿人类推理过程,对自然语言内容逐步理解生成,而过程中产生的数据,即为中间状态,当得到最终回复内容时,整个推理过程结束,大语言模型得到最终回复内容,并反馈。需要说明的是,最终回复内容实际是最后产生的中间状态包括的内容。当前的第一中间状态为自然语言内容输入到大语言模型中得到的中间状态。

S103、响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态。

目标生成内容用于标识最终回复内容。自然语言内容为问题,目标生成内容为用于标识问题的最终答案的文本。示例性的,目标生成内容为关键词,例如,目标生成内容为“因此,最终答案是”,又如,目标生成内容为“最终结果为”等。目标内容为可以是表示第一中间状态中包括最终答案的示意性内容的文本。

第一中间状态不包括目标生成内容,表明,第一中间状态不存在最终回复内容,需要继续输入大语言模型中进行推理。第一中间状态包括目标生成内容,从第一中间状态中提取自然语言内容的回复内容。

输入状态可以是指需要输入到大语言模型中进行理解生成的状态,输入状态表明大语言模型理解生成的程度,基于该程度,大语言模型继续理解生成。根据每次产生的中间状态不断更新输入状态。当前的第一输入状态可以是空。在生成第一中间状态之后,根据第一中间状态更新第一输入状态。

根据第一中间状态,更新第一输入状态,具体是将中间状态与输入状态融合,将中间状态添加到输入状态中,并作为新的输入状态,此时,新的输入状态包括正在执行的过程和已经执行的过程所产生的中间状态。例如,第一中间状态添加到第一输入状态中,得到第二输入状态。输入状态可以是当前执行过程和已经执行过程所产生的中间状态集合,例如,已经执行过程产生的中间状态为x1,当前的中间状态为x2,输入状态为x1和x2。

示例性的,自然语言内容输入到大语言模型中,得到的第一中间状态为x1,将x1更新第一输入状态,得到第二输入状态x1,将x1与自然语言内容输入到大语言模型中,得到新的第二中间状态x2,得到第三输入状态x1和x2,以此类推,基于x2和自然语言内容最终更新得到新的第三中间状态x3,新的第四输入状态x1、x2和x3,最终可以得到输入状态为X{x1,x2,x3……xn}。

S104、将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态。

将自然语言内容和第二输入状态输入到大语言模型中,可以理解为将问题和问题的第一步推理步骤,发送至大语言模型中执行第二步推理步骤。自然语言内容可以理解为中间状态的上下文。

S105、响应于确定所述第二中间状态中包括所述目标生成内容,根据所述第二中间状态得到所述自然语言内容的回复内容。

第二中间状态包括目标生成内容,表明第二中间状态存在最终回复内容,推理结束。在第二中间状态中提取回复内容,确定为自然语言内容的回复内容。或者还可以从第二中间状态和第二输入状态中提取回复内容。

若新的中间状态不包括目标生成内容,再将新的中间状态更新输入状态,将新的输入状态和自然语言内容输入到大语言模型中,此时,自然语言内容,以及全部已经执行的过程中所产生的中间状态都视为最新产生的中间状态的上下文,实现将问题的上下文和最新产生的中间状态均输入到大语言模型中,执行下一步推理步骤,可以丰富输入信息,增加大语言模型的理解的内容,提高大语言模型的输出结果准确性。

第二输入状态和自然语言内容输入到大语言模型中,得到第二中间状态;若第二中间状态不包括目标生成内容,根据第二中间状态更新第二输入状态,得到第三输入状态,将第三输入状态和自然语言内容输入到大语言模型中,得到第三中间状态。继续检测第三中间状态是否包括目标生成内容,若不包括,继续更新输入状态,得到新的中间状态继续判断。将自然语言内容和不断更新的输入状态输入到大语言模型中,得到新的中间状态,并根据新的中间状态更新输入状态,不断循环上述过程,直至新的中间状态包括目标生成内容。

在一个具体的例子中,输入和输出的内容均为文本。自然语言内容:2*3+1=?将自然语言内容输入至大语言模型中,得到当前的中间状态:1、计算,乘法,2*3=6;将自然语言内容和当前的输入状态也即当前的中间状态输入至大语言模型中,得到当前的中间状态:2、计算,乘法结果的求和,6+1=7,因此,答案为7。当前的输入状态更新为:1、计算,乘法,2*3=6;2、计算,乘法结果的求和,6+1=7,因此,答案为7。目标生成内容为“因此,答案为”。当前的中间状态和当前的输入状态均包括目标生成内容,提取自然语言内容的回复内容为:答案为7。

在一个可选的实施例中,自然语言内容为文本,将文本输入到大语言模型中,得到第一中间状态的文本。在确定第一中间状态的文本内容中包括目标生成内容时,从第一中间状态中提取自然语言内容的回复内容的文本。在确定第一中间状态的文本内容中不包括目标生成内容时,将第一中间状态的文本更新文本为空的第一输入状态,得到第二输入状态的文本。将第二输入状态的文本和自然语言内容的文本输入到大语言模型中,得到第二中间状态的文本。在确定第二中间状态的文本内容中包括目标生成内容时,从第二中间状态的文本中提取自然语言内容的回复内容的文本。在确定第二中间状态的文本内容中不包括目标生成内容时,将第二中间状态的文本更新第二输入状态,得到第三输入状态的文本。将第三输入状态的文本和自然语言内容的文本输入到大语言模型中,得到第三中间状态的文本。以此类推,直至生成的中间状态的文本包括目标生成内容,从该中间状态中提取自然语言内容的回复内容的文本。

根据本公开的技术方案,通过将自然语言内容输入到大语言模型中,得到当前的中间状态,并更新当前的输入状态,将自然语言内容和不断更新的当前的输入状态输入到大语言模型中,得到当前的中间状态,并根据当前的中间状态更新当前的输入状态,不断循环上述过程,直至当前的中间状态包括目标生成内容,从当前的中间状态中提取自然语言内容的回复内容,可以实现逐步推理,并且每步推理基于前述状态进行约束,在逐步推理过程中丰富输入内容的上下文,使得整个过程更加可控,缓解大模型的幻觉现象,提高大语言模型的输出结果准确性,尤其是针对问题文本的应用场景,可以提高基于大语言模型回复的准确性。

图2是根据本公开实施例公开的另一种基于大语言模型的信息获取方法的流程图,基于上述技术方案进一步优化与扩展,并可以与上述各个可选实施方式进行结合。所述第一中间状态,包括:第一动作、第一动作描述内容、第一动作推理过程、第一中间结果和第一动作标识;所述第二中间状态包括下述至少一项:第二动作、第二动作描述内容、第二动作推理过程、第二中间结果和第二动作标识;其中,所述动作是所述大语言模型在预设的多个动作中筛选得到。

S201、获取自然语言内容。

S202、将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态;所述第一中间状态,包括:第一动作、第一动作描述内容、第一动作推理过程、第一中间结果和第一动作标识;所述第二中间状态包括下述至少一项:第二动作、第二动作描述内容、第二动作推理过程、第二中间结果和第二动作标识;其中,所述动作是所述大语言模型在预设的多个动作中筛选得到。

其中,动作可以是指大语言模型执行的操作。可以预设多个动作,并集成到大语言模型中,大语言模型根据输入的内容,在预设的多个动作中选择当前的动作。动作描述内容可以是指动作的具体含义。示例性的,动作为计算,动作描述内容可以包括逻辑计算的类型和计算对象等。动作推理过程可以是指执行动作的细节步骤,例如可以是分析过程、计算过程或者是事实依据,例如,数学问题,动作推理过程可以是中间计算过程。中间结果可以是指动作执行得到的结果,例如,可以是计算结果或响应结果等。动作描述内容、动作推理过程和中间结果全部是与动作相关,一次动作可以产生动作描述内容、动作推理过程和中间结果。动作标识可以是指当前的动作的标识信息,例如可以是动作次序。可以理解的是,大语言模型会不断更新中间状态,执行多个动作,不同动作可以采用动作标识进行区分。

示例性的,预设的动作可以包括选择、统计、分组、优先级计算、比较、汇总、筛选、剔除、得分计算、布尔计算、融合、过滤、搜索、查询、计算和逻辑运算等。

示例性的,将自然语音内容输入至大语言模型中,得到第一动作、第一动作描述内容、第一动作推理过程、第一中间结果和第一动作标识,并作为第一中间状态,以及更新得到第二输入状态;将第二输入状态和自然语言内容输入至大语言模型中,得到新的第二动作、第二动作描述内容、第二动作推理过程、第二中间结果和第二动作标识,作为第二中间状态,并添加到第二输入状态中,得到第三输入状态,此时第三输入状态包括两个中间状态,第一中间状态和第二中间状态。

又如,将自然语音内容输入至大语言模型中,得到第一动作和第一动作次序,并作为第一中间状态和更新为第二输入状态;将第二输入状态和自然语言内容输入至大语言模型中,得到第一动作描述内容和第一动作次序,并作为第二中间状态,以及添加到第二输入状态,得到第三输入状态;将第三输入状态和自然语言内容输入至大语言模型中,得到第一动作推理过程和第一动作次序,并作为第三中间状态,以及添加到第三输入状态,得到第四输入状态;将第四输入状态和自然语言内容输入至大语言模型中,得到第一中间结果和第一动作次序,并作为第四中间状态,以及添加到第四输入状态,得到第五输入状态;将第五输入状态和自然语言内容输入至大语言模型中,得到第二动作和第二动作次序,以此类推,直至得到的中间状态中包括目标生成内容。

需要说明的是,中间状态中按照出现顺序命名第一第二,若第一中间状态不包括中间结果,第二中间状态包括中间结果,那么第二中间状态中的中间结果为第一中间结果,也即第二中间状态,仍可以包括动作、动作描述内容、动作推理过程、中间结果和动作标识中的一种。同时第一动作标识和第二动作标识的内容可以相同也可以不同,可以根据需要设定。

此外,大语言模型的输入输出还有其他内容和其他情况,对此不具体限定。

可选的,所述动作描述内容包括历史的动作标识对应的中间状态。

历史的动作标识表明是历史的动作的动作标识。大语言模型当前执行的动作的动作标识为当前的动作标识,在当前执行的动作之前的动作的动作标识为历史动作标识。大语言模型生成一次动作,并执行,会产生该动作对应的动作描述内容、动作推理过程和中间结果,上述内容均可以采用同一动作标识表示,表明是大语言内容执行同一动作产生的内容。而上述内容可以与动作分布在同一中间状态中,或者与动作分布在不同的中间状态中,通过同一动作标识可以关联。历史的动作标识对应的中间状态可以包括历史的动作标识对应的动作、动作描述内容、动作推理过程或中间结果等。

实际上,在动作描述内容中可以具体描述是依赖于历史哪个动作产生的内容,执行当前的动作。历史的动作标识可以包括至少一个动作标识,历史的动作标识可以包括相邻的前一个动作的动作标识,或者包括历史的至少一个动作标识。示例性的,串行依赖关系:第二动作标识的动作描述内容引用第一动作标识的动作推理过程和中间结果,即基于第一动作标识的动作推理过程和中间结果执行第二动作标识的动作;第三动作标识的动作描述内容引用第二动作标识的动作推理过程和中间结果,即基于第二动作标识的动作推理过程和中间结果执行第三动作标识的动作。又如,可以是并行依赖关系:第三动作标识的动作描述内容引用第一动作标识和第二动作标识的动作推理过程和中间结果,即基于第一动作标识和第二动作标识的动作推理过程和中间结果执行第三动作标识的动作,第一动作和第二动作之间无依赖关系,第一动作和第二动作可以并行,也可以调换执行顺序。此外,还有其他情况,对此不具体限定。

在一个具体的例子中,自然语言内容为:2019年的第1天是星期二,今天是2019年的第1个星期一。从今天起一年前的年月日是几号?1、(动作标识)算术(动作):计算今天的日期(动作描述内容)。中间结果:2019年7月1日。2、(动作标识)算术(动作):从今天(1、的中间结果)开始的一年前的日期(动作描述内容)。中间结果:2018年7月1日。其中,动作标识2的动作描述内容包括动作标识1的中间结果,这表明动作标识2的动作是将动作标识1的中间结果作为输入。

又如,自然语言内容:A、XX,B、XX,C、XX,D、XX,上述选项哪个或哪些正确?1、(动作标识)搜索(动作):判断A是否正确(动作描述内容)。中间结果:A错误。2、(动作标识)搜索(动作):判断B是否正确(动作描述内容)。中间结果:B正确。3、(动作标识)搜索(动作):判断C是否正确(动作描述内容)。中间结果:C正确。4、(动作标识)搜索(动作):判断D是否正确(动作描述内容)。中间结果:D错误。5、(动作标识)查询(动作):根据A、B、C和D的中间结果,提供正确的选项(动作描述内容)。中间结果:B和C正确。动作标识5的动作描述内容包括动作标识1-4的中间结果,这表明动作标识5的动作是将动作标识1-4的中间结果作为输入。

通过在动作描述内容中引入动作标识,实现前后中间状态的关联,在状态表示中增加了当前状态与之前状态的联系,实现前述状态对输出的当前状态进行约束,提高大语言模型的输出结果准确性。

S203、响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态。

S204、将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态。

S205、响应于确定所述第二中间状态中包括所述目标生成内容,根据所述第二中间状态得到所述自然语言内容的回复内容。

可选的,所述将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态,包括:将所述自然语言内容输入至大语言模型中,得到第一动作标识、第一动作和第一动作描述内容,并确定为当前的第一中间状态;所述响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态;将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新第一中间状态,得到第二中间状态,包括:响应于确定所述第一中间状态不包括目标生成内容,根据所述第一动作标识、第一动作和第一动作描述内容更新当前的第一输入状态,得到第二输入状态,将所述自然语言内容和所述第二输入状态输入到大语言模型中,得到所述第一动作标识,第一动作推理过程和第一中间结果,并作为第二中间状态。

大语言模型在预设动作中选择一个第一动作和该动作的描述内容即第一动作描述内容,将第一动作和第一动作描述内容添加到空的第一输入状态中,得到第二输入状态,并将第二输入状态输入到大语言模型中,得到执行第一动作的第一动作推理过程和第一中间结果,更新第一中间状态,得到第二中间状态,至此,第一动作执行结束,且相关内容均生成完成,将第一动作推理过程和第一中间结果添加到第二输入状态中,即将第一动作、第一动作描述内容、第一动作推理过程和第一中间结果,作为第三输入状态,并输入到大语言模型中,得到下一第二动作和下一动作的第二动作描述内容,并重复将第二动作和第二描述内容添加到输入状态中,并将新的输入状态输入到大语言模型中,得到执行下一第二动作的动作推理过程和中间结果,至此,第二动作执行结束,且相关内容均生成完成,由此循环执行,直至中间状态生成目标生成内容,即某次动作的中间结果为最终结果,结束循环。

需要说明的是,若某次动作执行得到的中间结果为最终结果,大语言模型会在输出最终结果的同时输出目标生成内容的语句,以表示输出的当前的中间状态的中间结果为最终结果。

通过大语言模型先输出动作和动作描述内容,并基于动作和动作描述内容更新输入,以及基于新的输入,输出动作执行的动作推理过程和中间结果,将执行动作的细节和得到的结果与前面得到的状态之间建立联系,并基于丰富的新状态确定细节和结果,实现对细节和结果的约束,减少幻觉现象,提高大语言模型的输出结果准确性。

可选的,所述将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态,包括:将所述自然语言内容输入至大语言模型中,得到第一动作标识、第一动作和第一动作描述内容,并确定为当前的第一中间状态;所述响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态;将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新第一中间状态,得到第二中间状态,包括:响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态,将所述自然语言内容和所述第二输入状态输入到大语言模型中,得到所述第一动作标识,和第一动作推理过程,作为第一中间状态;响应于确定所述第二中间状态不包括目标生成内容,根据所述第二中间状态更新第二输入状态,得到第三输入状态,将所述自然语言内容和所述第三输入状态输入到大语言模型中,得到所述第一动作标识,和第一中间结果,作为第三中间状态。

大语言模型在预设动作中选择一个第一动作和该动作的描述内容即第一动作描述内容,将第一动作和第一动作描述内容添加到空的第一输入状态中,得到第二输入状态,并将第二输入状态输入到大语言模型中,得到执行第一动作的第一动作推理过程,更新第一中间状态,得到第二中间状态,并将第二中间状态添加到第二输入状态中,得到第三输入状态,并将新的第三输入状态输入到大语言模型中,得到执行第一动作的第一中间结果,至此,第一动作执行结束,且相关内容均生成完成,由此循环执行,直至中间状态生成目标生成内容,即某次动作的中间结果为最终结果,结束循环。

通过大语言模型先输出动作和动作描述内容,并基于动作和动作描述内容更新输入,以及基于新的输入,输出动作执行的动作推理过程,并将动作推理过程添加到输入内容中,执行新的循环,输出得到中间结果,对动作推理过程和中间结果单独进行迭代输出,并进行独立约束,进一步减少幻觉现象,提高大语言模型的输出结果准确性。

根据本公开的技术方案,通过从预设的动作中选择动作,并提供动作的具体描述,增加推理过程的可控性和可解释性,缓解大语言模型存在的幻觉问题,通过配置动作推理过程,可以给出执行动作后产生中间结果的必要解释,减缓大语言模型输出错误答案或存在严重幻觉现象的答案,通过配置中间状态包括多个内容,增加中间状态的内容丰富性,以辅助大语言模型更好更全面的理解语义,使得大语言模型感知到当前解决问题的进程和状态,以此迭代产生的每一步的推理,直至产生最终答案,有效控制和约束推理过程的每个步骤,提高大语言模型的输出结果准确性,从而提高基于大语言模型的回复准确性。

图3是根据本公开实施例公开的另一种基于大语言模型的信息获取方法的流程图,基于上述技术方案进一步优化与扩展,并可以与上述各个可选实施方式进行结合。基于大语言模型的信息获取方法优化为:将所述自然语言内容、所述第一输入状态和所述第二中间状态输入到大语言模型中,得到当前的第一校验结果;响应于所述第一校验结果满足校验不通过条件,将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第二中间状态,得到第三中间状态;将所述自然语言内容、所述第一输入状态和所述第三中间状态输入到大语言模型中,更新当前的第一校验结果,得到第二校验结果。所述根据所述第二中间状态得到所述自然语言内容的回复内容,具体化为:响应于所述第一校验结果满足校验通过条件,根据所述第二中间状态得到所述自然语言内容的回复内容。

S301、获取自然语言内容。

S302、将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态。

将自然语言内容输入至大语言模型中,可以是将自然语言内容和提示预测自然语言内容的回复内容的语句进行拼接,输入到大语言模型中,以使大语言模型进行推理,也即进行回复内容输出。

S303、响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态。

S304、将所述自然语言内容和所述第一输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态;

S305、将所述自然语言内容、所述第一输入状态和所述第二中间状态输入到大语言模型中,得到当前的第一校验结果。

将自然语言内容、第二中间状态和第二输入状态输入到大语言模型中,可以是将自然语言内容、第二输入状态、第二中间状态和提示校验中间状态的语句进行拼接,输入到大语言模型中,以使大语言模型进行中间状态校验。校验结果用于表示中间状态是否正确。第一校验结果用于检测第二中间状态是否正确。

S306、响应于所述第一校验结果满足校验不通过条件,将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第二中间状态,得到第三中间状态。

校验结果满足校验不通过条件,表明当前的中间状态不正确。可以重复输入当前执行的过程,即将自然语言内容和当前的输入状态再次输入到大语言模型,重新生成当前的中间状态。此时,校验结果满足校验不通过条件的中间状态没有添加到输入状态中,也即当前的输入状态未变,相当于重复执行了将自然语言内容和当前的输入状态输入到大语言模型,重新生成当前的中间状态的过程。第一校验结果满足校验不通过条件,将自然语言内容和第二输入状态输入到大语言模型中,更新第二中间状态,得到第三中间状态。

S307、将所述自然语言内容、所述第一输入状态和所述第三中间状态输入到大语言模型中,更新当前的第一校验结果,得到第二校验结果。

将自然语言内容、第一输入状态和新生成的第三中间状态输入到大语言模型中,可以是将自然语言内容、第一输入状态、新生成的第三中间状态和提示校验中间状态的语句进行拼接,输入到大语言模型中,以使大语言模型进行中间状态校验,校验第三中间状态是否正确。此时的第二校验结果用于表示新生成的中间状态是否正确。此时输入状态尚未更新,采用上一轮或初始的输入状态,对当前轮次的中间状态进行校验。

S308、响应于确定所述第二中间状态中包括目标生成内容,且响应于所述第一校验结果满足校验通过条件,根据所述第二中间状态得到所述自然语言内容的回复内容。

响应于确定第二中间状态包括目标生成内容,根据满足校验通过条件的第二中间状态得到所述自然语言内容的回复内容。

响应于确定第二中间状态不包括目标生成内容,且响应于所述校验结果满足校验通过条件,根据所述第二中间状态更新第二输入状态,并将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新第二中间状态,得到第三中间状态。

此时第三中间状态为新输入得到的中间状态。

校验结果满足校验通过条件,表明当前的中间状态正确。可以采用满足校验通过条件的当前的中间状态,继续后续步骤,检测满足校验通过条件的当前的中间状态是否包括目标生成内容。

校验不通过条件与校验通过条件互斥,示例性的,校验通过条件:校验结果为合理,校验不通过条件:校验结果为不合理。又如,校验通过条件:校验结果大于等于预设准确率阈值,校验不通过条件:校验结果小于预设准确率阈值。

如果满足校验不通过条件的第二中间状态,重新生成第三中间状态,该重新生成的第三中间状态的校验结果满足校验不通过条件,则仍重新生成中间状态,得到第四中间状态,并将自然语言内容、当前的第一输入状态和新生成的第四中间状态输入到大语言模型中,得到新生成的第四中间状态的校验结果,继续判断。如果新生成的第四中间状态的校验结果满足校验通过条件,则新生成的第四中间状态,添加到当前的第一输入状态中,以此类推,不再赘述。其中,第一中间状态也可以进行校验,针对第一中间状态生成的过程中,采用第一中间状态、第一输入状态和自然语言内容对第一中间状态进行校验。针对第i中间状态生成的过程中,采用第i中间状态、第i-1输入状态和自然语言内容对第i中间状态进行校验,i大于1,i为整数。

将自然语言内容和当前的输入状态输入到大语言模型中,可以是将自然语言内容、当前的输入状态和提示预测自然语言内容的回复内容的语句进行拼接,输入到大语言模型中,以使大语言模型进行推理,也即进行回复内容输出。

可选的,所述根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态,包括:将所述第一中间状态置于当前的第一输入状态的末尾;将所述第一中间状态与所述第一输入状态进行拼接,得到拼接结果;根据所述拼接结果更新所述第一输入状态,得到所述第二输入状态。

拼接结果可以是指第一中间状态添加到第一输入状态末尾得到的融合结果。将第一中间状态添加到第一输入状态的末尾处,实现将最新的中间状态添加到输入状态的末尾,从而输入状态不断累加中间状态,且按照输出顺序排列历史到新的中间状态,可以有序丰富中间状态,且符合推理链式的过程,使得大语言模型可以感知到中间状态的迭代变化,提高大语言模型的输出结果准确性。

可选的,所述将所述自然语言内容和所述第二输入状态输入到大语言模型中,包括:获取推理提示信息,所述推理提示信息包括标准推理描述内容和至少一个推理示例;根据所述第一中间状态,确定生成提示内容;将所述自然语言内容、所述第二输入状态和所述生成提示内容与所述推理提示信息进行拼接,得到当前的输入内容;将所述当前的输入内容输入到大语言模型中。

推理提示信息(prompt)是向模型输入的一段文本提示,其中包含用户要查询的信息或问题的关键词和上下文,以便模型更好地理解用户的意图并给出更准确的回复。其中,推理提示信息可以是指提示自然语言内容进行如何处理,以及输出的内容。标准推理描述内容可以是适用本公开实施例提供的方法的推理操作的通用描述内容。推理示例可以是大语言模型输入输出的示例,其中输入输出包括多个中间状态和多个输入状态。

在一个具体的例子中,推理示例参考如下:

问题:2019年的第一天是星期二,今天是2019年的第1个星期一。从今天起一年前的年月日是几号?

答案:

1、算术(动作):计算今天的日期(动作描述内容)。

分析:由于2019年第一天是星期二,2019年第一个星期一发生在2019年1月7日。(动作推理过程)

中间结果:2019年7月1日。

2、算术(动作):从#1开始的一年前的日期(动作描述内容)。

分析:排名第一的是2019年7月1日。从今天开始的一年前的日期是01/07/2019-1,即01/07/2018。(动作推理过程)。

中间结果:2018年7月1日。

因此,答案是2018年7月1日。

生成提示内容可以是指描述推理过程当前的阶段性任务是什么,以及当前的阶段性任务输出的内容是什么。例如,生成提示内容可以是,当前需要执行的任务是什么?又如,生成提示内容可以是,执行动作得到的过程和/或结果是什么?大语言模型前一次输出的中间状态,表明前一次执行的阶段性任务的内容,可以根据当前的中间状态,确定当前的执行的阶段性任务的内容,即生成提示内容,针对第二输入状态来说,前一次输出的中间状态是第一中间状态。在一个具体的例子中,第一中间状态为计算动作,生成提示内容可以是执行动作得到的过程是什么?从而,大语言模型可以理解到阶段性任务为执行计算动作,输出为执行动作的动作推理过程。

当前的输入内容可以是指输入到大语言模型中的内容,用于大语言模型对自然语言内容进行连续推理过程。可以将推理提示信息、自然语言内容、第二输入状态和生成提示内容进行顺序拼接,得到的拼接结果为当前的输入内容。或者可以理解为,当前的输入内容设置有顺序连接的四个槽位,其中,第一个槽位填充推理提示信息,第二个槽位填充自然语言内容,第三个槽位填充当前的输入状态,最后一个槽位填充生成提示内容,最后两个槽位的内容不断更新。

在设置有提示信息之后,大语言模型只需要具有基于提示信息理解自然语言内容以及生成提示信息指定的内容即可,从而不需要针对不同场景的自然语言内容进行针对性训练,大语言模型仍可实现理解自然语言内容,并逐步生成中间状态。通过上述方式,大语言模型不需要单独训练,仅需要具有问答功能即可。

通过推理提示信息适配自然语言内容,使得大语言模型根据提示模板快速理解自然语言内容,生成中间状态,省略大语言模型针对性理解不同场景的语义才能实现生成相应中间状态的训练步骤,快速实现大语言模型的调优过程,降低大语言模型调优更新的人力成本,同时可以实时根据插件快速获取对应的提示模板,提高大语言模型的更新实时性,增加大语言模型的兼容性、普适性和通用性。

可选的,所述将所述自然语言内容、所述第一输入状态和所述第三中间状态输入到大语言模型中,得到第三中间状态的校验结果,包括:获取校验提示内容;将所述自然语言内容、所述第二输入状态和所述第三中间状态与所述校验提示内容拼接,得到待校验内容;将所述待校验内容输入到大语言模型中,得到所述第三中间状态的校验结果。

校验提示内容可以是指描述当前需要执行校验任务以及校验任务的输入输出。例如,校验提示内容可以是,对中间状态进行校验。又如,校验提示内容为动作和中间结果对中间状态进行校验。还可以再具体到针对某个或某几个动作标识的动作和中间结果对中间状态进行校验。

待校验内容用于大语言模型对中间状态进行校验。可以将推理提示信息、自然语言内容、第一输入状态、第三中间状态和待校验内容进行顺序拼接,得到的拼接结果为当前的待校验内容。

通过将推理提示内容变更为校验提示内容,可以对中间状态进行校验,可以快速实现中间状态的校验,减少额外配置校验功能的模块,同时还可以对大语言模型输出的中间状态进行自检,提高中间状态的输出准确性。

可选的,所述获取校验提示内容,包括:获取各所述校验结果对应的中间状态,以及校验结果的累计生成次数;根据各所述校验结果对应的中间状态,和所述生成次数,确定校验提示内容。

大语言模型多次重复生成满足校验不通过条件的中间状态,这表明大语言模型无法通过自适应生成满足校验通过条件的中间状态,为了避免冗余执行和资源浪费,可以针对性修改校验提示内容,使得大语言模型感知到多次生成错误的中间状态的状态,以避免继续重复该情况。生成次数可以表示满足校验不通过条件的中间状态的生成次数的上限。

在生成次数小于预设次数阈值时,将标准提示内容,确定为校验提示内容。标准提示内容可以是仅仅提示大语言模型校验中间状态的内容。在生成次数大于等于预设次数阈值时,在标准提示内容的基础上,添加历史重复生成满足校验不通过条件的中间状态,并提示该些中间状态错误。例如,校验提示内容可以是在提示大语言模型校验中间状态的内容的基础上,描述中间状态A、B和C错误。

此外,还可以在生成次数大于等于预设次数阈值时,跳出校验循环,根据最新的当前的中间状态添加到当前的输入状态,并针对最新的当前的中间状态,添加提示最新的当前的中间状态校验未通过的内容,以使大语言模型理解到该中间状态错误。

通过生成次数的设置,并根据生成次数确定校验提示内容,可以在大语言模型多次重复生成错误的中间状态时,施加外力告知大语言模型避免生成错误的中间状态,约束大语言模型生成错误的中间状态以外的中间状态,从而提高大语言模型的输出结果准确性。

可选的,所述将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态,包括:将所述自然语言内容和所述第二输入状态多次重复输入到大语言模型中,得到一一对应的多个备选状态;统计同一内容的备选状态的出现次数;根据出现次数最多的内容对应的备选状态,更新所述第一中间状态,得到第二中间状态。

备选状态用于筛选得到中间状态。针对第二中间状态生成的过程中,备选状态用于筛选得到第二中间状态。针对第n中间状态生成的过程汇总,备选状态用于筛选得到第n中间状态,n大于等于1,n为整数。将相同输入内容重复输入到大语言模型中,得到多个备选状态,这多个备选状态都是该相同输入内容对应的输出,实际上大语言模型的输出可能错误,出现次数最多的通常为正确的输出。将出现次数最多的内容的备选状态确定为筛选得到的中间状态,表明将出现概率最高的状态确定为筛选得到的中间状态,即筛选得到中间状态最有可能是正确的状态。同一内容的备选状态可以是指备选状态包括的内容均相同。例如,备选状态仅包括动作,同一内容的备选状态包括的动作相同。例如,备选状态包括动作标识、动作推理过程和中间结果,同一内容的备选状态包括的三者均相同。一一对应可以是指一次重复输入,可以得到一个备选状态,重复的次数与得到的备选状态的数量相同。

在一个具体的例子中,备选状态A为计算动作、备选状态B为计算动作,备选状态C为解释动作,其中,出现次数最多的内容是计算动作,将计算动作对应的备选状态A和备选状态B确定为筛选得到的中间状态。

此外,还可以将自然语言内容多次重复输入到大语言模型中,得到一一对应的多个备选状态,选择同一内容出现次数最多的备选状态,确定为筛选得到的中间状态。在筛选得到的中间状态不包括目标生成内容的情况下,将筛选得到的中间状态更新输入状态,并将自然语言内容和更新后的输入状态多次重复输入到大语言模型中,得到多个备选状态,筛选备选状态,确定为筛选得到的中间状态,重复进行目标生成内容的判断,直至生成的中间状态包括目标生成内容。

通过多次重复输入,并行生成多个备选状态,选择出现次数最高的内容对应的备选状态,确定为新的中间状态,可以减少大语言模型的偶尔出现的输出错误的情况,提高大语言模型的输出结果准确性。

根据本公开的技术方案,通过对生成的中间状态进行校验,并在校验结果满足校验通过条件时,将中间状态添加到输入状态,并进行目标生成内容的包括检测,以及在校验结果满足校验不通过条件时,重新生成该中间状态,继续校验,直至生成的中间状态的校验结果满足校验通过时,更新输入状态,并继续后续大语言模型的推理过程,可以进一步确保大语言模型生成的状态的质量,提高大语言模型的输出结果准确性,从而提高基于大语言模型的回复准确性。

图4是根据本公开实施例公开的一种基于大语言模型的信息获取方法的场景图。自然语言内容为问题文本。大语言模型用于执行问答推理任务,最终回复内容为回复文本。本公开实施例通过将大模型作为智能体,对输入的问题进行逐步分析,从而实现由智能体引导和控制的推理。整体模型架构如图4所示。

模型架构整体上是基于大模型作为智能体来逐步产生推理过程。当输入问题之后,大模型智能体首先从多个预设动作形成的动作集中选择出当前解决问题需要执行的一个原子操作,也即动作,并对该动作的执行进行具体解释,得到动作描述内容;然后大模型执行动作,并给出动作执行时的中间证据,得到动作推理过程和中间结果。将上述信息组成一个丰富的状态,再次送入大模型智能体,让智能体感知到当前解决该问题的进程和状态,以此方式迭代产生每一步的推理,直到产生最终答案。在此过程中,大模型作为智能体有效地控制了推理过程每一步的生成,直到整体推理过程的完成。

执行动作:当智能体接收到初始问题状态或者解决问题的当前状态时,需要对状态进行更新。该智能体技术不是直接给出更新后的新状态,而是首先从预设的动作集中选择一个动作如‘选择’,‘计算’或‘解释’等,并给出与当前问题相关的执行动作的动作描述内容,从而增加推理过程的可控性和可解释性,缓解大模型存在的幻觉问题。最后再依据动作和动作描述内容更新状态。

动作推理过程和中间结果:当智能体给出要执行的动作之后,该技术会通过设置提示,引导大模型产生相应的动作推理过程和中间结果。其中,动作推理过程可以是对当前要解决子问题的分析过程,计算过程,或者是事实依据,其主要目的是给出执行动作后产生中间结果的必要解释,减缓大模型给出错误的或者存在严重幻觉现象的答案。此外,该技术会给出执行动作后的中间结果。

含有丰富信息的状态表示:当智能体感知到问题新的状态时,会产生包含上述信息的状态表示。此外,还建立了各个状态之间的联系,实现方式是对每一个状态引入下标,即动作标识,在状态表示中增加当前状态与之前状态的联系,动作与动作描述内容、动作推理过程和中间结果之间的联系。总之,智能体在解决问题时会产生一个包含动作,动作的解释,动作推理过程,中间结果,以及各个状态之间联系的动作标识,该状态含有了丰富的信息,确保智能体每一步执行的质量。此外,还额外引入两种策略来进一步确保状态的质量,包括反思机制和集成机制:反思机制指的是智能体判断产生的新的状态是否合理,如果不合理,则重新生成;集成机制是指智能体每次并行的生成多个状态,选择出现次数最高的状态作为最终的新的状态的表示。

整体执行过程:面向大模型推理的智能体技术核心是依据当前解决问题的状态,产生新的内容从而更新解答的状态,每一次更新问题的状态可以看做是思维链中推理过程的每一步。当模型感知到当前问题解答状态时,首先会从动作集中选择动作并给出执行细节,在执行动作时也会给出动作推理过程和中间结果,以及状态之间的联系,上述内容构成了模型感知到当前问题后给出的含有丰富信息的新状态,之前状态与新状态被智能体感知后会再次更新状态,直到整个推理过程的完成。因此,大语言模型推理过程是一个迭代的执行过程,在过程中通过丰富的状态信息确保每一步高质量的状态更新。

根据本公开的技术方案,将智能体技术应用于问答推理从而产生高质量的推理过程和最终答案。具体的,智能体感知到问题的状态后,会产生一个包含丰富信息的新的状态来更新当前状态,直到最终解决问题,此过程会有更直观的可解释性和更高质量的逻辑推理过程,由智能体引导整个问题的回答使得整个推理过程更加可控,从而有效缓解了大模型回答问题时的幻觉现象。

根据本公开的实施例,图5是本公开实施例中的基于大语言模型的信息获取装置的结构图,本公开实施例适用于大语言模型执行推理任务,获取到自然语言内容的回复内容的情况。该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图5所示的一种基于大语言模型的信息获取装置500,包括:自然语言内容获取模块501、当前中间状态获取模块502、输入状态更新模块503、中间状态更新模块504和回复内容输出模块505。其中,

自然语言内容获取模块501,用于获取自然语言内容;

当前中间状态获取模块502,用于将所述自然语言内容输入至大语言模型中,得到当前的第一中间状态;

输入状态更新模块503,用于响应于确定所述第一中间状态不包括目标生成内容,根据所述第一中间状态更新当前的第一输入状态,得到第二输入状态;

中间状态更新模块504,用于将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第一中间状态,得到第二中间状态;

回复内容输出模块505,用于响应于确定所述第二中间状态中包括所述目标生成内容,根据所述第二中间状态得到所述自然语言内容的回复内容。

根据本公开的技术方案,通过将自然语言内容输入到大语言模型中,得到当前的中间状态,并更新当前的输入状态,将自然语言内容和不断更新的当前的输入状态输入到大语言模型中,得到当前的中间状态,并根据当前的中间状态更新当前的输入状态,不断循环上述过程,直至当前的中间状态包括目标生成内容,从当前的中间状态中提取自然语言内容的回复内容,可以实现逐步推理,并且每步推理基于前述状态进行约束,在逐步推理过程中丰富输入内容的上下文,使得整个过程更加可控,缓解大模型的幻觉现象,提高大语言模型的输出结果准确性,尤其是针对问题文本的应用场景,可以提高基于大语言模型回复的准确性。

进一步的,所述输入状态更新模块,包括:中间状态后置单元,用于将所述第一中间状态置于当前的第一输入状态的末尾;状态拼接单元,用于将所述第一中间状态与所述第一输入状态进行拼接,得到拼接结果;状态更新单元,用于根据所述拼接结果更新所述第一输入状态,得到所述第二输入状态。

进一步的,所述当前中间状态更新模块,包括:推理提示信息获取单元,用于获取推理提示信息,所述推理提示信息包括标准推理描述内容和至少一个推理示例;生成提示内容确定单元,用于根据所述第一中间状态,确定生成提示内容;输入内容拼接单元,用于将所述自然语言内容、所述第二输入状态和所述生成提示内容与所述推理提示信息进行拼接,得到当前的输入内容;模型输入单元,用于将所述当前的输入内容输入到大语言模型中。

进一步的,所述中间状态更新模块,包括:备选状态获取单元,用于将所述自然语言内容和所述第二输入状态多次重复输入到大语言模型中,得到一一对应的多个备选状态;出现次数统计单元,用于统计同一内容的备选状态的出现次数;备选状态筛选单元,用于根据出现次数最多的内容对应的备选状态,更新所述第一中间状态,得到第二中间状态。

进一步的,所述第一中间状态,包括:第一动作、第一动作描述内容、第一动作推理过程、第一中间结果和第一动作标识;所述第二中间状态包括下述至少一项:第二动作、第二动作描述内容、第二动作推理过程、第二中间结果和第二动作标识;其中,所述动作是所述大语言模型在预设的多个动作中筛选得到。

进一步的,所述动作描述内容包括历史的动作标识对应的中间状态。

进一步的,所述输入状态更新模块,包括:第一状态校验模块,用于将所述自然语言内容、所述第一输入状态和所述第二中间状态输入到大语言模型中,得到当前的第一校验结果;中间状态重新生成模块,用于响应于所述第一校验结果满足校验不通过条件,将所述自然语言内容和所述第二输入状态输入到大语言模型中,更新所述第二中间状态,得到第三中间状态;第二状态校验模块,用于将所述自然语言内容、所述第一输入状态和所述第三中间状态输入到大语言模型中,更新当前的第一校验结果,得到第二校验结果;所述回复内容输出模块,包括:回复内容确定单元,用于响应于所述第一校验结果满足校验通过条件,根据所述第二中间状态得到所述自然语言内容的回复内容。

进一步的,所述第二状态校验单元,包括:校验提示内容获取子单元,用于获取校验提示内容;待校验内容获取子单元,用于将所述自然语言内容、所述第二输入状态和所述第三中间状态与所述校验提示内容拼接,得到待校验内容;校验结果获取子单元,用于将所述待校验内容输入到大语言模型中,得到所述第三中间状态的校验结果。

进一步的,所述校验提示内容获取子单元,具体用于:获取各所述校验结果对应的中间状态,以及校验结果的累计生成次数;根据各所述校验结果对应的中间状态,和所述生成次数,确定校验提示内容。

上述基于大语言模型的信息获取装置可执行本公开任意实施例所提供的基于大语言模型的信息获取方法,具备执行基于大语言模型的信息获取方法相应的功能模块和有益效果。

本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性区域图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600指令所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如基于大语言模型的信息获取方法。例如,在一些实施例中,基于大语言模型的信息获取方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的基于大语言模型的信息获取方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于大语言模型的信息获取方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准对象(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或区域图中所规定的功能/指令被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。

人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。

云计算(cloud computing),指的是通过网络接入弹性可扩展的共享物理或虚拟资源池,资源可以包括服务器、指令系统、网络、软件、应用和存储设备等,并可以按需、自服务的方式对资源进行部署和管理的技术体系。通过云计算技术,可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

相关技术
  • 一种蘑菇料用熏烧酒糟土的制备方法和牛粪自滋生蘑菇料
  • 一种轴对称双向非均质黏性阻尼土中桩基扭转振动分析方法
  • 一种均质坝土料制备方法
  • 一种石膏板制备用均质上料装置及方法
技术分类

06120116538890