答疑对话数据生成方法、系统、电子设备和可读存储介质

文献发布时间：2024-04-18 20:01:23

技术领域

本申请涉及人工智能技术领域，特别是涉及一种答疑对话数据生成方法、系统、电子设备和可读存储介质。

背景技术

随着人工智能在教育领域的应用，如何获取高质量的对话形式的答疑对话数据用于模型训练愈发得到关注。但现有技术中对话形式的答疑过程通常是在线上教学的场景才能收集到，而线上教学需要学生和教育工作者的参与，当参与者有限时就会导致答疑对话数据涉及的丰富度不佳，且需要参与者在使用过程中不断累积才能收集到足够数量的答疑对话数据，最终导致模型训练的效果不佳。有鉴于此，如何提高答疑对话数据的丰富度和收集效率成为了亟待解决的问题。

发明内容

本申请主要解决的技术问题是提供一种答疑对话数据生成方法、系统、电子设备和可读存储介质，能够提高答疑对话数据的丰富度和收集效率。

为解决上述技术问题，本申请第一方面提供一种答疑对话数据生成方法，包括：获取待作答试题，构造与所述待作答试题和答疑流程相关的提示文本；其中，所述答疑流程包括至少一轮次的作答阶段和回复阶段，所述作答阶段分为多个掌握层级，每个所述掌握层级对应至少一种作答方式；将所述提示文本输入智能分析模型，得到所述智能分析模型输出的每个轮次的作答内容和回复内容；其中，当所述作答阶段未匹配目标掌握层级时，所述回复内容至少包括引导下一轮次的引导内容，当所述作答阶段匹配目标掌握层级时，所述回复内容至少包括涉及的知识点的总结内容，所有轮次的所述作答内容和所述回复内容组成答疑对话数据，所述目标掌握层级为层级最高的掌握层级。

为解决上述技术问题，本申请第二方面提供一种理科答疑模型的训练方法，该方法包括：获取答疑对话数据；其中，所述答疑对话数据是基于上述第一方面所述的答疑对话数据生成方法得到的；利用所述答疑对话数据训练所述理科答疑模型，得到训练后的所述理科答疑模型。

为解决上述技术问题，本申请第三方面提供一种答疑对话数据生成系统，包括：构造模块和获取模块，构造模块用于获取待作答试题，构造与所述待作答试题和答疑流程相关的提示文本；其中，所述答疑流程包括至少一轮次的作答阶段和回复阶段，所述作答阶段分为多个掌握层级，每个所述掌握层级对应至少一种作答方式；获取模块用于将所述提示文本输入智能分析模型，得到所述智能分析模型输出的每个轮次的作答内容和回复内容；其中，当所述作答阶段未匹配目标掌握层级时，所述回复内容至少包括引导下一轮次的引导内容，当所述作答阶段匹配目标掌握层级时，所述回复内容至少包括涉及的知识点的总结内容，所有轮次的所述作答内容和所述回复内容组成答疑对话数据，所述目标掌握层级为层级最高的掌握层级。

为解决上述技术问题，本申请第四方面提供一种电子设备，所述电子设备包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现上述第一方面或第二方面所述的答疑对话数据生成方法。

为解决上述技术问题，本申请第五方面提供一种计算机可读存储介质，其上存储有程序指令，所述程序指令被处理器执行时实现上述第一方面或第二方面所述的答疑对话数据生成方法。

上述方案，获取待作答试题，按照答疑流程构造与待作答试题和答疑流程相关的提示文本，其中，答疑流程包括作答阶段和回复阶段，两个阶段共同组成一个轮次，答疑流程包括至少一个轮次，作答阶段分为多个掌握层级，每个掌握层级对应至少一种作答方式。因此，在构造与作答阶段相关的提示文本中的部分内容时，可以从不同深度的掌握层级中随机选择掌握层级，并从不同广度选择掌握层级对应的作答方式引导作答阶段，能够提高作答内容的丰富度，将提示文本输入智能分析模型，以使智能分析模型响应提示文本，输出每个轮次的作答内容和回复内容，得到答疑对话数据。其中，当作答阶段未匹配目标掌握层级时，回复内容至少包括引导下一轮次的引导内容，从而模拟引导继续作答的对话形式，当作答阶段匹配目标掌握层级时，回复内容至少包括涉及的知识点的总结内容，从而答疑流程结束，整个答疑对话数据能够引导直至作答阶段达到目标掌握层级，并且把涉及的知识点梳理出来做总结。故此，只需要对轮次数量以及掌握层级及其对应的作答方式进行调整，构造提示文本即可高效地收集丰富的答疑对话数据。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。其中：

图1是本申请答疑对话数据生成方法一实施方式的流程示意图；

图2是本申请答疑流程一实施方式的流程示意图；

图3是本申请答疑流程另一实施方式的流程示意图；

图4是本申请答疑对话数据生成方法另一实施方式的流程示意图；

图5是本申请作答阶段对应的一实施方式的应用场景示意图；

图6是本申请回复阶段对应的一实施方式的应用场景示意图；

图7是本申请理科答疑模型的训练方法一实施方式的流程示意图；

图8是本申请答疑对话数据生成系统一实施方式的结构示意图；

图9是电子设备一实施方式的结构示意图；

图10是本申请计算机可读存储介质一实施方式的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。

本申请所提供的答疑对话数据生成方法用于收集答疑对话数据，其执行主体为具备通信功能且至少能够处理文本的处理终端，处理终端可以是常规的计算机设备也可以是应用于教育的学习机等智能设备，本申请对此不做具体限制。

请参阅图1，图1是本申请答疑对话数据生成方法一实施方式的流程示意图，该方法包括：

S101：获取待作答试题，构造与待作答试题和答疑流程相关的提示文本，其中，答疑流程包括至少一轮次的作答阶段和回复阶段，作答阶段分为多个掌握层级，每个掌握层级对应至少一种作答方式。

具体地，获取待作答试题，按照答疑流程构造与待作答试题和答疑流程相关的提示文本，其中，答疑流程包括作答阶段和回复阶段，两个阶段共同组成一个轮次，答疑流程包括至少一个轮次，作答阶段分为多个掌握层级，每个掌握层级对应至少一种作答方式。

可以理解的是，层级最高的掌握层级为目标掌握层级，在构造与作答阶段相关的提示文本中的部分内容时，可以从不同深度的掌握层级中随机选择掌握层级，并从不同广度选择掌握层级对应的作答方式引导作答阶段，能够提高作答内容的丰富度。其中，整个答疑流程最后一个轮次的作答阶段为目标掌握层级，最后一个轮次之前的所有轮次的作答阶段的掌握层级低于目标掌握层级。

在一应用方式中，获取答疑流程的总轮次，基于待作答试题和答疑流程，构造直接输出所有轮次的作答内容和回复内容的提示文本，其中，提示文本中在构造每个轮次的作答阶段和回复阶段时，最后一个轮次之前的作答阶段从低于目标掌握层级中随机选择作答方式，最后一个轮次之前的回复阶段基于作答方式给出的作答内容进行引导，最后一个轮次的作答阶段从目标掌握层级中随机选择作答方式，最后一个轮次的回复阶段基于总轮次的所有作答内容进行知识点总结。

可以理解的是，总轮次的数量可以随机增加或减少，最后一个轮次之前的作答阶段的掌握层级及其对应的作答方式，以及最后一个轮次的作答方式均可以随机选择和替换，从而高效地构造多种用于直接输出所有轮次的作答内容和回复内容的提示文本。

在另一应用方式中，按照答疑流程构造每个轮次的作答阶段和回复阶段各自对应的提示文本，其中，针对每个轮次，先构造作答阶段的提示文本，当作答阶段未匹配目标掌握层级时，基于当前轮次的作答内容构造回复阶段的提示文本，直至最后一个轮次匹配目标掌握层级，至少基于当前轮次的作答内容和待作答试题的知识点构造回复阶段的提示文本。

可以理解的是，分轮次依次构造的提示文本在构造完成后即可输入智能分析模块，得到智能分析模型输出的内容，且作答阶段输出的作答内容可以用于构造回复阶段的提示文本，从而提高对话形式的对话数据的精度。

进一步地，在部分实施过程中，在最后一个轮次之前的其他轮次中，可以随机选择层级低于目标掌握层级中的任一掌握层级及其对应的作答方式，在部分实施过程中，在最后一个轮次之前的其他轮次中，可以基于前一轮次的掌握层级选择下一轮次的掌握层级，下一轮次的掌握层级大于或等于前一轮次的掌握层级。

需要说明的是，多个掌握层级由低到高至少包括完全未掌握、部分掌握和完全掌握，完全未掌握对应的作答方式包括无答案和答案与待作答试题的题型无关中的至少一者，部分掌握对应的作答方式包括答案错误和存在错误的作答步骤中的至少一者，完全掌握对应的作答方式包括答案正确且无作答步骤，以及答案正确且存在至少部分作答步骤中的至少一者。

具体地，多个掌握层级在深度上至少对应三个层级，层级最低的完全未掌握对应的作答方式包括无答案和答案与待作答试题的题型无关中的至少一者，其中，无答案具体可以包括询问答案或询问知识点，答案与待作答试题的题型无关即为乱猜结果。

进一步地，部分掌握对应的作答方式包括答案错误和存在错误的作答步骤中的至少一者，也就是说，部分掌握给出了与待作答试题的题型相关的答案，包括答案错误、答案正确且至少部分作答步骤错误，以及答案和至少部分作答步骤均存在错误。其中，部分掌握的掌握层级基于待作答试题的题型确定，因此，部分掌握的掌握层级依据待作答试题的题型动态变化，基于不同题型的待作答试题涉及的知识点，以及待作答试题的题型匹配的常见错误类型共同确定。

可以理解的是，层级最高的完全掌握对应的作答方式包括答案正确且无作答步骤，以及答案正确且存在至少部分作答步骤中的至少一者，也就是说，作答方式可以包括直接给出正确答案、给出完整的作答步骤并且步骤和答案均正确、以及跳步作答并且步骤和答案均正确。故此，在作答阶段选择掌握层级及其对应的作答方式时，可以从不同的深度随机选择掌握层级，且每个层级对应多个广度的作答方式可以随机选取，用于构造提示文本从而引导作答阶段，能够大幅提高作答内容的丰富度。

S102：将提示文本输入智能分析模型，得到智能分析模型输出的每个轮次的作答内容和回复内容，其中，当作答阶段未匹配目标掌握层级时，回复内容至少包括引导下一轮次的引导内容，当作答阶段匹配目标掌握层级时，回复内容至少包括涉及的知识点的总结内容，所有轮次的作答内容和回复内容组成答疑对话数据，目标掌握层级为层级最高的掌握层级。

具体地，将提示文本输入智能分析模型，以使智能分析模型响应提示文本，输出每个轮次的作答内容和回复内容，得到答疑对话数据。其中，当作答阶段未匹配目标掌握层级时，回复内容至少包括引导下一轮次的引导内容，从而模拟引导继续作答的对话形式，当作答阶段匹配目标掌握层级时，回复内容至少包括涉及的知识点的总结内容，从而答疑流程结束，整个答疑对话数据能够引导直至作答阶段达到目标掌握层级，并且把涉及的知识点梳理出来做总结。

可选地，当分轮次构造提示文本时，最后一个轮次回复阶段的提示文本可以基于少样本方式构造，从而提高总结内容的准确率。

在一应用方式中，提示文本指示直接输出所有轮次的作答内容和回复内容，将提示文本输入智能分析模型，得到智能分析模型输出的每个轮次的作答内容和回复内容。

在另一应用方式中，提示文本按轮次依次构造，将当前轮次作答阶段的提示文本输入智能分析模型，得到当前轮次的作答内容，将当前轮次回复阶段的提示文本输入智能分析模型，得到当前轮次的回复内容，直至所有轮次遍历完成，得到每个轮次的作答内容和回复内容。

在一应用场景中，请参阅图2，图2是本申请答疑流程一实施方式的流程示意图，回复阶段判断是否匹配目标掌握层级，若未匹配，则回复内容包括引导进行下一轮次的引导内容，若匹配，则回复内容包括待作答试题的知识点和至少部分轮次的作答内容所涉及的知识点的总结内容。

在另一应用场景中，请参阅图3，图3是本申请答疑流程另一实施方式的流程示意图，回复阶段先判断答案是否正确，若答案不正确，则回复内容还包括解释内容，也就是说，当作答内容未包括正确答案时，回复内容除引导进行下一轮次的引导内容之外还包括解释内容，从而更好地对存在的错误进行解释，若答案正确，则判断是否匹配目标掌握层级，若未匹配，则回复内容包括引导进行下一轮次的引导内容，若匹配，则回复内容包括待作答试题的知识点和至少部分轮次的作答内容所涉及的知识点的总结内容。

可以理解的是，答疑对话数据可用于对答疑模型的训练，使训练后的答疑模型能够通过基于答疑流程引导使用者对待作答试题进行作答，最终给出正确答案，并且基于答疑流程梳理出相关的知识点给出总结内容，答疑模型在训练时对应的答疑流程对应上述任一应用场景。

需要说明的是，待作答试题的题型优选属于理科试题，使整个答疑流程具备较强的逻辑性，从而高效地收集丰富度较高的理科答疑对话数据。

可选地，智能分析模型为大语言模型，大语言模型可以包括但不限于深度神经网络（Deep Neural Networks，DNNs）、卷积神经网络（Convolutional Neural Networks，CNNs）、循环神经网络（Recurrent Neural Networks，RNNs）、长短时记忆网络（Long Short-Term Memory，LSTM）以及生成式预训练Transformer模型等，在此对大语言模型的具体构造以及具体部署不做具体限制。

请参阅图4，图4是本申请答疑对话数据生成方法另一实施方式的流程示意图，该方法包括：

S401：获取待作答试题，构造与待作答试题和答疑流程相关的提示文本，其中，答疑流程包括至少一轮次的作答阶段和回复阶段，作答阶段分为多个掌握层级，每个掌握层级对应至少一种作答方式。

具体地，获取待作答试题，按照答疑流程构造与待作答试题和答疑流程相关的提示文本。

在一应用方式中，获取待作答试题，确定待作答试题匹配的参考资源；其中，参考资源至少包括常见错误资源、知识点资源和题库资源；基于待作答试题、参考资源和答疑流程，构造提示文本。

具体地，获取待作答试题，确定待作答试题的题型，基于待作答试题的题型确定待作答试题匹配的参考资源。其中，参考资源包括与题型匹配的常见错误资源，知识点资源和题库资源。

进一步地，基于待作答试题、参考资源和答疑流程共同构造提示文本，从而增强提示文本中针对作答阶段和回复阶段的相关内容的约束力，使作答阶段和回复阶段均具有可参考的资源，提高作答阶段的作答内容和回复阶段的回复内容的准确率。

具体地，多个掌握层级在深度上至少对应三个层级，每个层级对应各自的作答方式，相关内容具体可参见上一实施例，本申请对此不再赘述。为便于说明，在本实施例中，完全未掌握对应的三个作答方式具体包括答案与题型不匹配、询问知识点和询问答案，部分掌握对应的作答方式具体包括错误回答，其中，错误回答对应答案和作答步骤中至少一种存在错误，完全掌握对应的作答方式具体包括直接给正确答案、完整作答步骤和跳步作答。

需要说明的是，未匹配目标掌握层级的回复阶段，以及所有作答阶段均采用常见错误资源，匹配目标掌握层级的回复阶段采用知识点资源和题库资源；其中，知识点资源包括不同题型涉及的多种知识点，以及多种知识点匹配的知识点体系和知识点重要程度。

具体地，在构建提示文本时，所有作答阶段均采用参考资源中的常见错误资源，以便于构造的提示文本中的相关内容可以添加常见的错误类型，从而指示作答阶段生成与常见的错误类型相匹配的作答内容，当作答阶段未匹配目标掌握层级时，对应的回复阶段也采用参考资源中的常见错误资源，以便于构造的提示文本中的相关内容可以更好地指示回复阶段，以使回复阶段对错误进行解释以及引导下一轮次进行作答。

在一具体应用场景中，请参阅图5，图5是本申请作答阶段对应的一实施方式的应用场景示意图，在每个作答阶段可以随机选择掌握层级，当选择掌握层级后可以随机选择作答方式，以其中一种掌握层级及其对应的作答方式结合常见错误资源，即可在构造的提示文本中添加参考常见错误资源，生成与掌握层级及其对应的作答方式相匹配的作答内容的相关指示，使作答阶段的作答内容更加精确。

进一步地，当作答阶段匹配目标掌握层级时，对应的回复阶段采用参考资源中的知识点资源和题库资源，知识点资源包括不同题型涉及的多种知识点，以及多种知识点匹配的知识点体系和知识点重要程度，从而便于构造的提示文本中的相关内容可以更好地指示回复阶段，以使回复阶段按照知识点体系和知识点重要程度，对作答过程中涉及的知识点进行总结并从题库资源中获取相似试题进行延伸举例，使回复阶段的回复内容更加丰富且准确。

可选地，常见错误资源具体基于答题资源和解题方法资源协同总结得到，知识点重要程度基于答题资源、解题方法资源和知识点体系协同得到。其中，答题资源包括历史答题内容、解题方法资源包括各类题型的参考作答步骤，知识点体系与多个知识点之间的关联性相关，且知识点体系匹配有知识点标签，从而回复内容中的知识点标签被选中后可以参考整个知识点体系所包括的知识点。

在一具体应用场景中，请参阅图6，图6是本申请回复阶段对应的一实施方式的应用场景示意图，其中，图6对应为匹配目标掌握层级时的回复阶段，提示文本中的相关内容可以指示回复阶段按照知识点体系和知识点重要程度，对作答过程中最后一个轮次的作答内容以及所有历史作答内容涉及的知识点进行总结，并从题库资源中获取相似试题进行延伸举例，使回复阶段的回复内容更加丰富且准确。

S402：将提示文本输入智能分析模型，得到智能分析模型输出的每个轮次的作答内容和回复内容，其中，当作答阶段未匹配目标掌握层级时，回复内容至少包括引导下一轮次的引导内容，当作答阶段匹配目标掌握层级时，回复内容至少包括涉及的知识点的总结内容，所有轮次的作答内容和回复内容组成答疑对话数据，目标掌握层级为层级最高的掌握层级。

具体地，将提示文本输入智能分析模型，以使智能分析模型响应提示文本，输出每个轮次的作答内容和回复内容，得到答疑对话数据。

在一应用场景中，基于待作答试题、参考资源和答疑流程，构造提示文本，包括：获取答疑流程对应的总轮次，确定每个轮次的轮次需求；其中，轮次需求至少包括掌握层级；基于待作答试题、参考资源和每个轮次的轮次需求，构造提示文本；其中，提示文本包括指示智能分析模型输出总轮次的答疑对话数据的需求。

具体地，获取答疑流程对应的总轮次，确定每个轮次的轮次需求，每个轮次的轮次需求至少包括掌握层级，此外，轮次需求也可以包括需要从参考资源中提取的资源。

进一步地，利用待作答试题、参考资源和每个轮次的轮次需求，共同构建总轮次对应的提示文本，且提示文本包括指示智能分析模型输出总轮次的答疑对话数据的需求。故此，当提示文本输入智能分析模型后，智能分析模型输出所有轮次的作答内容和回复内容，从而提高答疑对话数据获取的效率。此外，总轮次的数量可以随机增加或减少，最后一个轮次之前的作答阶段的掌握层级及其对应的作答方式，以及最后一个轮次的作答方式均可以随机选择和替换，能够降低收集答疑对话数据的成本。

为便于说明，以掌握层级包括完全未掌握、部分掌握和完全掌握，且总轮次为三轮为例，其中，第一轮随机选择层级最低的掌握层级及其对应的作答方式，第二轮选择中间的掌握层级及其对应的作答方式，第三轮选择目标掌握层级及其对应的作答方式，最终提示文本具体包括：请在第一轮作答阶段结合常见错误资源以答案与题型不匹配的方式进行作答，并在第一轮回复阶段结合常见错误资源和作答内容，在回复时引导下一轮作答，第二轮作答阶段结合常见错误资源以错误答案的方式进行作答，并在第二轮回复阶段结合常见错误资源和作答内容，在回复时对错误进行解释并引导下一轮作答，第三轮作答阶段结合常见错误资源以跳步作答给出正确答案的方式进行作答，并在第三轮回复阶段结合知识点资源和题库资源以及所有轮次的作答内容，在回复时对涉及的知识点进行总结。

可以理解使得，总轮次的数量可以增加或减少，除最后一个轮次之前的其他轮次可以使用目标掌握层级之外的其他掌握层级随机替换，每个掌握层级的作答方式也可以使用掌握层级内对应的作答方式随机替换，从而高效地构造提示文本，本申请对于具体的提示文本所包括的内容不再一一列举。

在另一应用场景中，基于待作答试题、参考资源和答疑流程，构造提示文本，包括：至少基于待作答试题、参考资源和当前轮次的掌握层级及其对应的作答方式，构造当前轮次的作答提示文本；其中，作答提示文本输入智能分析模型，得到当前轮次的作答内容；至少基于当前轮次的作答内容，以及当前轮次的掌握层级和参考资源，构造当前轮次的回复提示文本；其中，回复提示文本输入智能分析模型，得到当前轮次的回复内容。

具体地，对每个轮次的作答阶段和回复阶段分别构造与阶段相匹配的提示文本，当处于当前轮次的作答阶段时，至少利用待作答试题、参考资源和当前轮次的掌握层级及其对应的作答方式，构造当前轮次的作答提示文本，当处于当前轮次的回复阶段时，至少利用当前轮次的作答内容，以及当前轮次的掌握层级和参考资源，构造当前轮次的回复提示文本，若作答阶段未匹配目标掌握层级，则进入下一轮次。故此，通过分别构造每个轮次内作答阶段的作答提示文本和回复阶段的回复提示文本，能够更好地控制对话形式的流程走向，从而获得精度更高的答疑对话数据。

需要说明的是，至少基于待作答试题、参考资源和当前轮次的掌握层级及其对应的作答方式，构造当前轮次的作答提示文本，包括：响应于当前轮次为初始轮次，基于待作答试题、参考资源，以及初始轮次的掌握层级及其对应的作答方式，构造初始轮次的第一作答提示文本；其中，第一作答提示文本输入智能分析模型，得到初始轮次的作答内容；响应于得到上一轮次包括引导内容的回复内容，基于上一轮次得到的回复内容、参考资源，以及当前轮次的掌握层级及其对应的作答方式，构造当前轮次的第二作答提示文本；其中，第二作答提示文本输入智能分析模型，得到当前轮次的作答内容。

具体地，在初始轮次得到待作答试题后，基于待作答试题、参考资源中常见错误资源，以及初始轮次的掌握层级及其对应的作答方式，构造初始轮次的第一作答提示文本，第一作答提示文本输入智能分析模型，得到初始轮次的作答内容。

进一步地，若得到上一轮次包括引导内容的回复内容，则基于上一轮次的回复内容、参考资源中的常见错误资源，以及当前轮次的掌握层级及其对应的作答方式，构造当前轮次的第二作答提示文本。其中，第二作答提示文本输入智能分析模型，得到当前轮次的作答内容，从而在得到当前轮次的作答内容后再次判断当前轮次的作答阶段是否匹配目标掌握层级。故此，当上一轮次未匹配目标掌握层级时，当前轮次的第二作答提示文本可以结合上一轮次的回复内容，从而生成当前轮次精度更高的作答内容。

可以理解的是，至少基于当前轮次的作答内容，以及当前轮次的掌握层级和参考资源，构造当前轮次的回复提示文本，包括：响应于当前轮次的作答阶段未匹配目标掌握层级，基于当前轮次的作答内容和参考资源，构造当前轮次的第一回复提示文本；其中，第一回复提示文本输入智能分析模型，得到包括引导内容的回复内容；响应于当前轮次的作答阶段匹配目标掌握层级，基于所有轮次的作答内容所包括的作答步骤和参考资源，构造当前轮次的第二回复提示文本；其中，第二回复提示文本输入智能分析模型，得到包括总结内容的回复内容。

具体地，判断当前轮次的作答阶段是否匹配目标掌握层级，若当前轮次未匹配目标掌握层级，则基于当前轮次的作答内容和参考资源中的常见错误资源，构造当前轮次的第一回复提示文本，其中，第一回复提示文本输入智能分析模型，得到包括引导内容的回复内容，当作答内容未包括正确答案时，回复内容还包括解释内容，从而更好地模拟引导进一步作答的场景。若当前轮次匹配目标掌握层级，则基于所有轮次的作答内容所包括的作答步骤和参考资源中的知识点资源和题库资源，构造当前轮次的第二回复提示文本。其中，第二回复提示文本输入智能分析模型，得到包括总结内容的回复内容，从而更好地模拟对知识点进行总结的场景。

可选地，当作答阶段的掌握层级介于层级最低的掌握层级以及目标掌握层级之间时，作答阶段对应的第一作答提示文本或第二作答提示文本可以基于少样本方式构造，从而提高智能分析模型输出的作答内容的精度。当然，在不同的应用场景中，每个轮次的作答阶段和回复阶段的提示文本均可以采用零样本方式或者少样本方式构造，本申请对此不做具体限制。

S403：基于作答内容匹配的作答过滤规则，对作答内容进行调整，基于回复内容匹配的回复过滤规则，对回复内容进行调整，得到调整后的答疑对话数据，其中，作答过滤规则与掌握层级及其对应的作答方式相关，回复过滤规则与回复内容的字符数量和表达方式相关。

具体地，对每个轮次的作答内容按照作答过滤规则进行调整，对回复内容按照回复过滤规则进行调整，得到调整后的答疑对话数据。

可以理解的是，当答疑对话数据为整体输出时，则在答疑对话数据输出后对所有轮次的作答内容和回复内容进行调整。当答疑对话数据为分轮次且每个轮次的作答内容和回复内容依次输出时，在得到作答内容后即可对作答内容进行调整，在得到回复内容即可对回复内容进行调整。故此，经过调整后即可得到质量更高的答疑对话数据，以便答疑对话数据后续用于模型训练时，提高训练后的模型的质量。

进一步地，作答过滤规则与掌握层级及其对应的作答方式相关，回复过滤规则与回复内容的字符数量和表达方式相关。例如，作答过滤规则中包括主动询问知识点过滤本题不涉及的知识点，掌握层级为完全未掌握时过滤判断答案为正确，以及掌握层级为完全掌握时过滤判断答案为错误。再例如，回复过滤规则包括回复内容不能超过规定的字数，回复语气不能太过生硬，以及引导内容必须以疑问句的形式。本申请对应具体的过滤规则不做具体限制。

可选地，作答过滤规则和回复过滤规则中还可以设置过滤异常内容，异常内容至少包括无效字符。

区别于上述实施例，提示文本构造时还引入了参考资源，从而增强提示文本中针对作答阶段和回复阶段的相关内容的约束力，使作答阶段和回复阶段均具有可参考的资源，提高作答阶段的作答内容和回复阶段的回复内容的准确率。在得到作答内容和回复内容后，对每个轮次的作答内容按照作答过滤规则进行调整，对回复内容按照回复过滤规则进行调整，得到调整后的质量更高的答疑对话数据，以便答疑对话数据后续用于模型训练时，提高训练后的模型的质量。

请参阅图7，图7是本申请理科答疑模型的训练方法一实施方式的流程示意图，该方法包括：

S701：获取答疑对话数据。

具体地，答疑对话数据是基于上述任一实施例中的答疑对话数据生成方法得到的，相关内容的说明请参见上述方法实施例的详细描述，在此不再赘叙。

S702：利用答疑对话数据训练理科答疑模型，得到训练后的理科答疑模型。

具体地，利用大量的答疑对话数据对理科答疑模型进行训练，其中，答疑对话数据作答阶段的作答内容即为输入理科答疑模型的数据，答疑对话数据作答阶段的回复内容即为理科答疑模型的训练标签。故此，通过大量的丰富度较高的答疑对话数据对理科答疑模型进行有监督训练，能够大幅提高理科答疑模块对各类作答内容的回复效果。

可选地，理科答疑模型包括第一判断模块、第二判断模块、解释模块、引导模块和总结模块，利用答疑对话数据训练理科答疑模型，得到训练后的理科答疑模型，包括：将答疑对话数据中当前轮次作答阶段的作答内容输入第一判断模块；其中，第一判断模块判断输入的作答内容是否正确；响应于第一判断模块判断结果为错误，将作答内容输入解释模块和引导模块，得到由解释模块输出的预测解释内容和预测引导内容组成的预测回复内容，将答疑对话数据中下一轮次更新为当前轮次；响应于第一判断模块判断结果为正确，将作答内容输入第二判断模块；其中，第二判断模块判断当前轮次的作答阶段是否匹配目标掌握层级；响应于第二判断模块判断结果为未匹配，将作答内容输入引导模块，得到由引导模块输出的预测引导内容构成的预测回复内容，将答疑对话数据中下一轮次更新为当前轮次；响应于第二判断模块判断结果为匹配，将所有轮次的作答内容输入至总结模块，得到由总结模块输出的预测总结内容构成的预测回复内容；基于每个轮次的预测回复内容和答疑对话数据中每个轮次作答阶段的回复内容，调整理科答疑模型的参数，直至得到训练后的理科答疑模型。

具体地，请再次参阅图3，其中，理科答疑模型的构建与图3所示的流程相匹配，理科答疑模型包括第一判断模块、第二判断模块、解释模块、引导模块和总结模块。将答疑对话数据中当前轮次作答阶段的作答内容输入第一判断模块，第一判断模块判断输入的作答内容是否正确，若第一判断模块判断结果为错误，则将作答内容输入解释模块和引导模块，得到由解释模块输出的预测解释内容和预测引导内容组成的预测回复内容，将答疑对话数据中下一轮次更新为当前轮次，从而返回至将答疑对话数据中当前轮次作答阶段的作答内容输入第一判断模块的步骤。

进一步地，若第一判断模块判断结果为正确，则将作答内容输入第二判断模块，第二判断模块判断当前轮次的作答阶段是否匹配目标掌握层级。若第二判断模块判断结果为未匹配，则将作答内容输入引导模块，得到由引导模块输出的预测引导内容构成的预测回复内容，将答疑对话数据中下一轮次更新为当前轮次，从而返回至将答疑对话数据中当前轮次作答阶段的作答内容输入第一判断模块的步骤。

可以理解的是，若第二判断模块判断结果为匹配，则将所有轮次的作答内容输入至总结模块，得到由总结模块输出的预测总结内容构成的预测回复内容。故此，当理科答疑模型对每个轮次的回放阶段进行预测，得到预测回复内容后，对比每个轮次的预测回复内容和答疑对话数据中每个轮次作答阶段的回复内容，得到训练损失，基于训练损失调整理科答疑模型的参数，直至理科答疑模型收敛，得到训练后的理科答疑模型，得到与答疑流程高度匹配的理科答疑模型。

可选地，理科答疑模型的训练过程中可以在每个轮次对理科答疑模型的参数进行调整，也可以在得到部分轮次的预测回复内容后对理科答疑模型的参数进行调整，也可以在得到所有轮次的预测回复内容后对理科答疑模型的参数进行调整。

请参阅图8，图8是本申请答疑对话数据生成系统一实施方式的结构示意图，该答疑对话数据生成系统80包括：构造模块801和获取模块802，构造模块801用于获取待作答试题，构造与待作答试题和答疑流程相关的提示文本；其中，答疑流程包括至少一轮次的作答阶段和回复阶段，作答阶段分为多个掌握层级，每个掌握层级对应至少一种作答方式；获取模块802用于将提示文本输入智能分析模型，得到智能分析模型输出的每个轮次的作答内容和回复内容；其中，当作答阶段未匹配目标掌握层级时，回复内容至少包括引导下一轮次的引导内容，当作答阶段匹配目标掌握层级时，回复内容至少包括涉及的知识点的总结内容，所有轮次的作答内容和回复内容组成答疑对话数据，目标掌握层级为层级最高的掌握层级。

上述方案，构造模块801获取待作答试题，按照答疑流程构造与待作答试题和答疑流程相关的提示文本，其中，答疑流程包括作答阶段和回复阶段，两个阶段共同组成一个轮次，答疑流程包括至少一个轮次，作答阶段分为多个掌握层级，每个掌握层级对应至少一种作答方式。因此，在构造与作答阶段相关的提示文本中的部分内容时，可以从不同深度的掌握层级中随机选择掌握层级，并从不同广度选择掌握层级对应的作答方式引导作答阶段，能够提高作答内容的丰富度，获取模块802将提示文本输入智能分析模型，以使智能分析模型响应提示文本，输出每个轮次的作答内容和回复内容，得到答疑对话数据。其中，当作答阶段未匹配目标掌握层级时，回复内容至少包括引导下一轮次的引导内容，从而模拟引导继续作答的对话形式，当作答阶段匹配目标掌握层级时，回复内容至少包括涉及的知识点的总结内容，从而答疑流程结束，整个答疑对话数据能够引导直至作答阶段达到目标掌握层级，并且把涉及的知识点梳理出来做总结。故此，只需要对轮次数量以及掌握层级及其对应的作答方式进行调整，构造提示文本即可高效地收集丰富的答疑对话数据。

可选地，构造模块801还用于获取待作答试题，确定待作答试题匹配的参考资源；其中，参考资源至少包括常见错误资源、知识点资源和题库资源；基于待作答试题、参考资源和答疑流程，构造提示文本。

可选地，构造模块801还用于获取答疑流程对应的总轮次，确定每个轮次的轮次需求；其中，轮次需求至少包括掌握层级；基于待作答试题、参考资源和每个轮次的轮次需求，构造提示文本；其中，提示文本包括指示智能分析模型输出总轮次的答疑对话数据的需求。

可选地，构造模块801还用于至少基于待作答试题、参考资源和当前轮次的掌握层级及其对应的作答方式，构造当前轮次的作答提示文本；其中，作答提示文本输入智能分析模型，得到当前轮次的作答内容；至少基于当前轮次的作答内容，以及当前轮次的掌握层级和参考资源，构造当前轮次的回复提示文本；其中，回复提示文本输入智能分析模型，得到当前轮次的回复内容。

可选地，构造模块801还用于响应于当前轮次为初始轮次，基于待作答试题、参考资源，以及初始轮次的掌握层级及其对应的作答方式，构造初始轮次的第一作答提示文本；其中，第一作答提示文本输入智能分析模型，得到初始轮次的作答内容；响应于得到上一轮次包括引导内容的回复内容，基于上一轮次得到的回复内容、参考资源，以及当前轮次的掌握层级及其对应的作答方式，构造当前轮次的第二作答提示文本；其中，第二作答提示文本输入智能分析模型，得到当前轮次的作答内容。

可选地，构造模块801还用于响应于当前轮次的作答阶段未匹配目标掌握层级，基于当前轮次的作答内容和参考资源，构造当前轮次的第一回复提示文本；其中，第一回复提示文本输入智能分析模型，得到包括引导内容的回复内容；响应于当前轮次的作答阶段匹配目标掌握层级，基于所有轮次的作答内容所包括的作答步骤和参考资源，构造当前轮次的第二回复提示文本；其中，第二回复提示文本输入智能分析模型，得到包括总结内容的回复内容。

可选地，未匹配目标掌握层级的回复阶段，以及所有作答阶段均采用常见错误资源，匹配目标掌握层级的回复阶段采用知识点资源和题库资源；其中，知识点资源包括不同题型涉及的多种知识点，以及多种知识点匹配的知识点体系和知识点重要程度。

可选地，获取模块802还用于基于作答内容匹配的作答过滤规则，对作答内容进行调整，基于回复内容匹配的回复过滤规则，对回复内容进行调整，得到调整后的答疑对话数据；其中，作答过滤规则与掌握层级及其对应的作答方式相关，回复过滤规则与回复内容的字符数量和表达方式相关。

可选地，多个掌握层级由低到高至少包括完全未掌握、部分掌握和完全掌握，完全未掌握对应的作答方式包括无答案和答案与待作答试题的题型无关中的至少一者，部分掌握对应的作答方式包括答案错误和存在错误的作答步骤中的至少一者，完全掌握对应的作答方式包括答案正确且无作答步骤，以及答案正确且存在至少部分作答步骤中的至少一者；其中，当作答内容未包括正确答案时，回复内容还包括解释内容。

请参阅图9，图9是电子设备一实施方式的结构示意图，该电子设备90包括相互耦接的存储器901和处理器902，存储器901中存储有程序指令（未标识），处理器902用于执行程序指令以实现上述任一实施例中的答疑对话数据生成方法。相关内容的说明请参见上述方法实施例的详细描述，在此不再赘叙。

上述方案，能够提高答疑对话数据的丰富度和收集效率。

请参阅图10，图10是本申请计算机可读存储介质一实施方式的结构示意图，该计算机可读存储介质100上存储有程序指令1000，程序指令1000被处理器执行时实现上述任一实施例中所述的答疑对话数据生成方法。相关内容的说明请参见上述方法实施例的详细描述，在此不再赘叙。

上述方案，能够提高答疑对话数据的丰富度和收集效率。

需要说明的是，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）或处理器（processor）执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施方式，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：科大讯飞股份有限公司;

上一篇：一种半导体湿法制程用多腔室独立压力控制装置
下一篇：粮情判断方法装置、设备及存储介质