用于提升中医问诊效率的智能交谈方法和装置

文献发布时间：2024-04-18 19:58:30

技术领域

本发明涉及人工智能、自然语言处理技术领域，具体涉及一种用于提升中医问诊效率的智能交谈方法和装置。

背景技术

中医是源自中国传统文化的一门医学体系，悠久的历史使其成为世界上最古老、最复杂的医学学科之一。然而，学习中医并不容易。中医的理论体系庞大且复杂，需要掌握大量的经典著作和诊断治疗方法。学习者需要投入较长时间和较多精力去理解和应用中医的理论与实践。此外，中医学习过程中需要进行长时间的临床实践，通过实际操作来提高诊断和治疗能力。中医的高学习成本也导致了中医医生数量的相对较少。相比于西医，中医医生培养需要更长的时间和更多的资源投入，导致中医医生的数量难以满足社会需求。因此，中医医生在市场上相对稀缺，有限的资源无法满足广大人民群众对中医服务的需求。通过引入智能交谈系统可以在一定程度上缓解中医医生数量少的问题。智能交谈系统可以利用人工智能技术和大数据分析，提供快速、准确的中医健康咨询和诊断建议，帮助人们解决一些常见的健康问题。

交谈连贯性是智能交谈系统中的一个重要指标，它影响着系统回复的流畅性和自然度。然而，现有智能交谈方法在交谈连贯性方面存在不足。现有的智能交谈系统往往无法突出会话记录和待推送回复中的关键信息，从而导致无法筛选出会话记录中与待推送回复相关性高的交谈记录，这导致推送给用户的回复缺乏前文信息的支撑，使得交谈中的逻辑和连贯性受到限制。而当用户表达方式稍有变化或问题意图不明确时，系统容易产生误判，返回的答案可能与用户期望不符，导致连贯性进一步下降。现有的方法未能很好的解决这个问题，因此智能交谈任务仍然是一项具有挑战的任务。

针对上述问题，本发明提出了一种用于提升中医问诊效率的智能交谈方法和装置，其可以更好地理解会话记录语境，突出会话记录和待推送回复中的关键信息，以便确定会话记录中与待推送回复相关性高的交谈记录并过滤无关的信息，进而提高智能交谈模型的预测准确性。

发明内容

本发明要解决的技术问题是提供用于提升中医问诊效率的智能交谈方法和装置，来更好地理解会话记录语境，突出会话记录和待推送回复中的关键信息，以便确定会话记录中与待推送回复相关性高的交谈记录并过滤无关的信息，从而提高智能交谈模型的预测准确性。

本发明采用如下技术手段实现发明目的：

一种用于提升中医问诊效率的智能交谈方法，其特征是：该方法包括如下步骤：

S1、获取智能交谈数据集：从网络上爬取公开的中医问诊智能交谈数据并自行构建智能交谈数据集；

S2、构建智能交谈模型：基于交谈语义适配器模块构建智能交谈模型；

S3、训练智能交谈模型：在步骤S1所得到智能交谈训练数据集上对步骤S2构建的智能交谈模型进行训练。

作为对本技术方案的进一步限定，所述步骤S2用于构建输入模块、构建预训练嵌入模块、构建交谈语义适配器模块和构建标签预测模块，进而构建智能交谈模型。

作为对本技术方案的进一步限定，所述构建输入模块在已构建的中医问诊智能交谈数据集中抽取一条数据，该数据中包含n条交谈记录、一条待推送回复和一个标签，分别将其形式化为h

作为对本技术方案的进一步限定，所述预训练嵌入模块使用预训练语言模型BERT对输入数据即h

…，

其中，h

作为对本技术方案的进一步限定，所述交谈语义适配器模块接收预训练嵌入模块输出的每条交谈记录的特征表示即

具体而言，该模块的实现流程如下所述：

(1)联接交谈记录1表示

其中，

(2)联接交谈记录2表示

其中，

然后通过门控机制对联合编码1即

其中，

(3)联接交谈记录3表示

其中，

然后通过门控机制对融合嵌入1

其中，

(4)联接交谈记录4表示

其中，

然后通过门控机制对融合嵌入n-2即

其中，

(5)通过联接操作和自注意力机制对所有的交谈记录编码完成语境特征聚合操作，从而得到语境融合嵌入，记为

其中，

作为对本技术方案的进一步限定，所述标签预测模块将交谈语义适配器模块输出的交谈语义适配嵌入作为本模块的输入，使用一层维度为1、激活函数为Sigmod的全连接网络对其处理，从而得到当前待推送回复为正确待推送回复的概率；比较不同待推送回复的概率，将概率最高的待推送回复作为正确待推送回复推送给用户。

一种利用权利要求1的用于提升中医问诊效率的智能交谈装置，其特征是：该装置包括：

智能交谈数据集获取单元，用于从网络上爬取公开的中医问诊智能交谈数据并自行构建智能交谈数据集；

智能交谈模型构建单元，用于构建输入模块、构建预训练嵌入模块、构建交谈语义适配器模块和构建标签预测模块，进而构建智能交谈模型；

智能交谈模型训练单元，用于构建损失函数和优化函数，完成待推送回复的预测。

一种电子设备，包括：存储器和至少一个处理器；

其中，所述存储器上存储有计算机程序；

所述至少一个处理器执行所述存储器存储的计算机程序，使得所述至少一个处理器执行如上述的用于提升中医问诊效率的智能交谈方法。

一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序可被处理器执行以实现如上述的用于提升中医问诊效率的智能交谈方法。

与现有技术相比，本发明的有益效果如下：

(1)本发明通过预训练嵌入模块，可以有效提取会话记录和待推送回复的深层语义特征，从而提高智能交谈系统的语义提取能力；

(2)本发明通过交谈语义适配器模块，可以更好地理解会话记录语境，从而得到更优质的上下文语境表示；

(3)本发明通过交谈语义适配器模块，可以突出会话记录和待推送回复中的关键信息，以便确定会话记录中与待推送回复相关性高的交谈记录并过滤无关的信息，从而获得更准确的交谈表示；

(4)本发明提出的方法和装置，结合交谈语义适配器模块，可以有效提高智能交谈系统推送正确待推送回复的正确率。

附图说明

图1为用于提升中医问诊效率的智能交谈方法的流程图。

图2为构建智能交谈模型的流程图。

图3为训练智能交谈模型的流程图。

图4为用于提升中医问诊效率的智能交谈装置的流程图。

图5为交谈语义适配器模块的结构示意图。

图6为用于提升中医问诊效率的智能交谈模型的框架示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照说明书附图和具体实施例对本发明的一种用于提升中医问诊效率的智能交谈方法和装置作以下详细地说明。

实施例1：

本发明的总体模型框架结构如图6所示。由图6可知，本发明的主要框架结构包含预训练嵌入模块、交谈语义适配器模块和标签预测模块。其中，预训练嵌入模块对会话记录中的每条交谈记录和待推送回复分别进行特征提取，从而得到会话记录中每条交谈记录的特征表示和待推送回复特征表示，并将其传递给交谈语义适配器模块。交谈语义适配器模块首先分别联接每条交谈记录的特征表示和待推送回复特征表示，然后通过一个编码器分别对每个联接结果进行编码操作，从而得到多个联合编码，然后每个联合编码分别和各自对应的每条交谈记录计算相关性，基于每个相关性表示对每条交谈记录进行特征筛选，从而获得每条交谈记录的编码表示，并通过联接操作和自注意力机制对所有的交谈交谈记录的编码表示完成语境特征聚合操作，同时通过门控机制对所有的联合编码进行语义特征融合，并通过自注意力机制对语义特征融合表示进行特征过滤，最终通过联接操作和基于ReLU激活函数的稠密网络对语境融合嵌入和特征过滤进行语义适配融合操作，从而得到交谈语义适配嵌入，并将其传递给标签预测模块。标签预测模块将交谈语义适配嵌入映射为指定区间上的一个浮点型数值，将其作为该待推送回复与会话记录的匹配度；然后比较不同回复的匹配度，将匹配度最高的回复作为正确回复；具体如下：

(1)预训练嵌入模块使用预训练语言模型BERT对输入数据分别进行特征提取，从而得到会话记录中每条交谈记录的特征表示和待推送回复嵌入；

(2)交谈语义适配器模块通过联合编码和交互操作对每条交谈记录的特征表示和待推送回复特征表示进行特征提取和筛选，从而得到交谈语义适配嵌入；

(3)标签预测模块将交谈语义适配嵌入作为本模块的输入，使用一层维度为1、激活函数为Sigmod的全连接网络对其处理，从而得到当前待推送回复为正确待推送回复的概率；比较不同待推送回复的概率，将概率最高的待推送回复作为正确待推送回复推送给用户。

实施例2：

如附图1所示，本发明用于提升中医问诊效率的智能交谈方法，该方法包括如下步骤：

S1、获取智能交谈数据集：从网络上爬取公开的中医问诊智能交谈数据并自行构建智能交谈数据集；

S2、构建智能交谈模型：利用交谈语义适配器模块构建智能交谈模型；

S3、训练智能交谈模型：在步骤S1所得到智能交谈训练数据集上对步骤S2构建的智能交谈模型进行训练。

S1、获取智能交谈数据集

S101、使用爬虫获取数据：编写爬虫程序，在面向公众开放诊疗记录的中医问诊平台爬取公开的医患交谈数据，得到智能交谈原始数据。

举例：针对面向公众开放诊疗记录的中医问诊平台编写相应的爬虫程序，爬取医患交谈记录，从而获取智能交谈的原始数据。某中医问诊平台的医患交谈记录示例，如下表：

S102、构建中医问诊智能交谈数据集：基于每条会话记录构建正样本和负样本，并按照预设比例将所有样本数据划分训练集和测试集。

举例：以步骤S101中展示的数据为例，将S

按照4:1的比例将该数据集划分为训练集和测试集。

S2、构建智能交谈模型

构建智能交谈模型的流程如图2所示，主要操作为构建输入模块、构建预训练嵌入模块、构建交谈语义适配器模块和构建标签预测模块。

S201、构建输入模块

在S102步骤构建的中医问诊智能交谈数据集中抽取一条数据，该数据中包含n条交谈记录、一条待推送回复和一个标签，分别将其形式化为h

举例：使用S102中展示的数据作为样例，以此展示一条输入数据。其结果如下所示：

S202、构建预训练嵌入模块

预训练嵌入模块使用预训练语言模型BERT对输入数据即h

…，

其中，h

举例：本发明实施时，调用预训练语言模型BERT的完成每条交谈记录和待推送回复的编码操作，一切参数设置均按pytorch中BERT的默认设置。在pytorch中，对于上面描述的代码实现如下所示：

#使用bert的编码层对输入数据进行编码

h_encoder_list＝[]

for iin h_embed_list:

h_encoder_list.append(BERT(i)[1])

r_embed＝BERT(r)[1]

其中，h_embed_list中存放的是会话记录中的每条交谈记录，r是待推送回复，h_encoder_list中存放的是会话记录中每条交谈记录的特征表示，r_embed是待推送回复嵌入。

S203、构建交谈语义适配器模块

交谈语义适配器模块接收预训练嵌入模块输出的每条交谈记录的特征表示即

具体而言，该模块的实现流程如下所述：

S20301联接交谈记录1表示

其中，

S20302联接交谈记录2表示

其中，

然后通过门控机制对联合编码1即

其中，

S20303联接交谈记录3表示

其中，

然后通过门控机制对融合嵌入1即

其中，

S20304联接交谈记录4表示

其中，

然后通过门控机制对融合嵌入n-2即

其中，

S20305通过联接操作和自注意力机制对所有的交谈记录编码完成语境特征聚合操作，从而得到语境融合嵌入，记为

其中，

举例：本发明中的编码网络Encoder选择使用Transformer Encoder，编码维度设置为512；层数设置为1层；Self-Attention选择使用Add Self-Attention计算方法，以语义交互嵌入的计算为例，其计算过程如下所示：

该式表示通过逐元素相加操作实现语义交互嵌入对自身的交互计算

该式表示通过归一化操作获得注意力权重α，i和i'表示对应输入张量中的元素下标，l表示输入张量

该式表示使用已获得的注意力权重α完成对融合嵌入n-1的特征筛选，从而得到语义交互嵌入，l表示

在pytorch中，对于上面描述的代码实现如下所示：

其中，history_embed_list表示会话记录中所有交谈记录表示的列表；response_embed表示待推送回复表示；yisp表示交谈语义适配嵌入。

S204、构建标签预测模块

标签预测模块将步骤S203输出的交谈语义适配嵌入作为本模块的输入，使用一层维度为1、激活函数为Sigmod的全连接网络对其处理，从而得到当前待推送回复为正确待推送回复的概率；比较不同待推送回复的概率，将概率最高的待推送回复作为正确待推送回复推送给用户。

当模型尚未进行训练时，需要进一步执行步骤S3进行训练，以优化模型的参数；当模型训练完毕时，可执行步骤S204预测待推送回复中的哪一个是正确待推送回复。

S3、训练智能交谈模型

将步骤S2构建的智能交谈模型在步骤S1所得的智能交谈训练数据集上进行训练。其流程如图3所示。

S301、构建损失函数。

本发明采用了交叉熵作为损失函数，公式如下所示。

其中，y

举例：在pytorch中，对于上面描述的代码实现如下所示：

#通过交叉熵损失函数计算预测值与标签之间的误差

loss_fct＝CrossEntropyLoss()

loss＝loss_fct(logits.view(-1,self.num_labels),labels.view(-1))

其中，labels为真实的标签，logits为模型输出的正确概率。

S302、构建优化函数

模型经过对多种优化函数进行测试，最终选择使用AdamW优化函数作为优化函数，除了其学习率设置为2e-5外，AdamW的其他超参数均选择pytorch中的默认值设置。

举例：在pytorch中，对于上面描述的代码实现如下所示：

#通过AdamW优化器对模型参数进行优化

optimizer＝AdamW(optimizer_grouped_parameters,lr＝2e-5)

其中，optimizer_grouped_parameters为待优化的参数，默认为智能交谈模型中的所有参数。

实施例3：

本装置主要包含3个单元，分别是智能交谈数据集获取单元、智能交谈模型构建单元和智能交谈模型训练单元。其流程如图4所示，每个单元的具体功能如下所述：

智能交谈数据集获取单元，用于从网络上爬取公开的中医问诊智能交谈数据并自行构建智能交谈数据集。

智能交谈模型构建单元，用于构建输入模块、构建预训练嵌入模块、构建交谈语义适配器模块和构建标签预测模块，进而构建智能交谈模型。

智能交谈模型训练单元，用于构建损失函数和优化函数，完成待推送回复的预测。

进一步的，所述智能交谈模型构建单元还包括：

构建输入模块单元，负责预处理原始数据集，从而构建输入数据。

构建预训练嵌入模块单元，负责用预训练语言模型BERT对输入数据分别进行编码处理，从而得到历史对话中每条交谈记录的特征表示和待推送回复特征表示。

构建交谈语义适配器模块单元，负责接收预训练嵌入模块输出的每条交谈记录的特征表示和待推送回复特征表示，然后分别联接每条交谈记录的特征表示和待推送回复特征表示，然后通过一个编码器分别对每个联接结果进行编码操作，从而得到多个联合编码，然后每个联合编码分别和各自对应的每条交谈记录计算相关性，基于每个相关性表示对每条交谈记录进行特征筛选，从而获得每条交谈记录的编码表示，并通过联接操作和自注意力机制对所有的交谈交谈记录的编码表示完成语境特征聚合操作，同时通过门控机制对所有的联合编码进行语义特征融合，并通过自注意力机制对语义特征融合表示进行特征过滤，最终通过联接操作和基于ReLU激活函数的稠密网络对语境融合嵌入和语义交互嵌入进行语义适配融合操作，从而得到交谈语义适配嵌入。

构建标签预测模块单元，负责基于交谈语义适配嵌入判断当前待推送回复是否为正确待推送回复。

所述智能交谈模型训练单元还包括：

构建损失函数单元，负责使用交叉熵损失函数计算预测结果与真实标签的误差。

构建优化函数单元，负责训练并调整模型训练中的参数，减小预测误差。

实施例4：

本实施例还提供了一种电子设备，包括：存储器和处理器；

其中，存储器存储计算机执行指令；

处理器执行所述存储器存储的计算机执行指令，使得处理器执行本发明任一实施例中的用于提升中医问诊效率的智能交谈方法。

处理器可以是中央处理单元(CPU)，还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通过处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可用于储存计算机程序和/或模块，处理器通过运行或执行存储在存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现电子设备的各种功能。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器还可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，只能存储卡(SMC)，安全数字(SD)卡，闪存卡、至少一个磁盘存储期间、闪存器件、或其他易失性固态存储器件。

实施例5：

本实施例还提供了一种计算机可读存储介质，其中存储有多条指令，指令由处理器加载，使处理器执行本发明任一实施例中的用于提升中医问诊效率的智能交谈方法。具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。

在这种情况下，从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RYM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上下载程序代码。

此外，应该清楚的是，不仅可以通过执行计算机所读出的程序代码，而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作，从而实现上述实施例中任意一项实施例的功能。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：海南榕树家信息科技有限公司;