基于文本识别的问诊方法、装置、设备及存储介质

文献发布时间：2023-06-19 10:14:56

技术领域

本发明涉及智能决策领域，尤其涉及一种基于文本识别的问诊方法、装置、设备及存储介质。

背景技术

随着人工智能的高速发展以及医院信息化的发展，智能辅助问诊方式也随之产生，由于多数患者的自身医疗知识有限，多数患者很难准确地判断自己要挂号或者问诊咨询的科室，而现有的智能辅助问诊的方式大多需要用户自己选择科室及医生进行问诊，且在问诊过程中现有的智能辅助问诊系统也仅是针对患者描述的信息这单一对象进行分析，并没有将问诊过程中产生的相关信息结合分析，导致问诊辅助的准确性较低。

发明内容

鉴于以上内容，本发明提供一种基于文本识别的问诊方法、装置、设备及存储介质，其目的在于解决现有技术中问诊辅助的准确性较低的技术问题。

为实现上述目的，本发明提供一种基于文本识别的问诊方法，该方法包括：

获取用户输入的问诊信息，从所述问诊信息中提取关键信息，基于所述关键信息为所述用户分配科室信息；

将所述关键信息及所述科室信息输入模板匹配模型中得到多个初始匹配模板，从所述多个初始匹配模板中选取出目标模板信息并反馈至所述用户；

接收所述用户基于所述目标模板信息反馈的初始对话信息，从所述初始对话信息中选取出目标对话信息，将所述问诊信息、所述科室信息、所述目标模板信息及所述目标对话信息输入预先训练的问诊辅助模型得到多个初始诊断结果并反馈至预设终端；

接收预设终端基于所述多个诊断结果选取的目标诊断结果，将所述目标诊断结果、所述问诊信息、所述科室信息及所述目标对话信息输入药品推荐模型，得到药品推荐结果，将所述目标诊断结果和药品推荐结果反馈至所述用户。

优选的，所述从所述问诊信息中提取关键信息，包括：

对所述问诊信息对应的问诊文本执行分词操作，计算各分词在所述问诊文本中的词频，基于所述词频计算出各分词的IDF值及TF值，将各分词的IDF值与各分词对应的TF值相乘得到各分词的TF-IDF值，基于各分词的TF-IDF值选取第一预设数量的预设词性的关键词。

优选的，所述基于所述关键信息为所述用户分配科室信息，包括：

将所述关键信息对应的多个关键词向量化后拼接成特征序列，将所述特征序列输入预先训练好的科室识别模型中得到所述科室信息，其中，所述科室识别模型是基于BERT预训练模型得到的。

优选的，所述从所述多个初始匹配模板中选取出目标模板信息，包括：

基于各个初始匹配模板对应的匹配概率由大到小对各个初始匹配模板进行排序，选取出排序靠前的第二预设数量的模板作为候选匹配模板，基于预设选取规则从所述候选匹配模板中选取出目标模板。

优选的，所述基于预设选取规则从所述候选匹配模板中选取出目标模板，包括：

将各个候选匹配模板分别与预先配置的正则表达式进行匹配，当候选匹配模板与任一正则表达式匹配成功时，将匹配成功的正则表达式对应的预设权重赋予该候选匹配模板，基于权重由大到小对各候选模板进行排序，选取权重最高的候选模板作为所述目标模板。

优选的，所述从所述初始对话信息中选取出目标对话信息，包括：

将所述初始对话信息转换成对话文本，基于TF-IDF算法提取出对话文本的关键词，并选取出第三预设数量的关键词作为目标关键词；

将所述对话文本拆分为多个句子，分别判断每个句子中是否存在第四预设数量的目标关键词，当判断任一句子中存在第四预设数量的目标关键词时，将该句子作为目标对话信息中的句子。

优选的，所述将该句子作为目标对话信息中的句子之后，所述方法还包括：

判断目标对话信息中是否存在句子序列长度超过预设长度的句子，若存在，对该句子执行截断操作。

为实现上述目的，本发明还提供一种基于文本识别的问诊装置，该基于文本识别的问诊装置包括：

接收模块：用于接收客户端发出的模型调用的请求，根据所述请求携带的标识从预设数据库获取待调用模型的配置信息；

生成模块：用于基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器，将所述待调用模型的配置信息发送至所述目标服务器，所述目标服务器基于所述配置信息生成所述请求对应的URL地址；

调用模块：用于基于所述URL地址向所述目标服务器调用所述请求对应的模型，判断是否调用到所述请求对应的模型，当判断调用到所述请求对应的模型时，将该模型反馈至所述客户端。

为实现上述目的，本发明还提供一种电子设备，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的程序，所述程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上所述的基于文本识别的问诊方法的任意步骤。

为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有基于文本识别的问诊程序，所述基于文本识别的问诊程序被处理器执行时，实现如上所述基于文本识别的问诊方法的任意步骤。

本发明提出的基于文本识别的问诊方法、装置、设备及存储介质，本方案可以为问诊患者自动分配科室，并根据患者的信息和科室信息匹配出对话模板，根据对话模板获取患者的目标对话信息，之后将目标对话信息、目标模板信息、科室信息及问诊信息输入预先训练的疾病诊断模型，得到多个初始结果反馈至医生，接收医生反馈的目标诊断结果，并根据目标诊断结果得到药品推荐结果，结合多种信息进行问诊分析，提高问诊辅助的准确率。

附图说明

图1为本发明基于文本识别的问诊方法较佳实施例的流程图示意图；

图2为本发明基于文本识别的问诊装置较佳实施例的模块示意图；

图3为本发明电子设备较佳实施例的示意图；

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种基于文本识别的问诊方法。参照图1所示，为本发明基于文本识别的问诊方法的实施例的方法流程示意图。该方法可以由一个电子设备执行，该电子设备可以由软件和/或硬件实现。基于文本识别的问诊方法包括：

步骤S10：获取用户输入的问诊信息，从所述问诊信息中提取关键信息，基于所述关键信息为所述用户分配科室信息。

在本实施例中，当用户需要在线上问诊时，用户可以开启终端上用于线上问诊的应用程序并发起问诊请求，并根据应用程序的提示输入的问诊信息，其中，问诊信息可以是语音信息，也可以是文本信息，若问诊信息为语音信息时，可以将语音信息转换成文本信息，用户通过该应用程序输入相关的问诊信息后，可以将问诊信息提交并发起问诊请求，终端接收到用户发出的问诊请求后，解析该请求获取请求中携带的问诊信息，其中，请求中可以包括相关的问诊信息，也可以包括待相关问诊信息的存储路径。也就是说，问诊信息可以是用户在提交问诊请求时一并输入，也可以是用户提交问诊请求之后应用程序从请求指定的地址中获取的。

由于用户在问诊过程中可能输入大量与问诊内容无关的问诊信息，因此需要从用户输入的问诊信息中提取出关键信息，根据关键信息为用户分配科室信息。

在一个实施例中，所述从所述问诊信息中提取关键信息，包括：

对问诊信息对应的问诊文本执行分词后，统计问诊文本中的所有词的出现次数，计算出IDF(逆文档频率值)，然后再计算出问诊文本中每个词的TF(词频)值。其中，TF＝(词语在文本中出现次数)/(各词语在文本中出现次数的总和)，将IDF值与TF值相乘，得到该词的TF-IDF值，TF-IDF值可以评估字词对于文本中的重要程度，TF-IDF值越大表示作为关键词的优先级越高。在进行TF-IDF计算时，通过对词频与逆文档频率得出某个字词的TF-IDF值，若TF-IDF值越大，该词对文本的重要性越高，因此可以将TF-IDF值排在前面的字词作为问诊文本的关键词，例如，选取TF-IDF值排在前5的关键词作为关键信息。

在一个实施例中，所述基于所述关键信息为所述用户分配科室信息，包括：

科室识别模型是在BERT模型字符级别的向量输出结果之后，接入了Text-CNN网络通过卷积神经网络的再次卷积池化进一步的提取模型特征，并且在经过Text-CNN之后和模型的句子向量再次拼接，然后一起接入全连接层经过激活函数softmax进行分类的模型。

步骤S20：将所述关键信息及所述科室信息输入模板匹配模型中得到多个初始匹配模板，从所述多个初始匹配模板中选取出目标模板信息并反馈至所述用户。

在本实施例中，将关键信息对应的多个关键词和科室信息进行向量化后进行拼接得到特征序列，将该特征序列输入模板匹配模型中，得到多个初始匹配模板，其中，多个初始匹配模板包含了对应模板的预测概率。需要说明的是，模板可以是预先配置的对话模板(例如，根据多名医生的诊断经验预先配置多套对话模板)，通过对话模板对问诊的病人进行一系列的提问，可以更准确的获取到用户的问诊信息。

模板匹配模型是在BERT模型字符级别的向量输出结果之后，接入了Text-CNN网络通过卷积神经网络的再次卷积池化进一步的提取模型特征，并且在经过Text-CNN之后和模型的句子向量再次拼接，然后一起接入全连接层经过激活函数softmax进行分类的模型，由于BERT预训练模型的最大数据输入长度为512，因此可以对科室信息和关键信息拼接之后做截断处理，利用特殊字符对科室信息和关键信息进行了拼接，使得模型可以学习到两种特征信息的位置以及分割标识符，然后输入到BERT模型中，得到多个初始匹配模板。

在一个实施例中，所述从所述多个初始匹配模板中选取出目标模板信息，包括：

可以将多个初始匹配模板中各模板的概率由大到小进行排序，选取排序前6的模板作为候选匹配模板。

进一步地，所述基于预设选取规则从所述候选匹配模板中选取出目标模板，包括：

将排序前6的候选模板分别与数据库中预先配置的正则表达式进行匹配，每个正则表达式有对应的权重，若排序前6的模板与任一正则表达式匹配成功，为该候选模板赋相应的权重，并根据各候选模板得到的权重大小对各候选模板重新排序，选取权重最高的候选模板作为目标模板。可以理解的是，数据库中的正则表达式可以是医生预先配置的。

步骤S30：接收所述用户基于所述目标模板信息反馈的初始对话信息，从所述初始对话信息中选取出目标对话信息，将所述问诊信息、所述科室信息、所述目标模板信息及所述目标对话信息输入预先训练的问诊辅助模型得到多个初始诊断结果并反馈至预设终端。

在本实施例中，通过对话模板对用户进行一系列的提问后，可以获取用户回答的对话信息，由于对话信息远远超过了BERT预训练模型的512要求的token长度，因此可以提取出对话信息中的关键句作为目标对话信息，将目标对话信息、目标模板信息、科室信息及问诊信息向量化拼接处理后得到特征序列输入预先训练的问诊辅助模型中可以得到多个初始诊断结果，其中，问诊辅助模型是根据BERT模型训练得到的。得到多个初始诊断结果后，将多个初始诊断结果反馈至预设终端，预设终端可以是指医生使用的终端，医生可以根据多个初始诊断结果中选取最终的诊断结果。在模型数据标签设定使用了one-shot标识当作类别，一个样本可以有多个标签。

在一个实施例中，所述从所述初始对话信息中选取出目标对话信息，包括：

将所述初始对话信息转换成对话文本，基于TF-IDF算法提取出对话文本的关键词，并选取出第三预设数量的关键词作为目标关键词；

利用TF-IDF算法提取出对话文本的关键词，对TF-IDF提取的关键词取选取得分前20的关键词作为目标关键词，然后对每段对话内容按照句子进行拆分，通过目标关键词来提取关键句子，如果句子中存在第四预设数量(例如，3)的关键词，例如，某个句子中包含了3个目标关键词，则将这个句子作为目标对话信息的句子。

进一步地，所述将该句子作为目标对话信息中的句子之后，所述方法还包括：

判断目标对话信息中是否存在句子序列长度超过预设长度的句子，若存在，对该句子执行截断操作。

由于对话信息远远超过了BERT预训练模型的512要求的token长度，当目标对话信息的句子长度超过预设长度时，可以对该句子执行截断处理。

步骤S40：接收预设终端基于所述多个诊断结果选取的目标诊断结果，将所述目标诊断结果、所述问诊信息、所述科室信息及所述目标对话信息输入药品推荐模型，得到药品推荐结果，将所述目标诊断结果和药品推荐结果反馈至所述用户。

在本实施例中，接收预设终端根据多个诊断结果选取的目标诊断结果后，将目标诊断结果、问诊信息、科室信息及目标对话信息向量化拼接处理后得到特征序列输入药品推荐模型得到药品推荐结果，其中，药品推荐模型是BERT多标签多分类模型、FP-Tree关联规则模型、朴素贝叶斯模型的组合模型。

BERT多标签多分类模型得到多个候选药品，利用FP-Tree关联规则模型计算得到多个药品组合，利用朴素贝叶斯模型计算各个药品组合中各个药品的概率，将各个药品组合中各个药品的概率相乘后的值作为该药品组合的目标概率，基于目标概率对各个药品组合进行排序，选取目标概率最大的药品组合作为所述药品推荐结果。

每个模型分别有着不同的优势，BERT模型可以重点关注于该药品是否适合该病人，即可以提供一系列候选药品清单，FP-Tree关联规则模型可以通过从频数方面去计算得到哪些药品适合放在一起组合，朴素贝叶斯从先验概率和后验概率入手，可以把药品组合按照一定的概率进行组合，由于本地数据库中存储有大量相关数据，因此可以按照线上数据的先验概率以及后验概率，计算每个药品在药品组合中的条件概率，再按照朴素贝叶斯的独立假设，所有每个药品在药品组合中的概率累乘，便可以计算该药品组合的概率。不仅仅靠频数这种绝对数值来评判药品组合，使得综合模型效果具有一定的鲁棒性。

参照图2所示，为本发明基于文本识别的问诊装置100的功能模块示意图。

本发明所述基于文本识别的问诊装置100可以安装于电子设备中。根据实现的功能，所述基于文本识别的问诊装置100可以包括获取模块110、匹配模块120、诊断模块130及反馈模块140。本发所述模块也可以称之为单元，是指一种能够被电子设备处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。

在本实施例中，关于各模块/单元的功能如下：

获取模块110，用于获取用户输入的问诊信息，从所述问诊信息中提取关键信息，基于所述关键信息为所述用户分配科室信息。

在一个实施例中，所述从所述问诊信息中提取关键信息，包括：

在一个实施例中，所述基于所述关键信息为所述用户分配科室信息，包括：

匹配模块120，用于将所述关键信息及所述科室信息输入模板匹配模型中得到多个初始匹配模板，从所述多个初始匹配模板中选取出目标模板信息并反馈至所述用户。

在一个实施例中，所述从所述多个初始匹配模板中选取出目标模板信息，包括：

可以将多个初始匹配模板中各模板的概率由大到小进行排序，选取排序前6的模板作为候选匹配模板。

进一步地，所述基于预设选取规则从所述候选匹配模板中选取出目标模板，包括：

诊断模块130，用于接收所述用户基于所述目标模板信息反馈的初始对话信息，从所述初始对话信息中选取出目标对话信息，将所述问诊信息、所述科室信息、所述目标模板信息及所述目标对话信息输入预先训练的问诊辅助模型得到多个初始诊断结果并反馈至预设终端。

在一个实施例中，所述从所述初始对话信息中选取出目标对话信息，包括：

将所述初始对话信息转换成对话文本，基于TF-IDF算法提取出对话文本的关键词，并选取出第三预设数量的关键词作为目标关键词；

进一步地，诊断模块还用于：

判断目标对话信息中是否存在句子序列长度超过预设长度的句子，若存在，对该句子执行截断操作。

由于对话信息远远超过了BERT预训练模型的512要求的token长度，当目标对话信息的句子长度超过预设长度时，可以对该句子执行截断处理。

反馈模块140，用于接收预设终端基于所述多个诊断结果选取的目标诊断结果，将所述目标诊断结果、所述问诊信息、所述科室信息及所述目标对话信息输入药品推荐模型，得到药品推荐结果，将所述目标诊断结果和药品推荐结果反馈至所述用户。

参照图3所示，为本发明电子设备1较佳实施例的示意图。

该电子设备1包括但不限于：存储器11、处理器12、显示器13及网络接口14。所述电子设备1通过网络接口14连接网络，获取原始数据。其中，所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobilecommunication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi、通话网络等无线或有线网络。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器11可以是所述电子设备1的内部存储单元，例如该电子设备1的硬盘或内存。在另一些实施例中，所述存储器11也可以是所述电子设备1的外部存储设备，例如该电子设备1配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储设备。本实施例中，存储器11通常用于存储安装于所述电子设备1的操作系统和各类应用软件，例如基于文本识别的问诊程序10的程序代码等。此外，存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作，例如执行数据交互或者通信相关的控制和处理等。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行基于文本识别的问诊程序10的程序代码等。

显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-EmittingDiode，OLED)触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面，例如显示数据统计的结果。

网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口)，该网络接口14通常用于在所述电子设备1与其它电子设备之间建立通信连接。

图3仅示出了具有组件11-14以及基于文本识别的问诊程序10的电子设备1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，所述电子设备1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode，OLED)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

该电子设备1还可以包括射频(Radio Frequency，RF)电路、传感器和音频电路等等，在此不再赘述。

在上述实施例中，处理器12执行存储器11中存储的基于文本识别的问诊程序10时可以实现如下步骤：

获取用户输入的问诊信息，从所述问诊信息中提取关键信息，基于所述关键信息为所述用户分配科室信息；

将所述关键信息及所述科室信息输入模板匹配模型中得到多个初始匹配模板，从所述多个初始匹配模板中选取出目标模板信息并反馈至所述用户；

所述存储设备可以为电子设备1的存储器11，也可以为与电子设备1通讯连接的其它存储设备。

关于上述步骤的详细介绍，请参照上述图2关于基于文本识别的问诊装置100实施例的功能模块图以及图1关于基于文本识别的问诊方法实施例的流程图的说明。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性的，也可以是易失性的。该计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储数据区和存储程序区，存储数据区存储根据区块链节点的使用所创建的数据，存储程序区存储有基于文本识别的问诊程序10，所述基于文本识别的问诊程序10被处理器执行时实现如下操作：

获取用户输入的问诊信息，从所述问诊信息中提取关键信息，基于所述关键信息为所述用户分配科室信息；

将所述关键信息及所述科室信息输入模板匹配模型中得到多个初始匹配模板，从所述多个初始匹配模板中选取出目标模板信息并反馈至所述用户；

本发明之计算机可读存储介质的具体实施方式与上述基于文本识别的问诊方法的具体实施方式大致相同，在此不再赘述。

在另一个实施例中，本发明所提供的基于文本识别的问诊方法，为进一步保证上述所有出现的数据的私密和安全性，上述所有数据还可以存储于一区块链的节点中。例如问诊信息及目标对话信息等，这些数据均可存储在区块链节点中。

需要说明的是，本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，电子装置，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：方亮;傅航聪;
专利申请人：康键信息技术(深圳)有限公司;

上一篇：假脸检测方法、装置、电子设备及计算机可读存储介质
下一篇：一种脉冲回波超声和机械阻抗集成检测方法及装置