掌桥专利:专业的专利平台
掌桥专利
首页

一种结合序列生成和层级词表的医学概念自动编码方法

文献发布时间:2023-06-19 11:35:49


一种结合序列生成和层级词表的医学概念自动编码方法

技术领域

本发明涉及医学概念编码领域,尤其涉及的是一种结合序列生成和层级词表的医学概念自动编码方法。

背景技术

医学概念自动编码是医疗信息处理领域的一个重要研究方向。在医疗信息系统中,同一标准医学术语可能有多种不同的医学概念表达方式,这种表述方式的不统一和不准确现象严重阻碍了医疗大数据的整合、共享和利用,给医疗领域的临床、教学和科研带来了诸多不便。医学编码是一种数字和字母标签系统,它能够为每个诊断,症状或者症状组合等提供独特且统一的编码表示。目前医疗机构需要采用人工编码的方式将临床医疗文本中的医学概念手动映射为标准医学术语编码,而人工编码需要大量具有医学知识的专业人员进行操作,成本高昂,效率有限并且准确性不高。

因此,现有技术还有待改进和发展。

发明内容

本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种结合序列生成和层级词表的医学概念自动编码方法及装置,旨在解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为标准医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。

本发明解决问题所采用的技术方案如下:

第一方面,本发明实施例提供一种结合序列生成和层级词表的医学概念自动编码方法,其中,所述方法包括:

获取临床医疗文本,将所述临床医疗文本输入预设的编码器中,得到所述临床医疗文本的初始向量数据;

获取预先构建的层级词表数据,将所述层级词表数据输入预设的学习算法中,并获得所述层级词表的标准医学术语向量数据;

将所述临床医疗文本的初始向量数据和已经生成的所述标准医学术语向量数据输入预设的解码器中,依次生成若干个标准医学术语对应的编码数据,并根据所述编码数据形成所述临床医疗文本对应的编码数据。

在一种实施方式中,所述获取临床医疗文本,将所述临床医疗文本输入预设的编码器中,得到所述临床医疗文本的初始向量数据包括:

将临床医疗文本输入词嵌入层,通过所述词嵌入层对所述临床医疗文本进行映射后得到映射数据;

将所述映射数据输入到编码器,获取所述编码器基于所述映射数据编码生成的初始向量数据。

在一种实施方式中,所述获取预先构建的层级词表数据,将所述层级词典数据输入预设的学习算法中,并获得所述层级词表的标准医学术语向量数据包括:

获取术语词典数据中的标准医学术语数据的编码信息,根据所述编码信息将所述标准医学术语数据分为父节点和子节点;

获取所述父节点、所述子节点以及所述父节点与所述子节点之间的父子关系信息,根据所述父节点、所述子节点以及所述父节点与所述子节点之间的父子关系信息构建层级词表数据;

将所述层级词表数据输入预设的学习算法中,得到表示所述父节点、所述子节点以及所述父子关系信息的向量数据;

将表示所述父节点、所述子节点以及所述父子关系信息的向量数据作为所述层级词表的标准医学术语向量数据。

在一种实施方式中,所述编码信息包含字母段信息和数字段信息。

在一种实施方式中,所述获取术语词典数据中的标准医学术语数据的编码信息,根据所述编码信息将所述标准医学术语数据分为父节点和子节点包括:

将每一个标准医学术语数据作为一个节点;

将所有字母段信息的种类相同,且所述数字段信息预设顺序位之前的若干个数字相同的节点作为同一类节点;

在所述同一类节点中,将所述数字段信息最短的节点作为父节点,将除所述父节点之外的节点作为子节点。

在一种实施方式中,所述解码器内包含有分类器,所述分类器中包含多个标准医学术语的标签,所述将所述临床医疗文本的初始向量数据和已经生成的所述标准医学术语向量数据输入预设的解码器中,依次生成若干个标准医学术语对应的编码数据,并根据所述编码数据形成所述临床医疗文本对应的标准医学术语序列数据包括:

获取由所述解码器输出的所有历史标准医学术语向量数据组成的序列数据;所述序列数据为当前时间步之前所述解码器输出的编码对应的标准医学术语向量数据;

通过所述分类器基于所述初始向量数据和所述序列数据,确定在所述临床医疗文本对应的当前时间步时,所述解码器输出的编码数据;重复这一过程,直到没有编码数据可以生成为止;

根据所述编码数据形成所述临床医疗文本对应的标准医学术语序列数据。

在一种实施方式中,所述分类器中包括概率函数,所述通过所述分类器基于所述初始向量数据和所述序列数据,确定在所述临床医疗文本对应的当前时间步时,所述解码器输出的编码数据;

将所述初始向量数据与所述序列数据对应的向量数据进行融合,得到融合向量数据;

将所述融合向量数据输入所述概率函数中,获取所述概率函数基于所述融合向量数据生成的若干个可能的编码数据的概率值;

将所述概率值按照数值大小进行排序,并将概率值最大的编码数据作为当前时刻解码器输出的编码数据。

第二方面,本发明实施例还提供一种结合序列生成和层级词表的医学概念自动编码装置,其中,所述装置包括:

获取模块,用于获取临床医疗文本,将所述临床医疗文本输入预设的编码器中,得到所述临床医疗文本的初始向量数据;

学习模块,用于获取预先构建的层级词表数据,将所述层级词表数据输入预设的学习算法中,并获得所述层级词表的标准医学术语向量数据;

编码模块,用于将所述临床医疗文本的初始向量数据和已经生成的所述标准医学术语向量数据输入预设的解码器中,依次生成若干个标准医学术语对应的编码数据,并根据所述编码数据形成所述临床医疗文本对应的标准医学术语序列数据。

本发明的有益效果:本发明实施例通过将临床医疗文本中的医学概念编码事件转变为序列生成问题,并引入层级词表的概念来增强医疗术语之间的关系,根据所述层级词表在进行序列生成的过程中准确地确定所述临床医疗文本对应的标准医学术语并进行自动编码。解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为标准医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种结合序列生成和层级词表的医学概念自动编码方法的流程示意图。

图2是本发明实施例提供的Seq2Seq模型的框架示意图。

图3是本发明实施例提供的一种结合序列生成和层级词表的医学概念自动编码装置的模块连接图。

图4是本发明实施例提供的终端的原理框图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。

随着互联网、大数据、云计算和人工智能等信息技术的快速发展和应用普及,人类的生产生活受到了史无前例的影响。近些年来,信息技术已经逐渐运用到社会生活的方方面面。在各行各业中,信息技术已经改变了人类管理、分析和运用数据的方式,经济文化等众多领域如今都已经离不开信息技术的辅助。在这些信息技术的应用领域中,医疗是重要且具有无限潜力的领域之一。在医疗领域中,涉及到大量的信息处理。这些医疗信息具有以下特点:

1)数据量大且增长速度快;

2)共享性需求高。

而信息技术最大的优势就在于它对数据处理的效率,因此目前信息技术在医疗界的应用广泛,并由此产生了医疗信息处理这一计算机应用方向。医疗信息处理是指将计算机相关技术与医疗卫生行业需求进行有机的结合,满足医疗机构以及相关部门对医疗卫生信息的收集、整理、存储和分析等需求,提高卫生行业效率,并满足客户功能需求。医疗信息处理技术在提高医疗信息处理效率的同时,也提升了医疗信息处理的准确率,让医学信息的发展进入到新的高度。长期以来,如何利用医疗信息处理技术切实有效地提高医疗水平与推动医学发展,是相关领域学者一直在研究的热点问题之一。

医学概念自动编码是医疗信息处理领域的一个重要研究方向。临床医疗文本通常是指医务工作人员在医疗活动中形成的描述病人临床表现的文字资料,其中可能包含若干医学相关概念。在医疗信息系统中,同一标准医学术语可能有多种不同的医学概念表达方式。首先,由于医疗工作人员的记录风格可能存在差异,有时为了追求工作效率,他们记录的医疗文本中可能包含较多的同义词、缩略词、外来语或者口语表述。因此在临床医疗文本中,一种术语对应多种表达的现象较为明显。比如在中文临床医疗文本中,术语“先天性脊柱侧弯”可以表述为“先天性脊柱侧凸”,也可以表述为“先天性脊柱侧弯畸形”;在英文临床医疗文本中,“heart attack”、“MI”和“myocardial infarction”都可以代表“心肌梗塞”的含义。其次,在某些情况下,多种诊断或者症状相关的医学概念是紧密相关且易混淆的,临床医疗文本中的相同医学概念,可能由于上下文语境的不同,对应不同的标准医学术语,比如在中文临床医疗文本中,诊断相关医学概念“鼻咽瘘”根据上下文信息,可能对应标准医学术语“鼻窦瘘”,或者对应标准医学术语“咽瘘”。这种表述方式的不统一和不准确现象严重阻碍了医疗大数据的整合、共享和利用,给医疗领域的临床、教学和科研带来了诸多不便。医学编码是一种数字和字母标签系统,它为每个诊断,症状或者症状组合等提供独特的编码表示。因此,按照统一的将临床医疗文本中的医学概念规范化为标准医学术语在医疗编码系统中对应的代码,在推动医疗信息化进程中显得尤为迫切。当前部分医疗机构采用人工编码的方式将临床医疗文本中的医学概念手动映射为标准医学术语编码。在这个过程中,编码人员需要查阅临床医疗文本中的医学概念或者其他相关信息,然后按照编码指导以人工的方式给这些医学概念分配合适的标准医学术语编码。由于医疗机构每天都会产生海量的文本信息,人工编码需要大量具有医学知识的专业人员进行操作,成本高昂,效率有限并且准确性不高。

针对现有技术的上述缺陷,本发明提供了一种结合序列生成和层级词表的医学概念自动编码方法,通过将临床医疗文本中的医学概念编码事件转变为序列生成问题,并引入层级词表的概念来增强医疗术语之间的关系,根据所述层级词表在进行序列生成的过程中准确地确定所述临床医疗文本对应的标准医学术语并进行自动编码。解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为标准医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。

如图1所示,本实施例提供一种结合序列生成和层级词表的医学概念自动编码方法,所述方法包括如下步骤:

步骤S100、获取临床医疗文本,将所述临床医疗文本输入预设的编码器中,得到所述临床医疗文本的初始向量数据。

为了实现对临床医疗文本中的医学概念进行自动编码,本实施例首先需要获取进行编码的临床医疗文本。鉴于本实施例的主要目标是利用计算机相关技术自动将医学概念映射为标准医学术语对应的编码数据,因此需要对临床医疗文本进行一定处理,以使得计算机可以根据处理后的临床医疗文本进行计算。具体地,如图2所示,本实施例中主要采用的是Seq2Seq模型作为主要生成框架,所谓Seq2Seq模型指的是输出的长度不确定时采用的模型。举例说明,当机器翻译的任务中出现将一句中文翻译成英文的任务,那么翻译出的英文的长度有可能会比中文短,也有可能会比中文长,因此会出现输出的长度不确定的情况,而Seq2Seq模型刚好适用于该情况。本实施例中Seq2Seq模型包含编码器和解码器,其中编码器可以采用双向LSTM,双向LSTM负责将输入的文本数据转化成向量形式的数据,这个向量就可以看成是输入文本的语义向量。具体地,获取到临床医疗文本以后,将所述临床医疗文本输入预设的Seq2Seq模型中的编码器,所述编码器获取到所述临床医疗文本以后,会通过学习输入将所述临床医疗文本编码成向量形式,进而得到所述临床医疗文本的初始向量数据。

在一种实现方式中,所述步骤S100具体包括如下步骤:

步骤S110、将临床医疗文本输入词嵌入层,通过所述词嵌入层对所述临床医疗文本进行映射后得到映射数据;

步骤S120、将所述映射数据输入到编码器,获取所述编码器基于所述映射数据编码生成所述临床医疗文本的初始向量数据。

为了获取到所述初始向量数据,本实施例需要先将所述临床医疗文本输入词嵌入层。词嵌入层获取到所述临床医疗文本以后,会将文本中词的特征映射到较低的维度,映射完毕以后会输出映射数据,从而使得模型参数更少,训练更快。然后将所述映射数据输入到编码器中,编码器获取到所述映射数据以后,会对所述映射数据进行编码并生成初始向量数据。举例说明,本实施例中采用双向LSTM作为编码器,首先在编码器端,先将临床医疗文本

由于本实施例中采用的编码器是双向LSTM,因此需要将双向LSTM输出的两种隐藏层表示进行拼接,得到最终的隐藏层表示:

其中,

如图1所示,所述方法还包括如下步骤:

步骤S200、获取预先构建的层级词表数据,将所述层级词表数据输入预设的学习算法中,并获得所述层级词表的标准医学术语向量数据。

为了实现医学概念的自动编码过程,本实施例会需要获取预先构建的层级词表数据,所述层级词表数据实际上指的是包含各种标准医学术语之间层级关系的词表数据,由于本实施例中需要用到深度学习模型,因此还需要将所述层级词表中包含的标准医学术语转换成深度学习模型可以执行的向量格式,因此需要将所述层级词表数据输入预设的学习算法中,并获得所述层级词表的标准医学术语向量数据。

在一种实现方式中,所述步骤S200具体地包括如下步骤:

步骤S210、获取术语词典数据中的标准医学术语数据的编码信息,根据所述编码信息将所述标准医学术语数据分为父节点和子节点;

步骤S220、获取所述父节点、所述子节点以及所述父节点与所述子节点之间的父子关系信息,根据所述父节点、所述子节点以及所述父节点与所述子节点之间的父子关系信息构建层级词表数据;

步骤S230、将所述层级词表数据输入预设的学习算法中,得到表示所述父节点、所述子节点以及所述父子关系信息的向量数据;

步骤S240、将表示所述父节点、所述子节点以及所述父子关系信息的向量数据作为所述层级词表的标准医学术语向量数据。

首先,本实施例会预先构建一个层级词表。具体地,为了构建所述层级词表,本实施例需要获取术语词典数据中的标准医学术语数据的编码信息,根据所述编码信息将所述标准医学术语数据分为父节点和子节点,以确定各个标准医学术语之间的包含关系。在一种实现方法中,所述编码信息可以包含字母段信息和数字段信息,举例说明,一个标准医学术语对应的编码可以为J001。然后将每一个标准医学术语数据作为一个节点,再将所有字母段信息的种类相同,且所述数字段信息预设顺序位之前的若干个数字相同的节点作为同一类节点,然后在所述同一类节点中,将所述数字段信息最短的节点作为父节点,将除所述父节点之外的节点作为子节点。

在一种实现方式中,本实施例可以设计一种算法来确定所述父节点和子节点,并且所述父节点和所述子节点组成的结构是一种树形的层级结构,所述具体算法如下:

A.定义树中节点的数据结构,每个树节点包含两部分:编码字符串和孩子节点列表,转至步骤B;

B.初始化树的根节点,根节点对应编码为空字符串,孩子节点列表为空,转至步骤C;

C.若标准医学术语词典为空,则算法结束。否则,从标准医学术语词典中取一个(编码,术语)对,转至步骤D;

D.设置当前节点为根节点,如果当前节点的编码是所取编码的前缀(字母段信息)且二者不同,则设置跳出循环标志为假,转至步骤E,否则转至步骤H;

E.如果当前节点的孩子节点列表为空,则转至步骤G。否则,取一孩子节点,转至步骤F;

F.如果孩子节点的编码是所取编码的前缀且二者不同,设置当前节点为孩子节点,设置跳出循环标志为真,跳转至步骤F,否则转至步骤E;

G.如果跳出循环标志为真,则转至步骤C。否则,转至步骤D;

H.初始化新节点,新节点对应编码为所取编码,孩子节点为空。将此新节点加入到当前节点的孩子节点列表中,转至步骤C。

确定父节点以及子节点以后,还需要获取所述父节点、所述子节点以及所述父节点与所述子节点之间的父子关系信息,并根据所述父节点、所述子节点以及所述父子关系信息构建出层级词表数据,然后将所述层级词表数据输入预设的学习算法中,例如TransE算法,从而得到表示所述父节点、所述子节点以及所述父子关系信息的向量数据。最后将表示所述父节点、所述子节点以及所述父子关系信息的向量数据作为所述层级词表的标准医学术语向量数据。简言之,本实施例希望将标准医学术语通过低维稠密的向量进行表示,并确定各个标准医学术语向量数据之间的包含关系,从而将相似语义的标准医学术语分布在近似的、邻近的向量空间。此外,本实施例通过构建一个层级词表来确定每一个标准医学术语的从属关系或者层级关系,进而使得标准医学术语之间的层级关系更加清晰化,并能够实现更好地筛选出临床医疗文本中医学概念对应的标准医学术语,最终达到医学概念的自动编码的目的。

如图1所示,所述方法还包括如下步骤:

步骤S300、将所述临床医疗文本的初始向量数据和已经生成的所述标准医学术语向量数据输入预设的解码器中,依次生成若干个标准医学术语对应的编码数据,并根据所述编码数据形成所述临床医疗文本对应的标准医学术语序列数据。

本实施例中采用的Seq2Seq模型还包括一个解码器,在一种实现方式中,可以采用单向LSTM作为解码器。具体地,获取到临床医疗文本的初始向量数据和标准医学术语向量数据以后,需要将这两种数据输入解码器中,所述解码器获取到这两种数据以后,会依次生成多个标准医学术语对应的编码数据,根据这些编码数据就可以组成临床医疗文本对应的标准医学术语序列数据。简言之,本实施例在对临床医疗文本中的医学概念进行编码的时候不仅会参考标准医学术语之间的层级关系,还会参考多个标准医学术语生成的序列,并最终确定临床医疗文本中的医学概念对应的正确编码。

在一种实现方式中,所述解码器内包含有分类器,所述分类器中包含多个标准医学术语的标签,所述步骤S300具体包括如下步骤:

步骤S310、获取由所述解码器输出的所有历史标准医学术语向量数据组成的序列数据;所述序列数据为当前时间步之前所述解码器输出的编码对应的标准医学术语向量数据;

步骤S320、通过所述分类器基于所述初始向量数据和所述序列数据,确定在所述临床医疗文本对应的当前时间步时,所述解码器输出的编码数据;重复这一过程,直到没有编码数据可以生成为止;

步骤S330、根据所述编码数据形成所述临床医疗文本对应的标准医学术语序列数据。

为了实现对临床医疗文本内的医学概念进行自动编码,本实施例首先会获取由所述解码器输出的所有历史标准医学术语向量数据组成的序列数据,可以理解的是所述序列数据为当前时间步之前所述解码器输出的编码对应的标准医学术语向量数据。然后为了确定当前时间步,与所述临床医疗文本相似度最高的一个标准医学术语向量数据,本实施例还会将所述向量数据与所述序列数据输入分类器中,所述分类器中的分类空间实际可以看做一个标签集合,每一个标签对应一个标准医学术语。本实施例希望通过所述分类器根据所述初始向量数据和所述序列数据,确定在所述临床医疗文本对应的当前时间步时,解码器输出的编码数据。具体地,本实施例还在所述分类器中设置有一个赶驴函数,为了确定解码器当前时间步输出的编码数据,本实施例需要先将所述初始向量数据与所述序列数据对应的向量数据进行融合,得到融合向量数据。然后再将所述融合向量数据输入所述概率函数中,获取所述概率函数基于所述融合向量数据生成的若干个可能的编码数据的概率值,可以理解的是所述概率值在一定程度上可以指示每一个拼接序列数据与临床医疗文本之间的相关性或者关联程度,即本实施例中会引入注意力机制来确定临床医疗文本对应的标准医学术语。

举例说明,在解码器端,时刻

其中,计算概率时需要用到注意力机制,从而得到

其中,

然后经过分类器输出概率分布:

其中,

然后将获得的概率值按照数值大小进行排序,并将概率值最大的编码数据作为当前时刻解码器输出的编码数据。一直重复这一过程,直到没有编码数据可以生成为止。最后,根据所述编码数据形成所述临床医疗文本对应的标准医学术语序列数据,从而实现对临床医疗文本进行自动编码。

概括地讲,在现有技术中虽然存在利用机器学习的方法进行医学概念编码的技术,但是它们大都采用的是贪心搜索的策略生成编码,贪心搜索的策略在解码器端每个时间步将概率最大的标准医学术语的向量筛选出来,因此搜索空间比较局限。而本实施例实际采用的是集束搜索,即在每个时间步,考虑概率最大的前几个序列作为候选序列,并在候选序列中选择概率最大的序列作为最终的目标序列,由于本实施例中会考虑序列与临床医疗文本之间的关系,并且是将概率值最大的前几个序列作为候选序列,因此相较于贪心搜索策略,本实施例中采用的集束搜索策略的搜索空间更大,编码更加准确。

基于上述实施例,本发明还提供了一种结合序列生成和层级词表的医学概念自动编码装置,如图3所示,该装置包括:

获取模块01,用于获取临床医疗文本,将所述临床医疗文本输入预设的编码器中,并获取所述编码器基于所述临床医疗文本生成的初始向量数据;

学习模块02,用于获取预先构建的层级词表数据,将所述层级词表数据输入预设的学习算法中,并获得所述层级词表的标准医学术语向量数据;

编码模块03,用于将所述临床医疗文本的初始向量数据和已经生成的所述标准医学术语向量数据输入预设的解码器中,依次生成若干个标准医学术语对应的编码数据,并根据所述编码数据形成所述临床医疗文本对应的标准医学术语序列数据。

基于上述实施例,本发明还提供了一种终端,其原理框图可以如图4所示。该终端包括通过系统总线连接的处理器、存储器、网络接口、显示屏。其中,该终端的处理器用于提供计算和控制能力。该终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种结合序列生成和层级词表的医学概念自动编码方法。该终端的显示屏可以是液晶显示屏或者电子墨水显示屏。

本领域技术人员可以理解,图4中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的终端的限定,具体的终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一种实现方式中,所述终端的存储器中存储有一个或者一个以上的程序,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行结合序列生成和层级词表的医学概念自动编码方法的指令。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

综上所述,本发明公开了一种结合序列生成和层级词表的医学概念自动编码方法及装置,通过将临床医疗文本中的医学概念编码事件转变为序列生成问题,并引入层级词表的概念来增强医疗术语之间的关系,根据所述层级词表在进行序列生成的过程中准确地确定所述临床医疗文本对应的标准医学术语并进行自动编码。解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为标准医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。

应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

相关技术
  • 一种结合序列生成和层级词表的医学概念自动编码方法
  • 一种结合序列生成和层级词表的医学概念自动编码方法
技术分类

06120112985574