掌桥专利:专业的专利平台
掌桥专利
首页

电子病历搜索方法、系统、装置、存储介质及产品

文献发布时间:2023-06-19 19:33:46


电子病历搜索方法、系统、装置、存储介质及产品

技术领域

本申请一般涉及医疗领域,具体涉及一种电子病历搜索方法、系统、装置、存储介质及产品。

背景技术

病历是医务人员对患者疾病的发生、发展、转归,进行检查、诊断、治疗等医疗活动过程的记录。也是对采集到的资料加以归纳、整理、综合分析,按规定的格式和要求书写的患者医疗健康档案。病历既是临床实践工作的总结,又是探索疾病规律及处理医疗纠纷的法律依据,是国家的宝贵财富。病历对医疗、预防、教学、科研、医院管理等都有重要的作用。

现有技术中,电子病历的搜索存在相关度低、偏离科研主题的问题,往往需要科研人员手动删除不想要的、不太符合的病历,来形成自己的搜索结果集合。

发明内容

鉴于现有技术中的上述缺陷或不足,期望提供一种电子病历搜索方法、系统、装置、存储介质及产品。

一方面,本申请提供了一种电子病历搜索方法,包括:

获取病历数据并对所述病历数据进行预处理,所述病历数据至少包括字段数据和时间数据;

对所述预处理后的字段数据进行分类统计,同时对所述病历数据中的医疗数据进行聚类统计,基于所述字段数据分类统计结果和所述医疗数据进行聚类统计结果生成与所述病历数据对应的第一特征;

获取组合信息、实体信息、搜索信息,基于所述组合信息、实体信息、搜索信息生成第二特征;

根据搜索语句、所述时间数据、所述病历数据对应的第一特征和所述实体对应的第二特征,对搜索到的电子病历进行排序。

进一步的,获取病历数据并对所述病历数据进行预处理,所述病历数据至少包括字段数据和时间数据,还包括:

对所述病历数据中的字段数据进行归一化处理,以得到标准字段数据,其中,所述字段数据至少包括以下一种或多种,疾病,症状,检验,检查,手术,药品;

对所述病历数据中的时间数据进行标准化处理,以得到标准时间数据。

优选的,根据搜索语句、所述时间数据、所述病历数据对应的第一特征和所述实体对应的第二特征,对搜索到的电子病历进行排序之前,还包括:

对所述搜索语句进行预处理,以得到标准语句;

将所述标准语句输入至预先训练好的实体分类模型,输出疾病名称及疾病标签信息,以用于语义分析;

基于所述疾病名称及疾病标签信息,生成实体集合,所述实体至少包括分类词库和医疗词库实体。

进一步的,基于所述疾病名称及疾病标签信息,生成实体集合,所述实体至少包括分类词库和医疗词库实体,还包括:

获取所述实体集合的同义词、父子级;

基于所述实体集合及所述实体集合的同义词、父子级生成实体拓展集合。

优选的,对所述预处理后的字段数据进行分类统计,同时对所述病历数据中的医疗数据进行聚类统计,基于所述字段数据分类统计结果和所述医疗数据进行聚类统计结果生成与所述病历数据对应的第一特征,还包括:

获取字段数据统计结果和字段数据权重;

基于所述字段数据统计结果和字段数据权重生成病历数据对应的权重;

通过对所述病历数据中的医疗数据进行聚类统计,获得所述病历数据对应的权重;

基于所述字段数据的权重和病历数据对应的权重得到第一特征。

优选的,将所述标准语句输入至预先训练好的实体分类模型,输出疾病名称及疾病标签信息,以用于语义分析,还包括:

对所述标准语句进行纠错和拦截处理。

第二方面,本申请提供了一种电子病历搜索系统,所述系统包括:

预处理模块,用于获取病历数据并对所述病历数据进行预处理,所述病历数据至少包括字段数据和时间数据;

第一特征获取模块,对所述预处理后的字段数据进行分类统计,同时对所述病历数据中的医疗数据进行聚类统计,基于所述字段数据分类统计结果和所述医疗数据进行聚类统计结果生成与所述病历数据对应的第一特征;

第二特征获取模块,用于获取组合信息、实体信息、搜索信息,基于所述组合信息、实体信息、搜索信息生成第二特征;

排序模块,用于根据搜索语句、所述时间数据、所述病历数据对应的第一特征和所述实体对应的第二特征,对搜索到的电子病历进行排序。

第三方面,本申请提供了一种电子病历搜索装置,其特征在于,包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现本申请实施例中任意一项所述的电子病历搜索方法。

第四方面,本申请提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行以实现本申请实施例中任一项所述的电子病历搜索方法。

第五方面,本申请提供了一种计算机程序产品,当所述计算机程序产品中的指令由终端的处理器执行时,使得终端能够执行本申请实施例中任意一项所述的电子病历搜索方法。

综上,基于本发明的电子病历搜索方法,通过获取第一特征和第二特征对搜索进行加权从而提高搜索结果的相关性和数据质量。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本申请的实施例提供的一种电子病历搜索方法的流程图;

图2为本申请的实施例提供的转换为标准字段数据结果示意图;

图3为本申请的实施例提供的该病历数据示意图;

图4为本申请的实施例提供的字段数据权重示意图;

图5为本申请的实施例提供的实体分类模型输出结果示意图;

图6为本申请的实施例提供的实体集合扩展示意图;

图7为本申请的实施例提供的电子病历搜索系统的结构框图;

图8为本申请的实施例提供的电子病历搜索装置的结构示意图;

图9为本申请的实施例提供的转换为标准时间数据结果示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本申请可以涉及一般涉及医疗领域中,从而提升电子病历搜索的相关性,本申请以下实施例示例性阐述电子病历搜索方法。

详见图1,本申请提供了一种电子病历搜索方法,包括:

S101,获取病历数据并对所述病历数据进行预处理,所述病历数据至少包括字段数据和时间数据。

具体的,获取病历数据的信息,同时进行预处理,该预处理用于将字段数据和时间数据标准化,从而便于搜索。

在一些实施例中,获取病历数据并对所述病历数据进行预处理,所述病历数据至少包括字段数据和时间数据,还包括:

对所述病历数据中的字段数据进行归一化处理,以得到标准字段数据,其中,所述字段数据至少包括以下一种或多种,疾病,症状,检验,检查,手术,药品;

对所述病历数据中的时间数据进行标准化处理,以得到标准时间数据。

具体的,医疗中关注的六大类数据包括疾病、症状、检验、检查、手术、药品,当然这六大类别的字段权重比其他字段大,对每个文书的字段进行类别标记,并且对标记的字段进行归一化处理,得到标准字段数据,如图2所示。获取病历数据中的时间数据,即就诊时间。举例说明,当前时间数据为:2017/4/7 9:16、两年来、于2013年11月03日的形式进行表示,而进行标准化处理后,分别表示为:2019-04-07 9:16、2017-08-01 01:53:09、2013-11-03 01:53:09,如图9所示。

S102,对所述预处理后的字段数据进行分类统计,同时对所述病历数据中的医疗数据进行聚类统计,基于所述字段数据分类统计结果和所述医疗数据进行聚类统计结果生成与所述病历数据对应的第一特征。

具体的,通过该方法获取和病历数据对应的第一特征,从而在后续应用过程中有据可循。

在一些实施例中,对所述预处理后的字段数据进行分类统计,同时对所述病历数据中的医疗数据进行聚类统计,基于所述字段数据分类统计结果和所述医疗数据进行聚类统计结果生成与所述病历数据对应的第一特征,还包括:

获取字段数据统计结果和字段数据权重;

基于所述字段数据统计结果和字段数据权重生成病历数据对应的权重;

通过对所述病历数据中的医疗数据进行聚类统计,获得所述病历数据对应的权重;

基于所述字段数据的权重和病历数据对应的权重得到第一特征。

具体的,基于病历数据中的字段数据进行分类统计。举例说明,如图3所示的该病历数据,统计结果为:

病案首页:0;

首页手术:1(手术名称);

首页诊断:2(诊断名称、鉴别诊断名称);

病历诊断:2(诊断名称、鉴别诊断名称)

入院记录:19(主诉-症状、主诉-疾病、主诉-检验、主诉-检查、主诉-手术、主诉-药品、现病史-症状、现病史-疾病、现病史-检验、现病史-检查、现病史-手术、现病史-药品、既往史-症状、既往史-疾病、既往史-检验、既往史-检查、既往史-手术、既往史-药品、家族史-疾病);

首次病程记录:4(诊疗计划-疾病、诊疗计划-检验、诊疗计划-检查、诊断名称);

日常病程记录:5(疾病名称、诊疗计划-疾病、诊疗计划-检验、诊疗计划-检查、病情记录-疾病名称);

从而根据字段数据分类统计结果获得病历数据对应的权重。

同时根据字段数据统计结果计算出每个字段数据的权重,举例说明,每个字段数据的统计结果为N1、N2、N3...Nm,字段数据的权重为W1、W2、W3...Wm。Wn的计算公式如下公式所示:

Nsum = ∑Nm(m =1,2,3...m)

Wm = Nm/Nsum +1。

字段数据权重如图4所示。并基于字段数据统计结果和字段数据权重生成第一特征,第一特征=N1*W1+N2*W2+N3*W3...Nm*Wm。

具体的,首先将病历数据中的医疗数据归类分析,举例说明,分析结果如下所示:

疾病={首页诊断-诊断名称,入院记录-既往史-疾病名称,上级医师查房录-疾病名称...};

症状={入院记录-主诉-症状名称,入院记录-现病史-症状名称...};

药品={医嘱-药品名称,入院记录-现病史-药品名称...};

手术={首页手术-手术名称,手术记录-手术名称...};

检验={检验报告-检验项目名称...};

检查={检查报告-检查项目名称...};

把每一类的归一字段的值域进行聚类统计,举例说明,将疾病类别的所有归一字段的值域进行聚类统计,统计结果如下:

{冠状动脉粥样硬化性心脏病=1000,高血压=800,糖尿病=500,心肌梗死=100}

基于统计结果,每个疾病的个数/疾病总数,计算出每个疾病的权重,如下:

冠状动脉粥样硬化性心脏病=1000/(1000+800+500+100)=0.42;

高血压=800/(1000+800+500+100)=0.33;

糖尿病=500/(1000+800+500+100)=0.21;

心肌梗死=100/(1000+800+500+100)=0.04。

给每个有数据类别的字段增加一个权重字段,将字段值域提取出来,如果值域有值,则权重加1,然后与该类别的每个字段数据的统计结果进行匹配,如果能够匹配上,将疾病的对应权重加入,最后将每个字段的权重相加,总和增加到病历数据对应的权重中,以得到最终的第一特征。该第一特征为排名离线特征。

S103,获取组合信息、实体信息、搜索信息,基于所述组合信息、实体信息、搜索信息生成第二特征。

具体的,获取组合信息、实体信息、搜索信息,对组合信息和实体信息的权重进行累加,并根据搜索信息从而得到第二特征。该第二特征为排名在线特征。举例说明,对于多维度组合高级搜索输出精准的组合query,权重为(qw1...qwn)以及每个组合中的实体扩展集合,实体包括常用的六大医疗分类词库和其他医疗实体,权重为(w1...wn)。对于全文搜索,输出实体扩展集合,实体包括常用的六大医疗分类词库和其他医疗实体,权重为(w1...wn)。首先根据搜索语句中各个实体的重要性进行加权,即得到qw1+...+qwn+w1+...wn的结果,并根据搜索信息的权重(Xw)进行加权,即,第二特征=qw1+...+qwn+w1+...wn+xw从而得到第二特征。

在一些实施例中,获取组合信息、实体信息、搜索信息,基于所述组合信息、实体信息、搜索信息生成第二特征,所述搜索信息包括以下一项或多项:科室信息、领域信息、历史搜索信息。

具体的,根据科室信息、领域信息、历史搜索信息确定第二特征,可以提高搜索相关性。科室信息权重为dw、领域信息bw、历史搜索信息hw1+...hwn。xw=dw+bw+hw。

S104,根据搜索语句、所述时间数据、所述病历数据对应的第一特征和所述实体对应的第二特征,对搜索到的电子病历进行排序。

具体的,使用第一特征和第二特征作为影响因子,根据搜索语句对全文进行检索和多维度组合搜索。从而根据使用者的需求返回搜索内容,从而根据内容的时间信息和权重信息进行排序,以得到更贴合使用者的内容展示。权重越高的排名更靠前,同时根据时间信息,越旧的排名越靠后。

举例说明,首先根据搜索语句中各个实体的重要性进行加权

在一些实施例中,根据搜索语句、所述时间数据、所述病历数据对应的第一特征和所述实体对应的第二特征,对搜索到的电子病历进行排序之前,还包括:

对所述搜索语句进行预处理,以得到标准语句;

将所述标准语句输入至预先训练好的实体分类模型,输出疾病名称及疾病标签信息,以用于语义分析;

基于所述疾病名称及疾病标签信息,生成实体集合,所述实体至少包括分类词库和医疗词库实体。

具体的,首先要对搜索语句进行预处理从而方便进行解析,搜索语句分全文搜索、多维度组合高级搜索。搜索语句的预处理包括:通用解析、全文搜索解析、多维度组合高级搜索解析。通用解析为全半角转换,大小写转换,繁简体转换;无意义符号移除:移除诸如火星文符号、emoji 表情符号等特殊符号内容。全文搜索解析为对于全文搜索超过一定长度的搜索语句进行截断处理,与或非高级语法以及site、[]、\条件拼接的解析。多维度组合高级搜索解析为通配符*、[]、\等的解析。通过通用解析、全文搜索解析、多维度组合高级搜索解析后的语句为标准语句。

其次,通过训练一个实体分类模型,得到各个词向量及每个词向量对应的词性信息、标签信息,然后使用该模型进行语义分析。该语义分析用于全文搜索。举例说明,输入内容为10年前患有冠心病,最近头晕,无心悸、呼吸困难、黑曚、晕厥、上腹不适、恶心、呕吐;语义解析后,输出时间节点信息、症状信息、不伴症状信息、诊断信息,如图5所示。

从而,基于疾病名称及疾病标签信息,输出实体集合,实体包括常用的六大医疗分类词库和其他医疗实体。

在另一些实施例中,对于多维度组合高级搜索:输出精准的组合query以及每个组合中的实体集合,实体包括常用的六大医疗分类词库和其他医疗实体。对于全文搜索:输出实体集合,实体包括常用的六大医疗分类词库和其他医疗实体。

在一些实施例中,将所述标准语句输入至预先训练好的实体分类模型,输出疾病名称及疾病标签信息,以用于语义分析,还包括:

对所述标准语句进行纠错和拦截处理。

具体的,中文拼写会出现拼写错误的情况从而需要进行纠错以避免出现搜索问题。

举例说明,由于键盘输入方式和使用者与用户自身的方言、习惯以及知识的掌握程度,从而引起拼写错误的情况。对于全文搜索使用实体纠错。首先,基于字典的实体纠错。构建一个常见错误的词表(例如"心肌炎"写成"心机炎"),如果匹配到错词,则给出正确的词。其次,基于规则的实体纠错。使用编辑距离生成原词的候选词,在医疗知识图谱数据中匹配最近的候选词进行纠错。然后,基于模型的实体纠错。例如构建深度学习语言模型等。最后基于拼音的方式,获取拼音一致的正常词列表,进行纠错(例如"冠心病"(拼音为:guanxinbing)、"关心病"(拼音为:guanxinbing))。对于多维度组合高级搜索,针对搜索字段拼写错误的,基于数据模型进行校正,搜索字段对应的值,根据字段的类型进行纠错,例如:数值类型,值需要转换成数值;日期类型,值需要进行日期的标准化。

在本实施例中,还需要对标准语句中不合理的字符进行拦截,以免造成搜索引擎的崩溃,举例说明,拦截标准语句中火星文符号、emoji 表情符号等特殊符号内容;同时利用语义分析,删除标准语句中和医疗知识无关的内容。

在一些实施例中,基于所述疾病名称及疾病标签信息,生成实体集合,所述实体至少包括分类词库和医疗词库实体,还包括:

获取所述实体集合的同义词、父子级;

基于所述实体集合及所述实体集合的同义词、父子级生成实体拓展集合。

具体的,在此通过医疗知识图谱对标准语句中的医疗实体进行扩展和补充。举例说明,首先获取实体集合的同义词,并对该同义词进行扩展,从而提高搜索效率。其次对实体集合的父子级的扩展。最后,对实体集合进行扩展,通过图数据库的推理机制进行推理,如:节点(高血压)关系(症状)节点(头晕);节点(高血压1级)关系(症状)节点(头晕);从而推理出高血压和高血压1级为相似疾病,如图6所示。

综上,基于本发明的电子病历搜索方法,通过获取第一特征和第二特征对搜索进行加权从而提高搜索结果的相关性和数据质量。

进一步参考图4,其示出了根据本申请一个实施例的电子病历搜索系统200的示意图。

预处理模块210,用于获取病历数据并对所述病历数据进行预处理,所述病历数据至少包括字段数据和时间数据;

第一特征获取模块220,对所述预处理后的字段数据进行分类统计,同时对所述病历数据中的医疗数据进行聚类统计,基于所述字段数据分类统计结果和所述医疗数据进行聚类统计结果生成与所述病历数据对应的第一特征;

第二特征获取模块230,用于获取组合信息、实体信息、搜索信息,基于所述组合信息、实体信息、搜索信息生成第二特征;

排序模块240,用于根据搜索语句、所述时间数据、所述病历数据对应的第一特征和所述实体对应的第二特征,对搜索到的电子病历进行排序。

在上文详细描述中提及的若干模块或者单元,这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作指令。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连接表示的方框实际上可以基本并行地执行,他们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作指令的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其他技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

进一步参考图8,其示出了根据本申请一个实施例的电子病历搜索装置300的结构示意图。

本实施例的电子病历搜索方法的执行主体为电子病历搜索装置,电子病历搜索装置可以由软件和/或硬件的方式实现,该实施例中的电子病历搜索装置可以配置在电子设备中,也可以配置在用于对电子设备进行控制的服务器中,该服务器与电子设备进行通信进而对其进行控制。

其中,本实施例中的电子设备可以包括但不限于个人计算、平台电脑、智能手机等设备,该实施例对电子设备不作具体限定。

本实施例的电子病历搜索装置300,包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如以上任一项所述的方法。

在本申请实施例中,处理器是具有执行逻辑运算的处理器件,例如中央处理器(CPU)、现场可编程逻辑阵列(FPGA)、数字信号处理器(DSP)、单片机(MCU)、专用逻辑电路(ASIC)、图像处理器(GPU)等具有数据处理能力和/或程序执行能力的器件。容易理解,处理器通常通讯连接存储器,在存储器上存储一个或多个计算机程序产品的任意组合,存储器可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、可擦除可编程只读存储器(EPROM)、USB存储器、闪存等。在存储器上可以存储一个或多个计算机指令,处理器可以运行所述计算机指令,以实现相关的分析功能。在计算机可读存储介质中还可以存储各种应用程序和各种数据,例如应用程序使用和/或产生的各种数据等。

在本申请实施例中,各模块都可以通过处理器执行相关计算机指令实现,例如获取模块可以通过处理器执行获取的指令实现、输入模块可以通过处理器执行规则模型的指令实现、神经网络可以通过处理器执行神经网络算法的指令实现。

在本申请实施例中,各模块可以运行在同一个处理器上,也可以运行在多个处理器上;各模块可以运行在同一架构的处理器上,例如均在X86体系的处理器上运行,也可以运行在不同架构的处理器上,例如图像处理模块运行在X86体系的CPU,机器学习模块运行在GPU。各模块可以封装在一个计算机产品中,例如各模块封装在一个计算机软件并运行在一台计算机(服务器),也可以各自或部分封装在不同的计算机产品,例如图像处理模块封装在一个计算机软件中并运行在一台计算机(服务器),机器学习模块分别封装在单独的计算机软件中并运行在另一台或多台计算机(服务器);各模块执行时的计算平台可以是本地计算,也可以是云计算,还可以是本地计算与云计算构成的混合计算。

计算机系统包括中央处理单元(CPU)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储部分308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM303中,还存储有系统的操作指令所需的各种程序和数据。CPU301、ROM302以及RAM303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。

以下部件连接至I/O接口305;包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至I/O接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。

特别地,根据本申请的实施例,上文参考流程图图1描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。在该计算机程序被中央处理单元(CPU)301执行时,执行本申请的系统中限定的上述功能。

本申请实施例提供的电子设备上设置有计算机可读存储介质,其中,计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如以上任一项所述的方法。

需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以为的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

在一个实施例中,提供了一种计算机程序产品,当计算机程序产品中的指令由电子设备的处理器执行时,使得一种电子病历搜索装置能够执行以下步骤:获取病历数据并对所述病历数据进行预处理,所述病历数据至少包括字段数据和时间数据;

对所述预处理后的字段数据进行分类统计,同时对所述病历数据中的医疗数据进行聚类统计,基于所述字段数据分类统计结果和所述医疗数据进行聚类统计结果生成与所述病历数据对应的第一特征;

获取组合信息、实体信息、搜索信息,基于所述组合信息、实体信息、搜索信息生成第二特征;

根据搜索语句、所述时间数据、所述病历数据对应的第一特征和所述实体对应的第二特征,对搜索到的电子病历进行排序。

需要理解的是,术语“ 长度”、“ 宽度”、“ 上”、“ 下”、“ 前”、“ 后”、“ 左”、“ 右”、“ 竖直”、“ 水平”、“ 顶”、“ 底”“ 内”、“ 外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

此外,术语“ 第一”、“ 第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“ 第一”、“ 第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“ 多个”的含义是两个或两个以上,除非另有明确具体的限定。

除非另有定义,本文中所使用的技术和科学术语与本发明的技术领域的技术人员通常理解的含义相同。本文中使用的术语只是为了描述具体的实施目的,不是旨在限制本发明。本文中出现的诸如“设置”等术语既可以表示一个部件直接附接至另一个部件,也可以表示一个部件通过中间件附接至另一个部件。本文中在一个实施方式中描述的特征可以单独地或与其它特征结合地应用于另一个实施方式,除非该特征在该另一个实施方式中不适用或是另有说明。

本发明已经通过上述实施方式进行了说明,但应当理解的是,上述实施方式只是用于举例和说明的目的,而非意在将本发明限制于所描述的实施方式范围内。本领域技术人员可以理解的是,根据本发明的教导还可以做出更多种的变型和修改,这些变型和修改均落在本发明所要求保护的范围以内。

技术分类

06120115951037