掌桥专利:专业的专利平台
掌桥专利
首页

一种基于NLP技术的伤害监测方法

文献发布时间:2023-06-29 06:30:04


一种基于NLP技术的伤害监测方法

技术领域

本发明涉及数据监测技术领域,尤其涉及一种基于NLP技术的伤害监测方法。

背景技术

NLP是指自然语言处理技术,自然语言处理是研究人和计算机交互的语言问题的一门学科,NLP将语言分解为较短的语段,以便理解语段之间的关系以及各语段怎样结合起来产生意义,NLP技术广泛应用在各领域,我们平时常用的搜索引擎、新闻推荐、智能音箱等产品,都是以NLP技术为核心的互联网和人工智能产品。

目前的伤害检测模式大都是通过医疗机构接诊医生或护士来完成,当一位伤害患者发生伤害后,前往医疗机构就诊(包括门诊和住院),诊后接诊医生或者护士根据患者受伤情况填写个人伤害监测报告卡,报告卡可以通过纸质形式报卡也可以通过报卡系统进行填报,随后医疗机构相关负责伤害监测的业务人员对卡片进行收集并对其填写信息质量进行审核和修改完善,审核完成后,报卡将上传至疾控中心相关业务科室进行进一步审核、ICD编码等,并进行数据统计分析。目前国内伤害监测大体按照如上监测技术和流程,同时,由于伤害病例数量较多,通过人工填报报卡的方式工作量较大,因此,全国的伤害监测目前仍然还只是针对部分医疗机构来开展,即哨点监测,未能全面普及。

而现有伤害检测方案中伤害病例还是以人工填报的流程在进行,工作量大效率低,事后填报还存在一定信息偏倚,同时,通过人工监测难以代表整个区域伤害真实的流行现况,无法及时地进行分析和统计。

鉴于此,本发明提供一种基于NLP技术的伤害监测方法,通过该方法能够实现伤害报卡的智能化和自动化,并通过全民健康数据平台的大数据功能,能够完成对整个区域伤害监测,从而得到最真实的伤害监测数据。

发明内容

为了解决上述问题,本发明提出一种基于NLP技术的伤害监测方法,以更加确切地解决现有技术中无法完成对整个区域伤害数据监测的问题。

本发明通过以下技术方案实现的:

本发明提出基于NLP技术的伤害检测方法,所述基于NLP技术的伤害检测方法包括以下步骤:

S1通过门诊系统来获取不同人的电子病历,并将电子病历数据进行诊断,诊断完毕后将数据通过数据交换系统进行传输至数据平台中进行储存;

S2.对现有的数据平台进行搜索,并通过数据平台进行获取有关伤害门诊、住院电子病历的结构数据和非结构数据;

S3.将结构数据和非结构数据进行形成自然语言文本数据,并对自然语言文本数据的字段进行提取重要诊疗信息并进行NLP技术进行处理,并自动生成监测报卡储存至数据平台中进行储存;

S4.通过监测报卡以及数据平台的中的数据进行统计和分析,并获得伤害数据。

进一步的,所述S3步骤中NLP技术进行处理包括将自然语言文本数据采用MLM过滤和NSP预测进行模型训练。

进一步的,所述NLP技术进行处理后还包括将自然语言文本数据进行病例筛选和质控,并获取自然语言文本数据中的伤害事件信息以及文本中伤害的严重程度。

进一步的,所述S2步骤中通过数据平台进行获取有关伤害门诊、住院电子病历的方法为通过ICD编码和诊断结果获取。

进一步的,所述伤害事件信息包括伤害部位、伤害物品、伤害类型、发生时间、发生地点、发生活动和是否故意。

进一步的,所述NSP预测包括对自然语言文本数据中的第一数据和第二数据进行预测,并将第一数据与第二数据之间产生联系。

进一步的,所述MLM过滤包括将自然语言文本数据进行区分为重要语料和非重要语料,并在对自然语言文本数据进行NSP预测时将非重要语料进行过滤。

进一步的,所述S4步骤中获得伤害数据还包括将伤害数据进行计算和分析并获取对应的监测系统。

本发明的有益效果:

(1)本发明提出的基于NLP技术的伤害检测方法可以通过NLP技术检测手段来对电子病历自然语言文本数据、人工报卡监测数据进行模型训练,训练后可以自动获取重要信息并生成监测报告卡,通过NLP技术自动生成,可以为医疗卫生系统节约大量人力资源和经费的投入。

(2)本发明提出的基于NLP技术的伤害监测方法可以解决现有伤害监测过程中因记忆不清楚或信息遗漏而导致的数据质量偏差和信息漏报,可以更清楚明了的获取伤害数据。

(3)本发明提出的基于NLP技术的伤害检测方法可以通过电子报告卡进行填写数据,解决了现有技术中心只能通过医生和护士的人工填报卡的不足,具有智能和迅速的特点。

附图说明

图1为本发明的基于NLP技术的伤害监测方法的步骤图;

图2为本发明的基于NLP技术的伤害监测方法的检测系统示意图;

图3为本发明的基于NLP技术的伤害监测方法的NLP处理流程图;

本申请为目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

为了更加清楚完整的说明本发明的技术方案,下面结合附图对本发明作进一步说明。

请参考图1-图3,本发明提出基于NLP技术的伤害检测方法包括以下步骤:

S1通过门诊系统来获取不同人的电子病历,并将电子病历数据进行诊断,诊断完毕后将数据通过数据交换系统进行传输至数据平台中进行储存;

S2.对现有的数据平台进行搜索,并通过数据平台进行获取有关伤害门诊、住院电子病历的结构数据和非结构数据;

S3.将结构数据和非结构数据进行形成自然语言文本数据,并对自然语言文本数据的字段进行提取重要诊疗信息并进行NLP技术进行处理,并自动生成监测报卡储存至数据平台中进行储存;

S4.通过监测报卡以及数据平台的中的数据进行统计和分析,并获得伤害数据。

在本实施方式中,门诊系统包括门诊接诊、下诊断及医嘱和编写电子病历,门诊接诊后进行下诊断以及医嘱,并进行编写电子病历,门诊系统编写完电子病历后,将电子病历通过医院的数据交换系统,交换至数据平台中,其中数据平台可以是一个市区区域的数据平台,也可以是一个省份的数据平台,其中平台数据中具有结构化的数据也有非结构化的数据,例如部分电子病历中现病史、个人信息、临床诊断都是分开进行记录的,部分现病史是进行一起记录的,分开记录的则为结构化数据、不分开的则为非结构化的数据,获取数据后进行将数据形成自然语言文本数据,形成自然语言文本数据后,自然语言文本数据中具有多段文字,自然语言文本数据即可以进行直接读懂的文字段,然后再将文本中重要的文字进行标注,例如一段文字中:“患者昨天在家中做饭时,不慎被沸水烫伤左手至水疱疼痛,今来我院就诊。”其中重要的信息为昨天、家中、做饭、不慎、沸水、烫伤、左手,通过区分重要文字,随后将文字进行NLP技术进行处理,处理后将数据进行生成监测报卡储存至数据平台中进行,储存监测报告卡中包括但不限于就诊时间、伤害发生时间、发生地点、发生原因等,随后将数据进行传输至数据平台系统中进行储存,随后将数据平台中所有的数据进行统计和分析,并获得伤害数据,通过该方法进行获取伤害数据,可以替代传统的只能依靠医生和护士通过人工填报报卡的方式,为医疗卫生系统节省大量的人力资源节省大量的时间,同时不需要进行投入大量经费。

在本实施例中,所述S3步骤中NLP技术进行处理包括将自然语言文本数据采用MLM过滤和NSP预测进行模型训练,所述NSP预测包括对自然语言文本数据中的第一数据和第二数据进行预测,并将第一数据与第二数据之间产生联系,所述MLM过滤包括将自然语言文本数据进行区分为重要语料和非重要语料,并在对自然语言文本数据进行NSP预测时将非重要语料进行过滤。

在具体实施时:NLP技术是基于训练语言模型的方法,本质是一种迁移学习方法,即通过在容易获取、无需人工标注的大规模文本数据基础上依靠算例进行预先训练,来获得通用的语言模型和表达形式,然后再目标自然语言处理任务上结合任务语料对预训练得到的模型进行微调,从而在各种下游自然语言处理任务中快速收敛以提升准确率,NLP技术采用的模型训练为BERT预训练模型,BERT模型是最近几年来NLP领域发展的一大里程碑,陆续衍生出了许多优化的模型,MLM过滤为在于疗伤进行过滤掉非重要信息的文字,例如“患者今天下午在外部跑步时,不小心被石头绊倒,从而导致患者出现膝盖擦伤出血的情况。”其中文字中的时、被、从而、出现、的情况均为没有重要作用的文字,NSP包括对自然语言文本数据中的第一数据和第二数据进行预测,其中第一数据为一个文字段,第二数据为另一个文字段,NSP预测可以让模型进行理解两个句子之间的联系,其中,例如“患者今天下午在外跑步时,不小心被石头绊倒。”其中第一数据为:患者今天下午在外跑步时,第二数据为不小心被石头绊倒,通过模型训练进行预测,可以得出第二数据“不小心被石头绊倒”为“患者今天下午在外跑步时”的下一句,通过NSP预测可以使自然语言文本数据中的逻辑更为清晰,同时可以让模型理解两个句子之间的联系,通过MLM过滤、NSP预测可以在获取自然语言文本数据时,获取的数据具有更清楚的逻辑,同时可以快速获取重要的数据。

在本实施例中,所述NLP技术进行处理后还包括将自然语言文本数据进行病例筛选和质控,并获取自然语言文本数据中的伤害事件信息以及文本中伤害的严重程度,所述伤害事件信息包括伤害部位、伤害物品、伤害类型、发生时间、发生地点、发生活动和是否故意。

在具体实施时:通过规则算法可以将自然语言文本数据进行筛选和质控,通过筛选和质控来获取伤害事件信息包括但不限于伤害部位、伤害物品、伤害类型、发生时间、发生地点、发生活动、是否故意,例如“患者昨天在家中做饭时,不慎被沸水烫伤左手至水疱疼痛,今来我院就诊。”中,通过NLP技术的处理,分别进行判断,伤害部位为左手,伤害物品为沸水,伤害类型为烫伤,发生时间为昨天,发生地点为家中,发生活动为做饭,是否故意为不慎,进行筛选和质控后,再通过模型算法进行伤害事件的信息抽取,将各个信息抽取并填入至监测报卡中,随后再通过模型算法对伤害的严重程度进行分级,分级后进行判断伤害的严重程度,例如“左手可见皮片状皮肤烫伤约为百分之三,二度浅烫伤,可见小水疱,部分皮肤缺失”,通过模型算法进行判断,其中二度、浅、部分,可以通过模型算法判断并识别伤害严重程度为中度,通过规则算法和模型算法进行筛选、质控、获取自然语言文本数据中的伤害事件信息以及文本中伤害的严重程度来进行生成监测报卡可以具有更快的速度,与此同时相对于人为进行填报更准确。

在本实施例中,所述S2步骤中通过数据平台进行获取有关伤害门诊、住院电子病历的方法为通过ICD编码和诊断结果获取。

在具体实施时:ICD编码是医院等医疗机构使用的统一的编码方法,它是根据疾病的病因、病理、临床表现和解剖位置等特性将疾病分门别类、同时也包含手术、诊断和治疗程序的统一代码,ICD代码使用数字和字母组合的形式来表示具体的疾病或诊断,例如E860.0表示酒精饮料中毒,ICD代码有多重用途,如报告疾病和健康状况、协助医疗报销决策、收集发病率和死亡率统计数据等,通过数据平台完成ICD编码,可以获得更高的效率。

在本实施例中,所述S4步骤中获得伤害数据还包括将伤害数据进行计算和分析并获取对应的检测系统1。

在具体实施时:检测系统1可以根据实际情况进行选择,例如本实例中,检测系统1包括伤害谱、伤害排行、伤害总数、数据综合分析、伤害具体分析等,检测系统根据数据进行绘制曲线图、占比图、统计图等,可以通过

当然,本发明还可有其它多种实施方式,基于本实施方式,本领域的普通技术人员在没有做出任何创造性劳动的前提下所获得其他实施方式,都属于本发明所保护的范围。

相关技术
  • 一种基于NB-IOT技术粮仓监测系统及方法
  • 一种基于OCT技术监测葡萄糖溶液浓度的方法
  • 基于NLP技术的文本数字水印篡改监测方法
  • 一种基于NLP技术的刑事案件证据指引方法
技术分类

06120116018715