掌桥专利:专业的专利平台
掌桥专利
首页

一种肠鸣音信号特征识别模型构建方法、装置及存储介质

文献发布时间:2024-04-18 19:59:31


一种肠鸣音信号特征识别模型构建方法、装置及存储介质

技术领域

本发明涉及肠鸣音信号技术领域,具体涉及一种肠鸣音信号特征识别模型构建方法、装置及存储介质。

背景技术

肠鸣音是一种反映人体小肠运动状态的生理声音,具有重要的临床价值,可用于监测肠道疾病,为了能够连续、长时间地监测肠鸣音,需要对肠鸣音信号进行提取、识别,并计算出与其相关的特征。

然而,肠鸣音信号具有复杂的特性,包括频率多样性和振幅的大幅度变化,在采集过程中,通常会受到来自周围环境的多种噪声干扰,如腹部肌肉活动和呼吸等,这些噪声对肠鸣音识别工作造成了困扰,使得现有的识别方案面临挑战。

现有的肠鸣音识别方法包括非线性动力学分析、时频分析和机器学习方法等,然而,这些方法在肠鸣音信号的识别准确性、对环境噪声的适应性以及多样性方面都存在一定的局限性。

发明内容

有鉴于此,本发明的目的在于提供一种肠鸣音信号特征识别模型构建方法、装置及存储介质,以解决现有技术中,对肠鸣音的识别方法中,没有考虑到来自周围环境的多种噪声干扰,如腹部肌肉活动和呼吸等导致的识别结果不够精准的问题。

根据本发明实施例的第一方面,提供一种肠鸣音信号特征识别模型构建方法,所述方法包括:

获取患者的原始肠鸣音信号,对所述原始肠鸣音信号进行预处理操作,得到多段肠鸣音信号;

对所述多段肠鸣音信号分别进行分帧加窗操作,将每段肠鸣音信号均分割为相同帧数的肠鸣音信号;

对每段肠鸣音信号中的每帧肠鸣音信号通过短时傅里叶变换得到每帧肠鸣音信号的频谱表示;

根据所述每帧肠鸣音信号的频谱表示获取每帧肠鸣音信号的对数频谱;

设置切比雪夫多项式的次数,根据所述切比雪夫多项式的次数以及每帧肠鸣音信号的对数频谱获取切比雪夫多项式的多项式表达以及权重系数;

根据所述切比雪夫多项式的多项式表达以及权重系数得到每帧肠鸣音信号的拟合频谱;

将每段肠鸣音信号中的每帧肠鸣音信号的拟合频谱按时间顺序进行排列,得到每段肠鸣音信号的对数频谱图;

搭建肠鸣音信号特征识别模型架构,将所述每段肠鸣音信号的对数频谱图作为所述肠鸣音信号特征识别模型架构的输入,以输入信号是否为肠鸣音信号作为所述肠鸣音信号特征识别模型架构的输出,对所述肠鸣音信号特征识别模型架构进行训练,直到所述肠鸣音信号特征识别模型架构收敛为止,得到肠鸣音信号特征识别模型。

优选地,

所述对所述原始肠鸣音信号进行预处理操作,得到多段肠鸣音信号包括:

对所述原始肠鸣音信号进行T秒分段,对T秒分段后的每段原始肠鸣音信号进行滤波操作,得到多段肠鸣音信号。

优选地,

所述根据所述每帧肠鸣音信号的频谱表示获取每帧肠鸣音信号的对数频谱包括:

根据所述每帧肠鸣音信号的频谱表示计算每帧肠鸣音信号频谱的模的平方,得到每帧肠鸣音信号的功率谱;

对所述每帧肠鸣音信号的功率谱取自然对数,得到每帧肠鸣音信号的对数频谱。

优选地,

所述肠鸣音信号特征识别模型架构包括特征提取模块和特征分类模块;

所述特征提取模块采用双分支结构,一个分支采用预训练好的生理声音识别模型的生理声音特征提取模块,另一个分支采用预训练好的声音识别模型的声音特征提取模块;

所述特征分类模块采用全连接层。

优选地,

所述生理声音特征提取模块用于提取输入的所述每段肠鸣音信号的对数频谱图中的生理声音特征向量;

所述声音特征提取模块用于提取输入的所述每段肠鸣音信号的对数频谱图中的声音特征向量;

将所述生理声音特征向量转换为一维生理声音特征向量,将所述声音特征向量转换为一维声音特征向量;

将所述一维生理声音特征向量以及一维声音特征向量进行拼接,得到一维目标特征向量,将所述一维目标特征向量输入到所述全连接层中。

优选地,

所述对所述肠鸣音信号特征识别模型架构进行训练包括:

将预训练好的生理声音识别模型的生理声音特征提取模块,以及预训练好的声音识别模型的声音特征提取模块的参数,作为所述肠鸣音信号特征识别模型架构的特征提取模块的初始权重并加载,并保持所述生理声音特征提取模块以及声音特征提取模块中的所有参数在训练过程中始终不变,通过所述每段肠鸣音信号的对数频谱图对所述肠鸣音信号特征识别模型架构的全连接层进行训练。

根据本发明实施例的第二方面,提供一种肠鸣音信号特征识别模型构建装置,所述装置包括:

数据获取模块:用于获取患者的原始肠鸣音信号,对所述原始肠鸣音信号进行预处理操作,得到多段肠鸣音信号;

分帧模块:用于对所述多段肠鸣音信号分别进行分帧加窗操作,将每段肠鸣音信号均分割为相同帧数的肠鸣音信号;

频谱表示获取模块:用于对每段肠鸣音信号中的每帧肠鸣音信号通过短时傅里叶变换得到每帧肠鸣音信号的频谱表示;

对数频谱获取模块:用于根据所述每帧肠鸣音信号的频谱表示获取每帧肠鸣音信号的对数频谱;

切比雪夫多项式获取模块:用于设置切比雪夫多项式的次数,根据所述切比雪夫多项式的次数以及每帧肠鸣音信号的对数频谱获取切比雪夫多项式的多项式表达以及权重系数;

拟合频谱获取模块:用于根据所述切比雪夫多项式的多项式表达以及权重系数得到每帧肠鸣音信号的拟合频谱;

对数频谱图获取模块:用于将每段肠鸣音信号中的每帧肠鸣音信号的拟合频谱按时间顺序进行排列,得到每段肠鸣音信号的对数频谱图;

模型获取模块:用于搭建肠鸣音信号特征识别模型架构,将所述每段肠鸣音信号的对数频谱图作为所述肠鸣音信号特征识别模型架构的输入,以输入信号是否为肠鸣音信号作为所述肠鸣音信号特征识别模型架构的输出,对所述肠鸣音信号特征识别模型架构进行训练,直到所述肠鸣音信号特征识别模型架构收敛为止,得到肠鸣音信号特征识别模型。

根据本发明实施例的第三方面,提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被主控器执行时,实现上述的方法中的各个步骤。

本发明的实施例提供的技术方案可以包括以下有益效果:

本申请通过切比雪夫多项式对肠鸣音信号的声学特征进行逼近拟合,有效地捕捉信号的细节特征,降低了噪声对频谱拟合的影响,在此基础上,通过结合训练好的生理声音识别模型和训练好的声音识别模型,利用了生理声音的相似性,即生理声音预训练模型和一般声音预训练模型,能够从不同角度捕捉和理解肠鸣音信号,提高了识别的鲁棒性,最终得到的肠鸣音识别模型在处理具有不同特征和多样性的肠鸣音信号时具有较好的泛化性能和较强的鲁棒性能,同时能够有效的降低噪音的干扰,提高识别的精准度。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种肠鸣音信号特征识别模型构建方法的流程示意图;

图2是根据另一示例性实施例示出的一种肠鸣音信号特征识别模型构建装置的系统示意图;

附图中:1-数据获取模块,2-分帧模块,3-频谱表示获取模块,4-对数频谱获取模块,5-切比雪夫多项式获取模块,6-拟合频谱获取模块,7-对数频谱图获取模块,8-模型获取模块。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

实施例一

图1是根据一示例性实施例示出的一种肠鸣音信号特征识别模型构建方法的流程示意图,所述方法包括:

S1,获取患者的原始肠鸣音信号,对所述原始肠鸣音信号进行预处理操作,得到多段肠鸣音信号;

S2,对所述多段肠鸣音信号分别进行分帧加窗操作,将每段肠鸣音信号均分割为相同帧数的肠鸣音信号;

S3,对每段肠鸣音信号中的每帧肠鸣音信号通过短时傅里叶变换得到每帧肠鸣音信号的频谱表示;

S4,根据所述每帧肠鸣音信号的频谱表示获取每帧肠鸣音信号的对数频谱;

S5,设置切比雪夫多项式的次数,根据所述切比雪夫多项式的次数以及每帧肠鸣音信号的对数频谱获取切比雪夫多项式的多项式表达以及权重系数;

S6,根据所述切比雪夫多项式的多项式表达以及权重系数得到每帧肠鸣音信号的拟合频谱;

S7,将每段肠鸣音信号中的每帧肠鸣音信号的拟合频谱按时间顺序进行排列,得到每段肠鸣音信号的对数频谱图;

S8,搭建肠鸣音信号特征识别模型架构,将所述每段肠鸣音信号的对数频谱图作为所述肠鸣音信号特征识别模型架构的输入,以输入信号是否为肠鸣音信号作为所述肠鸣音信号特征识别模型架构的输出,对所述肠鸣音信号特征识别模型架构进行训练,直到所述肠鸣音信号特征识别模型架构收敛为止,得到肠鸣音信号特征识别模型;

可以理解的是,利用数字听诊器拾音头采集患者的肠鸣音信号,得到原始肠鸣音信号x(n),对采集到的原始肠鸣音信号x(n)进行T秒分段滤波操作,对每段预处理后的肠鸣音信号X

T

式中,x表示归一化后的频率,通常为

使用计算得到的权重系数a

其表示切比雪夫多项式拟合的频谱曲线,代表了每帧肠鸣音信号的对数频谱的逼近,将每帧肠鸣音信号的拟合频谱,按时间顺序进行排列,得到每段肠鸣音信号的切比雪夫多项式逼近拟合的对数频谱图Z

本申请通过切比雪夫多项式对肠鸣音信号的声学特征进行逼近拟合,有效地捕捉信号的细节特征,降低了噪声对频谱拟合的影响,在此基础上,通过结合训练好的生理声音识别模型和训练好的声音识别模型,利用了生理声音的相似性以及多模态信息,即生理声音预训练模型和一般声音预训练模型,能够从不同角度捕捉和理解肠鸣音信号,提高了识别的鲁棒性,最终得到的肠鸣音识别模型在处理具有不同特征和多样性的肠鸣音信号时具有较好的泛化性能和较强的鲁棒性能,同时能够有效的降低噪音的干扰,提高识别的精准度。

优选地,

所述对所述原始肠鸣音信号进行预处理操作,得到多段肠鸣音信号包括:

对所述原始肠鸣音信号进行T秒分段,对T秒分段后的每段原始肠鸣音信号进行滤波操作,得到多段肠鸣音信号;

可以理解的是,对采集到的原始肠鸣音信号x(n)进行T秒分段,随后对每段原始肠鸣音信号x

优选地,

所述根据所述每帧肠鸣音信号的频谱表示获取每帧肠鸣音信号的对数频谱包括:

根据所述每帧肠鸣音信号的频谱表示计算每帧肠鸣音信号频谱的模的平方,得到每帧肠鸣音信号的功率谱;

对所述每帧肠鸣音信号的功率谱取自然对数,得到每帧肠鸣音信号的对数频谱;

利用上述计算得到的每帧肠鸣音信号的频谱表示S

优选地,

所述肠鸣音信号特征识别模型架构包括特征提取模块和特征分类模块;

所述特征提取模块采用双分支结构,一个分支采用预训练好的生理声音识别模型的生理声音特征提取模块,另一个分支采用预训练好的声音识别模型的声音特征提取模块;

所述特征分类模块采用全连接层;

可以理解的是,构建的肠鸣音识别模型包括特征提取块和特征分类块,其中肠鸣音识别模型的特征提取块采用双分支结构,一个分支为训练好的生理声音识别模型的特征提取块,另一个分支为训练好的声音识别模型的特征提取块,特征分类块是用于对输入的肠鸣音信号的声学特征进行分类,特征分类块包括一个全连接层,用于肠鸣音识别的二分类任务,所述二分类任务是针对输入采集到的信号进行识别,得到该输入的信号是否为肠鸣音信号。

优选地,

所述生理声音特征提取模块用于提取输入的所述每段肠鸣音信号的对数频谱图中的生理声音特征向量;

所述声音特征提取模块用于提取输入的所述每段肠鸣音信号的对数频谱图中的声音特征向量;

将所述生理声音特征向量转换为一维生理声音特征向量,将所述声音特征向量转换为一维声音特征向量;

将所述一维生理声音特征向量以及一维声音特征向量进行拼接,得到一维目标特征向量,将所述一维目标特征向量输入到所述全连接层中;

可以理解的是,将两分支最后输出的特征向量转换为一维的特征向量,并拼接起来形成一个一维特征向量,输入进下述重新构建好的特征分类块中,实现了两个分支提取到的不同的特征信息的融合。

优选地,

所述对所述肠鸣音信号特征识别模型架构进行训练包括:

将预训练好的生理声音识别模型的生理声音特征提取模块,以及预训练好的声音识别模型的声音特征提取模块的参数,作为所述肠鸣音信号特征识别模型架构的特征提取模块的初始权重并加载,并保持所述生理声音特征提取模块以及声音特征提取模块中的所有参数在训练过程中始终不变,通过所述每段肠鸣音信号的对数频谱图对所述肠鸣音信号特征识别模型架构的全连接层进行训练;

可以理解的是,将训练好的生理声音识别模型和训练好的声音识别模型中特征提取块的参数作为肠鸣音识别模型的初始权重并加载,即保留了生理声音识别模型的特征提取块和声音识别模型特征提取块中已经学习到的特征表示(即提取到的特征信息),冻结两个特征提取块中所有参数,即特征提取块的参数设置为不更新,随机初始化肠鸣音识别模型中特征分类块的参数,将所述每段肠鸣音信号的切比雪夫多项式逼近拟合的对数频谱图Z

实施例二:

图2是根据另一示例性实施例示出的一种肠鸣音信号特征识别模型构建装置的系统示意图,所述装置包括:

数据获取模块1:用于获取患者的原始肠鸣音信号,对所述原始肠鸣音信号进行预处理操作,得到多段肠鸣音信号;

分帧模块2:用于对所述多段肠鸣音信号分别进行分帧加窗操作,将每段肠鸣音信号均分割为相同帧数的肠鸣音信号;

频谱表示获取模块3:用于对每段肠鸣音信号中的每帧肠鸣音信号通过短时傅里叶变换得到每帧肠鸣音信号的频谱表示;

对数频谱获取模块4:用于根据所述每帧肠鸣音信号的频谱表示获取每帧肠鸣音信号的对数频谱;

切比雪夫多项式获取模块5:用于设置切比雪夫多项式的次数,根据所述切比雪夫多项式的次数以及每帧肠鸣音信号的对数频谱获取切比雪夫多项式的多项式表达以及权重系数;

拟合频谱获取模块6:用于根据所述切比雪夫多项式的多项式表达以及权重系数得到每帧肠鸣音信号的拟合频谱;

对数频谱图获取模块7:用于将每段肠鸣音信号中的每帧肠鸣音信号的拟合频谱按时间顺序进行排列,得到每段肠鸣音信号的对数频谱图;

模型获取模块8:用于搭建肠鸣音信号特征识别模型架构,将所述每段肠鸣音信号的对数频谱图作为所述肠鸣音信号特征识别模型架构的输入,以输入信号是否为肠鸣音信号作为所述肠鸣音信号特征识别模型架构的输出,对所述肠鸣音信号特征识别模型架构进行训练,直到所述肠鸣音信号特征识别模型架构收敛为止,得到肠鸣音信号特征识别模型;

可以理解的是,通过数据获取模块1用于获取患者的原始肠鸣音信号,对所述原始肠鸣音信号进行预处理操作,得到多段肠鸣音信号;通过分帧模块2用于对所述多段肠鸣音信号分别进行分帧加窗操作,将每段肠鸣音信号均分割为相同帧数的肠鸣音信号;通过频谱表示获取模块3用于对每段肠鸣音信号中的每帧肠鸣音信号通过短时傅里叶变换得到每帧肠鸣音信号的频谱表示;通过对数频谱获取模块4用于根据所述每帧肠鸣音信号的频谱表示获取每帧肠鸣音信号的对数频谱;通过切比雪夫多项式获取模块5用于设置切比雪夫多项式的次数,根据所述切比雪夫多项式的次数以及每帧肠鸣音信号的对数频谱获取切比雪夫多项式的多项式表达以及权重系数;通过拟合频谱获取模块6用于根据所述切比雪夫多项式的多项式表达以及权重系数得到每帧肠鸣音信号的拟合频谱;通过对数频谱图获取模块7用于将每段肠鸣音信号中的每帧肠鸣音信号的拟合频谱按时间顺序进行排列,得到每段肠鸣音信号的对数频谱图;通过模型获取模块8用于搭建肠鸣音信号特征识别模型架构,将所述每段肠鸣音信号的对数频谱图作为所述肠鸣音信号特征识别模型架构的输入,以输入信号是否为肠鸣音信号作为所述肠鸣音信号特征识别模型架构的输出,对所述肠鸣音信号特征识别模型架构进行训练,直到所述肠鸣音信号特征识别模型架构收敛为止,得到肠鸣音信号特征识别模型;相比其他深度学习方法,首先本发明采用切比雪夫多项式对肠鸣音信号的声学特征进行逼近拟合,这样能够有效地捕捉信号的细节特征,降低了噪声对频谱拟合的影响,进一步的,切比雪夫多项式的性质能够突出频率特征,然而肠鸣音信号的频率特征包含了有关肠道的健康状况信息,通过结合训练好的生理声音识别模型和训练好的声音识别模型,利用了生理声音的相似性以及多模态信息,即生理声音预训练模型和一般声音预训练模型,能够从不同角度捕捉和理解肠鸣音信号,提高了识别的鲁棒性,对上述两个模型进行训练微调,使其适应肠鸣音信号的特定识别任务。

实施例三:

本实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被主控器执行时,实现上述方法中的各个步骤;

可以理解的是,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术分类

06120116522868