掌桥专利:专业的专利平台
掌桥专利
首页

一种基于拉曼光谱和卷积神经网络的肿瘤检测方法

文献发布时间:2023-06-19 09:29:07


一种基于拉曼光谱和卷积神经网络的肿瘤检测方法

技术领域

本发明属于医疗数据检测技术领域,尤其是涉及一种基于拉曼光谱和卷积神经网络的肿瘤检测方法。

背景技术

临床上通常通过影像学检查确定肿瘤组织位置以指导切除手术方案的设计,如使用内窥镜、CT、核磁、X光等技术手段。然而影像学检查与切除手术之间的时间差会导致影像资料中与实际操作所见的肿瘤组织轮廓、位置、尺寸等信息的偏差。切除手术的术中通常使用对组织切片的病理活检来确定肿瘤组织是否切除完整。然而病理活检步骤繁多、分析时间较长,且术中切片活检技术的准确性和灵敏度并不可靠,为确保肿瘤组织切除完整,需要进行多次病理活检,漫长的活检时间不仅影响手术效率、更会为病人带来诸多风险。

拉曼光谱(Raman spectroscopy)分析法是一种非侵入的光谱分析方法,它基于拉曼散射效应,对与入射光频率不同的散射光谱进行分析以得到分子的振动、转动等方面信息。拉曼光谱分析法可用于观察人体组织的低频振动模式。近红外(NIR)激光会与人体组织的低频振动模式相互作用,导致非弹性散射光子的能量发生位移,从而产生与入射光频率不同的散射光谱。根据激发光波长和检测光波长的倒数之间的差异(单位:cm-1)可以测量能量位移的强度,并提供特定化学键的信息。由此产生的拉曼光谱提供了一个可以识别不同分子种类的指纹,并根据不同特征峰的强度来评估其相对浓度。拉曼光谱根据分子振动形成的光散射频率的改变来反映分子结构、基团的组成等信息,具有高灵敏度和特异性,同时拥有样本无需特殊处理、适用范围广泛、测试快捷等优点,在生物医学领域的应用前景广泛。人体组织中存在大量拉曼活性分子,且由于肿瘤组织与正常组织的生物成分比例及分子构象方面存在较大差异,使得拉曼光谱可以反映两者之间的差异,从而实现正常组织和肿瘤组织的区分。

卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(DeepLearning)的代表算法之一。卷积神经网络的研究始于二十世纪80至90年代;二十一世纪后,随着深度学习理论的提出和数值计算设备的改进,卷积神经网络得到了快速发展,并被广泛应用于计算机视觉、自然语言处理等领域。卷积神经网络仿造生物的视知觉机制建立,其隐含层内的卷积核参数共享和层间连接的稀疏性是的卷积神经网络能够以较小的计算量提取数据的格点化特征,例如在对像素和音频等数据组织形式的学习上有稳定的效果,且对数据没有额外的特征工程要求。一维卷积神经网络可以很好地识别出数据的简单模式,然后使用这些简单模式在更高级的层中生成更复杂的模式。当数据的某些特征在该数据片段的位置中不具有高度相关性时,通过一维卷积网络可以很好地从整体数据集中的较短片段获得感兴趣的特征。一维卷积网络可以很好地应用于传感器数据的时间序列分析和具有固定长度周期的信号数据的分析。

由于拉曼光谱数据是一维的周期信号数据,所以我们以一维卷积神经网络为核心,辅以残差连接模块,搭建了一个深度学习分类网络,根据特定组织的拉曼光谱计算该组织为肿瘤组织的概率,从而为肿瘤切除手术中确认肿瘤是否切除干净提供高效、高精度的指导。

发明内容

本发明所要解决的技术问题是肿瘤切除手术中对肿瘤组织切片病理活检步骤繁多、时间长、准确性一般的问题,提供一种快速、便捷、准确的基于拉曼光谱和卷积神经网络的肿瘤检测方法。为此,本发明采用以下技术方案:

一种基于拉曼光谱和卷积神经网络的肿瘤检测方法,包括以下步骤:

S1、数据集采集和构造,利用高分辨率CCD拉曼光谱检测设备对肿瘤患者的正常组织部位和肿瘤组织部位分别进行探测,以激发形成不同的拉曼光谱,对所述拉曼光谱按照8:2的比例分割为训练集和测试集;

S2、数据集标准化处理,采用z-score标准化对步骤S1所得到的训练集和测试集进行标准化处理,以将不同组织部位的拉曼光谱的强度放缩至统一尺度;

S3、数据集扩增,对步骤S2所得的训练集进行扩增,增强数据泛化性能;

S4、分类模型训练,建立以残差连接的一维卷积神经网络为基础模块的一维信号分类模型,并对步骤S3所得的训练集进行训练,调节模型参数至模型收敛并保存为最佳模型;

S5、肿瘤预测,将待预测的人体组织拉曼光谱数据输入步骤S4所得的最佳模型,输出待预测组织的取自于肿瘤组织的概率值,以该概率值判断是否为肿瘤组织。

其中,z-score标准化也叫标准差标准化,这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:

其中μ为所有样本数据的均值,σ为所有样本数据的标准差。z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。

在采用上述技术方案的基础上,本发明还可采用以下进一步的技术方案:

所述步骤S1中的探测采用拉曼光纤探针进行。

所述步骤S1还包括:根据探测位置的病理切片活检结果对拉曼光谱数据进行分类标注,若为肿瘤组织,则标注标签为1,若为正常组织,则标注标签为0。

所述步骤S3中训练集扩增采用平移、或裁剪、或加噪声、或乘算随机系数、或Mixup中的一种或多种方法进行扩增。

其中,数据扩充方法可以增加训练的数据量,提高模型的泛化能力;同时增加噪声数据,提升模型的鲁棒性。

Mixup方法是一种和数据无关的简单数据增强方法,其通过一种线性插值的方法构建心的训练样本和标签,最终对数据和标签的处理如下公式所示:

其中(x

所述步骤S4还包括:当输入是步骤S1中已标注的拉曼光谱数据,则输出为其分类标注标签。

所述步骤S5中,若所述概率值若大于0.5,则认定为待预测组织为肿瘤组织,否则则认定为待预测组织为正常组织。

所述检测方法还包括方法验证,采集手术过程中的病理切片的拉曼光谱并输入到最佳模型中,将输出的预测结果与实际病例活检结果进行比对。

与现有技术相比,本发明具有以下有益效果:

1)将以一维卷积神经网络为核心的深度学习分类网络应用到了肿瘤组织拉曼光谱的检测上面,提升了术中肿瘤组织检测的及时性和准确性;

2)可以根据该方法形成术中实时检测系统,减轻病理医生的工作负担;

3)相比于病理切片活检方法,拉曼光谱分析法不会刺激肿瘤组织部位、不需要进行穿刺采样,避免了肿瘤检测引起的癌变组织扩散或切片组织取样引起的感染等并发症问题。

附图说明

图1为本发明一种基于拉曼光谱和卷积神经网络的肿瘤检测方法的正常组织和肿瘤组织的拉曼光谱数据图。

图2为本发明一种基于拉曼光谱和卷积神经网络的肿瘤检测方法的实施例中的分类网络的基本残差模块。

图3为本发明一种基于拉曼光谱和卷积神经网络的肿瘤检测方法的实施例中的分类网络的整体结构。

具体实施方式

为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种基于拉曼光谱和卷积神经网络的肿瘤检测方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。

一种基于拉曼光谱和卷积神经网络的肿瘤检测方法,包括:

数据集采集和构造,获取大量拉曼光谱数据集,利用高分辨率CCD拉曼光谱检测设备对肿瘤患者的正常组织部位和肿瘤组织部位分别进行探测,其中,探测采用拉曼光纤探针进行,以激发形成不同的拉曼光谱,对所述拉曼光谱按照8:2的比例分割为训练集和测试集。

其中,高分辨率CCD拉曼光谱检测设备可采用Advantage 1064,该设备提供了色散型拉曼光谱中波长最长的激光源,同时它还保持了非常高的灵敏度——凭借其电子迁移InGaAs光电阴极和电子轰击CCD技术。

进一步地,根据探测位置的病理切片活检结果对拉曼光谱数据进行分类标注,若为肿瘤组织,则标注标签为1,若为正常组织,则标注标签为0。

进一步地,拉曼光谱数据输出为.txt格式。

进一步地,标注完成之后使用python的numpy软件包读入数据,采集拉曼位移从385cm-1到1545cm-1的光谱数据,保存为.npy格式文件。

数据集标准化处理,采用z-score标准化对上述数据集采集和构造所得到的训练集和测试集进行标准化处理,以将不同组织部位的拉曼光谱的强度放缩至统一尺度。

数据集扩增,对标准化处理所得的训练集进行扩增,增强数据泛化性能。其中,训练集扩增采用平移、或裁剪、或加噪声、或乘算随机系数、或Mixup中的一种或多种方法进行扩增。

分类模型训练,建立以残差连接的一维卷积神经网络为基础模块的一维信号分类模型,其中,基本模块如图2所示,整体网络结构如图3所示,并对扩增所得的训练集进行训练,调节模型参数至模型收敛并保存为最佳模型。

进一步地,当输入是数据集采集和构造中已标注的拉曼光谱数据,则输出为其分类标注标签。

使用训练集中的拉曼光谱数据训练分类网络并进行测试集的效果预测:确定损失函数为二元交叉熵损失,设置每次输入进分类网络的数据批量为128,使用Adam优化器,初始学习率为10-3,设置整体样本循环迭代次数上限为500次,每完整迭代一次训练样本,进行测试集的效果预测,保存第一次完整迭代后的效果为最佳效果,之后每经历一次完整迭代,对比保存最佳的验证效果并保存该模型,直到达到迭代次数的上限。在训练过程中,若训练集的预测损失连续10次不下降,则将学习率调整为上一次迭代的一半。

肿瘤预测,将待预测的人体组织拉曼光谱数据输入步骤S4所得的最佳模型,输出待预测组织的取自于肿瘤组织的概率值,以该概率值判断是否为肿瘤组织。其中,若所述概率值若大于0.5,则认定为待预测组织为肿瘤组织,否则则认定为待预测组织为正常组织。

方法验证,采集手术过程中的病理切片的拉曼光谱并输入到最佳模型中,将输出的预测结果与实际病例活检结果进行比对。

虽然本发明已通过参考优选的实施例进行了图示和描述,但是,本专业普通技术人员应当了解,在权利要求书的范围内,可作形式和细节上的各种各样变化。

相关技术
  • 一种基于拉曼光谱和卷积神经网络的肿瘤检测方法
  • 一种基于表面增强拉曼光谱探针的循环肿瘤细胞检测方法
技术分类

06120112184302