掌桥专利:专业的专利平台
掌桥专利
首页

基于高光谱成像的机器学习细胞分类方法及装置

文献发布时间:2023-06-19 11:42:32


基于高光谱成像的机器学习细胞分类方法及装置

技术领域

本发明属于细胞分析和医学图像处理领域,具体涉及一种基于高光谱成像的机器学习细胞分类方法及装置。

背景技术

根据基因和表型的差异,细胞可以被分为不同的类型。准确区分不同类型的细胞,尤其是在单细胞水平进行细胞的分类,在生命科学研究、医学诊断等诸多领域有重要应用。

现有的单细胞分类技术通常基于基因表达谱,比如各种单细胞测序技术。然而,很多研究和医学诊断事实上要求不仅关注细胞类型,还需要对细胞表型这一更加动态的概念进行分类,而捕捉细胞瞬时的分子状态变得更加重要。因此,各种新的技术被开发出来,在基因组、转录组、蛋白质组或代谢组水平上测量单细胞的特性,有针对性地提供细胞在与微环境相互作用下的分子变化。但在这种场景下,寻找一种高速、高精度的活体单细胞分类技术成为亟待解决的问题。

现有技术中针对细胞分类,大多是依据细胞的二维图像信息进行分类的,如申请公布号为CN108376400A的专利申请公开的一种骨髓细胞自动分类方法,再如申请公布号为CN109360198A的专利申请公开的一种基于深度学习的骨髓细胞分类方法及分类装置。这种基于二维图像信息的细胞分类方法分类准确度不够准确。

发明内容

鉴于上述,本发明的目的是提供一种基于高光谱成像的机器学习细胞分类方法及装置,通过高光谱成像获得包含化学信息和二维图像信息的细胞高光谱图像,基于细胞高光谱图像进行细胞分类,实现自动高速、高精度活体单细胞的分类。

为实现上述发明目的,本发明提供以下技术方案:

第一方面,一种基于高光谱成像的机器学习细胞分类方法,包括以下步骤:

对细胞进行高光谱成像,获得尺寸为S×M×N的三维细胞高光谱图像,其中,S表示不同波数,每个波数对应的大小为M×N的二维图像,二维图像中每一个像素的强度表示对应波数下的信号强度,每个像素在不同波数下的信号强度组合能反映像素对应物质的化学特性;

对细胞高光谱图像进行预处理和细胞分割后,获取细胞图像块;

利用机器学习模型对细胞图像块进行分类,获得细胞分类结果。

优选地,对细胞进行高光谱成像时,采用可见光光谱,近红外光谱,拉曼光谱,受激拉曼光谱,相干拉曼光谱,相干反斯托克斯拉曼光谱,相干斯托克斯拉曼光谱,瞬态吸收光谱,受激发射光谱,红外光谱或傅里叶变换红外光谱。

优选地,对细胞进行高光谱成像时,采用以下方法:

通过单点光电探测器和激光扫描或者样品扫描得到一幅二维图像;或,

通过一维阵列探测器和激光扫描或样品扫描得到一幅二维图像;或,通过二维阵列探测器和成像系统曝光得到一幅二维图像;

不同波数下的二维图像组成三维细胞高光谱图像。

优选地,所述对细胞高光谱图像进行预处理包括感兴趣区域提取和噪声滤除、二值化处理以及图像形态处理。

优选地,采用分水岭算法对预处理后的图像进行细胞分割,得到细胞图像块。

优选地,所述机器学习模型采用支持向量机。

优选地,在利用机器学习模型进行细胞图像块分类之前,需要对机器学习模型进行参数优化。

第二方面,一种基于高光谱成像的机器学习细胞分类装置,包括:

图像采集模块,用于对细胞进行高光谱成像,获得尺寸为S×M×N的三维细胞高光谱图像,其中,S表示不同波数,每个波数对应的大小为M×N的二维图像,二维图像中每一个像素的强度表示对应波数下的信号强度,每个像素在不同波数下的信号强度组合能反映像素对应物质的化学特性;

图像预处理模块,用于对对细胞高光谱图像进行预处理和细胞分割后,获取细胞图像块;

细胞分类模块,用于利用机器学习模型对细胞图像块进行分类,获得细胞分类结果。

第三方面,一种基于高光谱成像的机器学习细胞分类装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,所述计算机存储器中存有参数优化好的机器学习模型,所述计算机处理器执行所述计算机程序时实现以下步骤:

对采集的尺寸为S×M×N的细胞高光谱图像进行预处理和细胞分割后,获取细胞图像块;

利用机器学习模型对细胞图像块进行分类,获得细胞分类结果。

与现有技术相比,本发明具有的有益效果至少包括:

本发明实施例提供的基于高光谱成像的机器学习细胞分类方法及装置,对细胞进行高光谱成像,使获得的细胞高光谱图像同时包含细胞的二维形态信息和化学物成分,然后,结合细胞的化学物成分和二维心态进行细胞分类,提高了细胞分类的速度和准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。

图1是本发明实施例提供的基于高光谱成像的机器学习细胞分类方法的流程图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。

为了解决现有使用细胞测序技术难以实现的自动高速度、高精度、活体单细胞分类的问题,本发明实施例提供了一种基于高光谱成像的机器学习细胞分类方法及装置。有别于利用传统单帧细胞形态特点来进行细胞分类,本发明同时结合高光谱成像提供的化学物成分及其分布的多维度信息,通过识别三维图像中的空间信息及高光谱信息,实现快速、高准确度的单细胞分类,进一步显著提高细胞分类的准确性及效率。

图1是本发明实施例提供的基于高光谱成像的机器学习细胞分类方法的流程图。如图1所示,实施例提供的基于高光谱成像的机器学习细胞分类方法包括以下步骤:

步骤1,对细胞进行高光谱成像,获得三维细胞高光谱图像。

实施例中,对准备好的细胞样品进行高光谱成像,得到包含高维度光谱信息的细胞高光谱图像。高光谱成像作为一种新型具有化学键选择性的成像技术,其开发对细胞表型的捕捉提供了全新的思路。高光谱成像利用分子振动光谱将化学信息在传统二维图像信息上叠加另一层维度—光谱维度—而形成一种高光谱影像数据。

其中,高光谱成像时可以采用可见光光谱,近红外光谱,拉曼光谱,受激拉曼光谱,相干拉曼光谱,相干反斯托克斯拉曼光谱,相干斯托克斯拉曼光谱,瞬态吸收光谱,受激发射光谱,红外光谱,傅里叶变换红外光谱。

对细胞进行高光谱成像时,可以采用以下方法:(a)通过单点光电探测器和激光扫描或者样品扫描得到一幅二维图像;(b)通过一维阵列探测器和激光扫描或样品扫描得到一幅二维图像;(c)通过二维阵列探测器和成像系统曝光得到一幅二维图像;不同波数下的二维图像组成三维细胞高光谱图像。

方式(a)可以理解为:通过只有一个像素的单点光探测器(如光电二极管)进行探测,为了实现二维探测,要么对光源进行扫描,即将照明光束在XY平面运动以有机会覆盖整个样本,要么扫描样品,即将待观测样品在XY平面运动。

实施例中,使用受激拉曼散射高光谱成像装置得到待测细胞的高光谱图像,装置包括一个频率为ω

获得尺寸为S×M×N的三维细胞高光谱图像,其中,S表示不同波数,每个波数对应的大小为M×N的二维图像,二维图像中每一个像素的强度表示对应波数下的信号强度,每个像素在不同波数下的信号强度组合能反映像素对应物质的化学特性,化学特性是用于细胞分类的关键因素。

步骤2,对细胞高光谱图像进行预处理和细胞分割后,获取细胞图像块。

由于三维细胞高光谱图像包含了细胞的化学物信息,同时可能还包含对细胞分类信息获取不利的复杂信息成分,如系统噪音等。因此,如何处理增加的化学物信息维度,以服务单细胞分类任务是当前技术的一大挑战。为了解决这个问题,需要对细胞高光谱图像预处理,预处理包括感兴趣区域(ROI)提取和噪声滤除、二值化处理以及图像形态处理等中的至少一者,且预处理顺序可以调整。

其中,可以采用平均滤波器进行噪声滤除来提高图像质量。具体地,采用大小为mx n的过滤器(filter)过滤图像,

其中x=0,1,2....,M-1,y=0,1,2.,N-1,a=(m-1)/2,b=(n-1)/2。

二值化处理是将灰度图转换为二值图像,在一个实施例中,由于样本中不同区域的灰度强度不同,必须使用自适应阈值方法来获得足够的信息,而不是使用固定的阈值,优选地选择了Otsu的二值化方法。

形态图像处理涉及到二元侵蚀、扩张、打开、关闭和重建(binary erosion,dilation,opening,closing and reconstruction)。侵蚀的作用是"缩小"和"减薄"图像中的物体,而扩张用于"增长"和"增厚"图像中的物体。其次,形态开场(morphologicalopening)是侵蚀与扩张的结合过程,而形态闭场(morphological closing)则是利用扩张的概念,继续侵蚀。换句话说,形态开场的功能是将不包含结构元素的连接或对象去除、打破、缩小。相反,形态闭合的功能是连接、填充和建立图像中的连接和对象。形态学处理将不断应用形态开场和形态闭合,实现理想的图像。

获得的单幅高光谱图像包含多个可能是来自不同种类的细胞,要先对其进行识别。因此,对细胞高光谱图像进行预处理后,需要对图像前景和背景区分,即对于图片中的每个像素区分是属于前景(细胞)还是属于背景,实现细胞分割,获得细胞图像块,每个细胞图像块作为一个样本。实施例中,采用分水岭算法(watershed algorithm)进行细胞分割,具体过程为:

(a)找到图像中的局部最小值。每一个最小值都指定一个唯一的标记;(b)依次扫描优先级队列,从变量h的小值到大值。然后,从第一个非空队列中选择元素。如果优先级队列的所有队列都是空的,则算法终止。(c)选中的元素从队列中移除,它的标记将传递给在所有未标记的邻居。(d)将上一步标记的所有邻居放入优先级队列中,然后回到步骤(a)。

步骤3,利用机器学习模型对细胞图像块进行分类,获得细胞分类结果。

完成处理后,利用每一个细胞内的信号进行细胞分类。传统中,对于单细胞种类的分析方法主要通过相量分析或者聚类方法判断出图像中的成分,再通过人来根据不同物质的位置特征来进行判断单细胞的种类,本发明采用机器学习的方法,通过训练让算法能够自动进行细胞分类,提高效率也提高了分类准确性。使用机器学习方法进行细胞分类的方法包括机器学习模型的训练和应用预测。

本实施例中,机器学习模型采用支持向量机(SVM),利用参数优化后的支持向量机实现对细胞图像块的细胞分类。

在对支持向量机进行参数优化时,需要给定一个已经标注的数据集作为训练集。(x

在非线性问题中,核函数可以用来给原始数据增加额外的维度,从而使其在产生的高维空间中成为线性问题。它的定义是:K(x,y)=。这里K是核函数,x,y是n维输入,f用于将输入从n维空间映射到m维空间。表示点积。通过核函数,可以计算高维空间中两个数据点之间的标量积,而不需要明确计算从输入空间到高维空间的映射。在一个实施例中,采用RBF作为核函数,定义如下:K

训练时,将预先标记的训练样本先输入算法进行学习,训练样本可以来自于先前实验所得的样本,也可以来自于在单次实验过程中获得的部分先前数据,例如,在步骤1中所得到的高光谱图像,预先标记图像中的部分但非所有细胞。标记操作指给出细胞和背景分割的区域和细胞的种类。

实施例中,选择支持向量机,不需要太多含标记的样本。典型神经网络需要大量样本训练才能得到合理结果,而支持向量机则摆脱了这一难题。

预测时,将分割获得的细胞图像块输入至参数优化好的机器学习模型中,经计算获得细胞分类结果。

实施例提供的基于高光谱成像的机器学习细胞分类方法,对细胞进行高光谱成像,使获得的细胞高光谱图像同时包含细胞的二维形态信息和化学物成分,然后,结合细胞的化学物成分和二维心态进行细胞分类,提高了细胞分类的速度和准确度。

实施例还提供了一种基于高光谱成像的机器学习细胞分类装置,包括:

图像采集模块,用于对细胞进行高光谱成像,获得尺寸为S×M×N的三维细胞高光谱图像,其中,S表示不同波数,每个波数对应的大小为M×N的二维图像,二维图像中每一个像素的强度表示对应波数下的信号强度,每个像素在不同波数下的信号强度组合能反映像素对应物质的化学特性;

图像预处理模块,用于对对细胞高光谱图像进行预处理和细胞分割后,获取细胞图像块;

细胞分类模块,用于利用机器学习模型对细胞图像块进行分类,获得细胞分类结果。

需要说明的是,上述实施例提供的基于高光谱成像的机器学习细胞分类装置在进行细胞分类时,应以上述各功能模块的划分进行举例说明,可以根据需要将上述功能分配由不同的功能模块完成,即在终端或服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于高光谱成像的机器学习细胞分类装置与基于高光谱成像的机器学习细胞分类方法实施例属于同一构思,其具体实现过程详见基于高光谱成像的机器学习细胞分类方法实施例,这里不再赘述。

实施例还提供了一种基于高光谱成像的机器学习细胞分类装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,所述计算机存储器中存有参数优化好的机器学习模型,所述计算机处理器执行所述计算机程序时实现以下步骤:

对采集的尺寸为S×M×N的细胞高光谱图像进行预处理和细胞分割后,获取细胞图像块;

利用机器学习模型对细胞图像块进行分类,获得细胞分类结果。

实际应用中,计算机存储器可以为在近端的易失性存储器,如RAM,还可以是非易失性存储器,如ROM,FLASH,软盘,机械硬盘等,还可以是远端的存储云。计算机处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)、或现场可编程门阵列(FPGA),即可以通过这些处理器实现基于高光谱成像的机器学习细胞分类方法换步骤。

以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

相关技术
  • 基于高光谱成像的机器学习细胞分类方法及装置
  • 基于机器学习和高光谱成像的多种类柑橘病叶识别方法及系统
技术分类

06120113022595