掌桥专利:专业的专利平台
掌桥专利
首页

自动染色体核型分析方法、系统和存储介质

文献发布时间:2023-06-19 10:11:51


自动染色体核型分析方法、系统和存储介质

技术领域

本发明涉及染色体处理技术领域,尤其是一种自动染色体核型分析方法、系统和存储介质。

背景技术

ISCN:International System for Human Cytogenetic Nomenclature,国际人类细胞遗传命名系统,用于规范描述人类染色体和染色体畸变时使用的条带名称、符号和缩写词术等。

染色体是遗传信息的重要载体,正常的人体细胞中包含46条染色体,该46条染色体包括22对常染色体和一对性染色体,其中,在性染色体中,女性为两条X,男性为一条X和一条Y。染色体核型分析是产前诊断、遗传疾病诊断和筛查的常用且重要的基础手段。染色体核型分析是指从细胞分裂中期的显微镜图像中分割出染色体实例,并根据ISCN规则排列成染色体核型的过程。染色体核型分析主要包括染色体分割和染色体分类排序两个阶段。染色体分割是指从显微镜图像中将染色体实例分离出来。受到染色体实例的非刚性特性的影响,在显微镜图像中经常出现染色体实例接触或者重叠在一起,从而导致核型分析过程容易出错。

发明内容

为解决上述技术问题,本发明的目的在于:提供一种自动染色体核型分析方法、系统和存储介质,其能有效提高核型分析结果的准确性。

第一方面,本发明实施例提供了:

一种自动染色体核型分析方法,包括以下步骤:

获取染色体图像;

对所述染色体图像进行全局阈值分割,得到若干张分割图像;

对所述若干张分割图像进行分类,得到第一染色体实例图像集和染色体簇图像集;

对所述染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集;

对所述第一染色体实例图像集和所述第二染色体实例图像集内的染色体实例进行类别标注;

根据标注结果进行染色体实例的排列,生成染色体核型图。

进一步地,所述对所述染色体图像进行全局阈值分割,得到若干张分割图像,包括:

对所述染色体图像进行拷贝,得到与所述染色体图像对应的染色体副本图像;

通过预先设定的灰度阈值在所述染色体副本图像上获取分割边界;

获取所述染色体图像内通过所述分割边界确定的染色体图像块的像素信息,得到若干张分割图像。

进一步地,所述对所述若干张分割图像进行分类,其具体为:

采用深度学习的图像分类模型对所述若干张分割图像进行分类。

进一步地,所述对所述若干张分割图像进行分类,得到第一染色体实例图像集和染色体簇图像集,包括:

将所述若干张分割图像的尺寸填充到预设大小;

识别尺寸填充后若干张分割图像内的染色体实例图像,将识别到的染色体实例图像保存到第一染色体实例图像集;

根据尺寸填充后若干张分割图像和第一染色体实例图像集确定染色体簇图像,将染色体簇图像保存到染色体簇图像集。

进一步地,所述对所述染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集,其具体为:

采用基于深度学习的染色体实例分割模型对所述染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集。

进一步地,所述染色体实例分割模型为预先进行训练的分割模型,所述染色体实例分割模型的训练步骤,包括:

获取训练染色体簇图像和与所述训练染色体簇图像对应的训练标注掩码;

对所述训练染色体簇图像和训练标注掩码进行数量増广,得到増广后的若干张染色体簇图像以及与所述若干张染色体簇图像对应的标注掩码;

将所述训练染色体簇图像、训练标注掩码、増广后的若干张染色体簇图像以及与所述若干张染色体簇图像对应的标注掩码作为第一训练集;

通过预先获取的第二训练集和所述第一训练集依次对分割模型进行训练。

进一步地,所述对所述第一染色体实例图像集和所述第二染色体实例图像集内的染色体实例进行类别标注,其具体为:

采用深度学习的图像分类模型对所述第一染色体实例图像集和所述第二染色体实例图像集内的染色体实例进行类别标注。

第二方面,本发明实施例提供了:

一种自动染色体核型分析系统,包括:

获取模块,用于获取染色体图像;

第一分割模块,用于对所述染色体图像进行全局阈值分割,得到若干张分割图像;

分类模块,用于对所述若干张分割图像进行分类,得到第一染色体实例图像集和染色体簇图像集;

第二分割模块,用于对所述染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集;

类别标准模块,用于对所述第一染色体实例图像集和所述第二染色体实例图像集内的染色体实例进行类别标注;

分析模块,用于根据标注结果进行染色体实例的排列,生成染色体核型图。

第三方面,本发明实施例提供了:

一种自动染色体核型分析系统,包括:

至少一个存储器,用于存储程序;

至少一个处理器,用于加载所述程序以执行所述的自动染色体核型分析方法。

第四方面,本发明实施例提供了:

一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现所述的自动染色体核型分析方法。

本发明实施例的有益效果是:本发明实施例通过对获取的染色体图像进行全局阈值分割,得到若干张分割图像,接着对若干张分割图像进行分类,得到第一染色体实例图像集和染色体簇图像集,并对染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集,对第一染色体实例图像集和第二染色体实例图像集内的染色体实例均进行类别标注,然后根据标注结果进行染色体实例的排列,生成染色体核型图,从而能有效避免接触染色体簇或重叠染色体簇对核型分析过程的影响,以有效提高核型分析结果的准确性。

附图说明

图1为本发明一种具体实施例的自动染色体核型分析方法的流程图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。

首先,对本申请出现的名词进行解释:

染色体中期细胞图像:其指通过电子显微镜拍摄的细胞中期的灰度图像。

染色体核型图:其指对染色体实例进行分割后,依据条带信息进行排序,生成核型图。

染色体实例:其指一条一条的染色体。正常的人体细胞中,包含23对染色体,其中22对常染色体,编号从1到22号,每一对染色体中,有一条遗传自母亲,有一条遗传自父亲。在一对性染色体中,女性为两条X,分别遗传自母亲和父亲,男性为一条X(遗传自母亲)和一条Y(遗传自父亲)。异常人体的细胞中,可能在某对或者某几对染色体中缺少其中一条染色体,或者多出一条染色体。

染色体核型分析:其指对染色体中期细胞图象进行分割,获取到所有染色体实例,然后再根据染色体条带信息进行排序生成染色体核型图的过程。染色体核型分析主要包括两个步骤,染色体的实例分割和染色体的分类。制约染色体的核型分析的主要障碍在与重叠和接触染色体簇的分离或分割。

染色体簇:其指有两条或者两条以上的染色体重叠、相连(接触)在一起,形成具有像素相连的簇。根据簇形成的原因,染色体簇还可以进一步细分为重叠染色体簇(Overlapping Chromosome Cluster)、接触染色体簇(也叫:相连染色体簇,TouchingChromosome Cluster)以及重叠并接触染色体簇(Overlapping&Touching ChromosomeCluster)。其中,重叠染色体簇是指两条或者两条以上的染色体实例重叠在一起;接触染色体簇是指两条或者两条以上的染色体实例相连;重叠并接触染色体簇是指三条或三条以上的染色体实例重叠和接触在一起。

参照图1,本发明实施例提供了一种自动染色体核型分析方法,本实施例可应用于服务端或者处理终端。具体地,本实施例包括以下步骤:

S1、获取染色体图像;该染色体图像可以是通过显微镜获取的细胞图像。该获取过程可以是使用Python PIL库中的Image.open()模块加载到预设的处理系统内。

S2、对染色体图像进行全局阈值分割,得到若干张分割图像;本步骤是将细胞图像分割成具有像素连接的图像块,其中,每一个图像块要么包括一个染色体实例,要么只包括一个染色体簇。

在一些实施例中,步骤S2可通过以下方式实现:

首先对染色体图像进行拷贝,得到与染色体图像对应的染色体副本图像;该拷贝为深度拷贝图像。接着通过预先设定的灰度阈值在染色体副本图像上获取分割边界;其中,预先设定的灰度阈值T可设置为225。当染色体副本上的灰度值小于阈值时,灰度值设置为0,当灰度值全部设置完成后,根据设置后的灰度值确定分割边界。然后获取染色体图像内通过分割边界确定的染色体图像块的像素信息,由获得的像素信息确定若干张分割图像。例如,使用符号I表示一个给定的染色体细胞灰度图,使用符号Ω表示全局阈值分割函数,使用T表示阈值,使用

S3、对若干张分割图像进行分类,得到第一染色体实例图像集和染色体簇图像集,并对第一染色体实例图像集内的染色体实例进行类别标注;

在本实施例中,由于步骤S2中得到的分割图像内包括染色体实例和染色体簇,两者是混合在一起的,影响后面的核型分析过程。因此,本实施例可采用深度学习的图像分类模型对若干张分割图像进行分类,其中,深度学习的图像分类模型可以为ResNet、InceptionNet或者ResNeXt。具体地,以ResNeXt-101为例,其分类过程为:

将若干张分割图像的尺寸填充到预设大小;该预设大小可以为224×224。接着识别尺寸填充后若干张分割图像内的染色体实例图像,将识别到的染色体实例图像保存到第一染色体实例图像集;然后根据尺寸填充后若干张分割图像和第一染色体实例图像集确定染色体簇图像,将染色体簇图像保存到染色体簇图像集。

具体地,本实施例分类的目标是对

S4、对染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集,并对第二染色体实例图像集内的染色体实例进行类别标注;

在一些实施例中,对染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集,其具体为:

采用基于深度学习的染色体实例分割模型对染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集。其中,染色体实例分割模型为预先进行训练的分割模型,而染色体实例分割模型的训练步骤,包括:

获取训练染色体簇图像和与训练染色体簇图像对应的训练标注掩码;

对训练染色体簇图像和训练标注掩码进行数量増广,得到増广后的若干张染色体簇图像以及与若干张染色体簇图像对应的标注掩码;

将训练染色体簇图像、训练标注掩码、増广后的若干张染色体簇图像以及与若干张染色体簇图像对应的标注掩码作为第一训练集;

通过预先获取的第二训练集和所述第一训练集依次对分割模型进行训练。该第二训练数据集可以为COCO数据集。分割模型可以为MaskR-CNN实例分割模型。本步骤的训练过程为:采用COCO数据集对分割模型进行第一训练,也叫预训练,生成第一训练权重

本实施例通过预先训练的分割模型对染色体簇进行实例分割,以提高分割结果的准确性。

本实施例完成实例分割后,再次采用深度学习的图像分类模型对第二染色体实例图像集内的染色体实例进行类别标注,从而得到所有染色体实例的类别标注信息。

S5、根据标注结果进行染色体实例的排列,生成染色体核型图。该标注结果包括所有染色体实例的类别标注信息。本步骤通过根据所有染色体实例的类别标注信息进行染色体实例排列后,生成染色体核型图,从而有效避免接触染色体簇或重叠染色体簇对核型分析过程的影响,以有效提高核型分析结果的准确性。

本发明实施例提供了一种与图1方法相对应的自动染色体核型分析系统,包括:

获取模块,用于获取染色体图像;

第一分割模块,用于对所述染色体图像进行全局阈值分割,得到若干张分割图像;

分类模块,用于对所述若干张分割图像进行分类,得到第一染色体实例图像集和染色体簇图像集;

第二分割模块,用于对所述染色体簇图像集内的染色体簇图像进行染色体实例分割,得到第二染色体实例图像集;

类别标准模块,用于对所述第一染色体实例图像集和所述第二染色体实例图像集内的染色体实例进行类别标注;

分析模块,用于根据标注结果进行染色体实例的排列,生成染色体核型图。

本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

本发明实施例提供了一种自动染色体核型分析系统,包括:

至少一个存储器,用于存储程序;

至少一个处理器,用于加载所述程序以执行图1所示方法。

本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。

本发明实施例提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现图1所示方法。

本申请实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。

以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

相关技术
  • 自动染色体核型分析方法、系统和存储介质
  • 一种血液肿瘤染色体核型自动分析方法及系统
技术分类

06120112456319