掌桥专利:专业的专利平台
掌桥专利
首页

一种血液肿瘤RNA测序数据自动化分析方法及装置

文献发布时间:2024-04-18 19:57:31


一种血液肿瘤RNA测序数据自动化分析方法及装置

技术领域

本发明涉及生物技术领域,尤其涉及一种血液肿瘤RNA测序数据自动化分析方法、装置、电子设备及计算机可读存储介质。

背景技术

血液肿瘤RNA测序(RNA-seq)是一种高通量测序技术,广泛应用于血液病研究领域。RNA-seq技术具备基因表达谱和差异基因分析、转录分析、基因融合检测、基因突变检测以及免疫监测等基因分析功能。

目前RNA测序数据的分析流程,可以实现对RNA测序数据的检测。针对RNA测序变异检测的软件能够完成对RNA测序变异的检测,传统的RNA测序表达谱通常采用假设检验的方法对差异基因进行检测,检测要求存在3组以上的实验组和对照组,现有RNA测序数据的分析流程对RNA测序数据分析不全面,会造成RNA测序数据资源的浪费,不同RNA测序变异检测软件对变异检测往往存在一定的偏好性,这就使得其结果的准确性存在差异。传统的RNA测序表达谱无法满足通过单个样本对差异基因进行分析,会造成差异基因分析信息的缺失。因此,当前血液肿瘤RNA测序方法存在数据资源浪费、准确性低的问题。

发明内容

本发明提供一种血液肿瘤RNA测序数据自动化分析方法、装置及计算机可读存储介质,其主要目的在于解决当前血液肿瘤RNA测序方法存在数据资源浪费、准确性低的问题。

为实现上述目的,本发明提供的一种血液肿瘤RNA测序数据自动化分析方法,包括:

获取样本测序数据,将所述样本测序数据与预构建的参考基因数据进行比对,得到初始基因比对数据,对初始基因比对数据进行过滤和碱基校正处理,得到目标基因比对数据;

对所述目标基因比对数据进行预设的变异组合检测,得到初始变异检测数据,利用预构建的基因突变数据库对所述初始变异检测数据进行注释,得到目标变异检测数据;

根据预构建的正常基因表达数据,利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据,所述离群点分析公式为:

其中,∈

利用预构建的倍体分析方法对所述目标变异检测数据和所述基因表达数据进行倍体分析得到倍体分析数据;

在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据;

利用预构建的免疫组库分析软件组对所述样本测序数据进行免疫组库分析,得到免疫分析数据;

对所述样本测序数据进行基因缺失分析,得到基因分析数据;

根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告。

可选地,所述假设检验公式,如下所示:

其中,

可选地,所述利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据,包括:

利用所述假设检验公式及预设定的拒绝域判断所述目标基因比对数据中靶向基因的基因表达量是否存在离群点;

若所述目标基因比对数据中靶向基因的基因表达量不存在离群点,则判定所述目标基因比对数据中的靶向基因为正常表达基因;

若所述目标基因比对数据中靶向基因的基因表达量存在离群点,则获取所述正常基因表达数据中基因表达量的标准差及均值;

利用预设的离群点处理公式,根据所述正常基因表达数据中基因表达量的标准差及均值计算目标基因处理数值,所述离群点处理公式为:

其中,ESD

在所述目标基因比对数据中提取目标基因处理数值大于可疑离群点参考值的靶向基因;

将所述目标基因处理数值大于可疑离群点参考值的靶向基因判定为异常表达基因;

汇总所有靶向基因的判定结果,得到所述基因表达数据。

可选地,所述对所述目标基因比对数据进行预设的变异组合检测,得到初始变异检测数据,包括:

利用预构建的Gatk4软件对目标基因比对数据进行变异检测,得到第一变异数据,利用预构建的VarScan软件对目标基因比对数据进行变异检测,得到第二变异数据,合并第一变异数据和第二变异数据,得到初始合并数据;

对初始合并数据进行过滤,得到初始变异检测数据。

可选地,所述利用预构建的免疫组库分析软件组对所述样本测序数据进行免疫组库分析,得到免疫分析数据,包括:

根据预构建的VDJtools和IgBLAST软件对所述样本测序数据进行免疫组库分析,得到免疫分析数据。

可选地,所述在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据,包括:

在所述基因比对数据筛选出染色体倒位融合位点、染色体中间缺失融合位点、染色体易位融合位点及非正常基因融合位点;

汇总所述染色体倒位融合位点、染色体中间缺失融合位点、染色体易位融合位点及非正常基因融合位点得到阳性融合位点集;

根据预设的疾病融合位点数据库过滤阳性融合位点集得到融合位点数据。

可选地,所述根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告,包括:

获取数据分析自动化模组,利用数据分析自动化模组将所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据排版展示,得到目标基因分析报告。

为了解决上述问题,本发明还提供一种血液肿瘤RNA测序数据自动化分析装置,所述装置包括:

变异分析模块,用于获取样本测序数据,将所述样本测序数据与预构建的参考基因数据进行比对,得到初始基因比对数据,对初始基因比对数据进行过滤和碱基校正处理,得到目标基因比对数据;对所述目标基因比对数据进行预设的变异组合检测,得到初始变异检测数据,利用预构建的基因突变数据库对所述初始变异检测数据进行注释,得到目标变异检测数据;

基因表达分析模块,用于根据预构建的正常基因表达数据,利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据,所述离群点分析公式为:

其中,∈

倍体及融合基因分析模块,用于利用预构建的倍体分析方法对所述目标变异检测数据和所述基因表达数据进行倍体分析得到倍体分析数据;在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据;

免疫及基因缺失分析模块,用于利用预构建的免疫组库分析软件组对所述样本测序数据进行免疫组库分析,得到免疫分析数据;对所述样本测序数据进行基因缺失分析,得到基因分析数据;

数据输出模块,用于根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告。

为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现上述所述的血液肿瘤RNA测序数据自动化分析方法。

为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的血液肿瘤RNA测序数据自动化分析方法。

相比于背景技术所述:当前血液肿瘤RNA测序方法存在数据资源浪费、准确性低的现象,本发明实施例优化了血液肿瘤RNA测序数据自动化分析的流程,在进行优化的过程中,首先将所述样本测序数据与预构建的参考基因数据进行比对,得到初始基因比对数据,再对初始基因比对数据进行过滤和碱基校正处理,得到目标基因比对数据,再进行基因突变分析的过程中,对所述目标基因比对数据进行预设的变异组合检测,然后利用预构建的基因突变数据库对所述初始变异检测数据进行注释,得到目标变异检测数据,在进行基因表达分析检测的过程中,通过将假设检验公式与离群点分析公式结合的方式,实现利用正常基因表达数据对目标基因比对数据进行基因表达分析,得到基因表达数据的目的,最后分别对目标变异检测数据和所述基因表达数据进行倍体分析、利用预构建的融合位点数据库对所述阳性融合位点进行过滤、对所述样本测序数据进行免疫组库分析以及对所述样本测序数据进行基因缺失分析,得到倍体分析数据、融合位点数据、免疫分析数据以及基因分析数据,最终实现根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告的目标。因此本发明提出的血液肿瘤RNA测序数据自动化分析方法、装置电子设备及计算机可读存储介质,可以解决当前血液肿瘤RNA测序方法存在数据资源浪费、准确性低的问题。

附图说明

图1为本发明一实施例提供的血液肿瘤RNA测序数据自动化分析方法的流程示意图;

图2为图1中其中一个步骤的详细实施流程示意图;

图3为本发明一实施例提供的血液肿瘤RNA测序数据自动化分析装置的功能模块图;

图4为本发明一实施例提供的实现所述血液肿瘤RNA测序数据自动化分析方法的电子设备的结构示意图。

本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本申请实施例提供一种血液肿瘤RNA测序数据自动化分析方法。所述血液肿瘤RNA测序数据自动化分析方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述血液肿瘤RNA测序数据自动化分析方法可以由安装在终端设备或服务端设备的软件或硬件来执行。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。

实施例1:

参照图1所示,为本发明一实施例提供的血液肿瘤RNA测序数据自动化分析方法的流程示意图。在本实施例中,所述血液肿瘤RNA测序数据自动化分析方法包括:

S1、获取样本测序数据,将所述样本测序数据与预构建的参考基因数据进行比对,得到初始基因比对数据,对初始基因比对数据进行过滤和碱基校正处理,得到目标基因比对数据。

可解释的,所述样本测序数据指利用RNA测序技术获取到的RNA测序数据。所述参考基因数据指利用STAR软件构建的参考基因序列数据。所述目标基因比对数据指利用gatk4系列软件对所述初始基因比对数据进行基因过滤和碱基矫正处理后的数据。

可解释的是,所述获取样本测序数据,包括:

对预设样本进行转录,得到转录样本,对转录样本进行生信分析,得到全转录组;

对全转录组进行测序,得到测序数据,通过预构建的数据质量控制软件对测序数据进行质控,得到质控数据,利用所述数据质量控制软件对所述质控数据进行过滤,得到样本测序数据。

可解释的,所述预设样本指待分析的基因序列。转录是遗传信息从DNA流向RNA的过程,即以双链DNA中的确定的一条链为模板,以腺嘌呤、尿嘧啶、鸟嘌呤、胞嘧啶为原料,在RNA聚合酶催化下合成RNA的过程。

进一步地,生信分析是对DNA、RNA、蛋白质和代谢物进行定量和定性分析亦是对复杂的生物信息数据进行图形化展示、可视化分析。

需解释的是,所述通通过预构建的数据质量控制软件对测序数据进行质控,得到质控数据,包括:

利用预设个体基因数据缺失率阈值对所述测序数据逐一比较筛选,得到测序数据子集;

若所述测序数据子集中的数据值小于个体基因数据缺失率阈值,则保留测序数据子集中对应的数据值;

若所述测序数据子集中的数据值大于或等于个体基因数据缺失率阈值,则舍弃对应的数据值;

预处理测序数据子集,得到单核苷酸多态性变异位点数据,预处理单核苷酸多态性变异位点数据,得到样本测序数据。

S2、对所述目标基因比对数据进行预设的变异组合检测,得到初始变异检测数据,利用预构建的基因突变数据库对所述初始变异检测数据进行注释,得到目标变异检测数据。

需解释的是,所述对所述目标基因比对数据进行预设的变异组合检测,得到初始变异检测数据,包括:

利用预构建的Gatk4软件对目标基因比对数据进行变异检测,得到第一变异数据,利用预构建的VarScan软件对目标基因比对数据进行变异检测,得到第二变异数据,合并第一变异数据和第二变异数据,得到初始合并数据;

对初始合并数据进行过滤,得到初始变异检测数据。

进一步地,过滤初始合并数据是为了去除表达量较低的基因。

S3、根据预构建的正常基因表达数据,利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据。

详细地,所述离群点分析公式为:

其中,∈

进一步地,表示自由度,即从所述靶向基因的总个数N中去除参与离群计算的靶向基因后剩余的靶向基因数目,(v=N-i-1)。

进一步地,所述假设检验公式,如下所示:

其中,

进一步地,所述利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据,包括:

利用所述假设检验公式及预设定的拒绝域判断所述目标基因比对数据中靶向基因的基因表达量是否存在离群点;

若所述目标基因比对数据中靶向基因的基因表达量不存在离群点,则判定所述目标基因比对数据中的靶向基因为正常表达基因;

若所述目标基因比对数据中靶向基因的基因表达量存在离群点,则获取所述正常基因表达数据中基因表达量的标准差及均值;

利用预设的离群点处理公式,根据所述正常基因表达数据中基因表达量的标准差及均值计算目标基因处理数值,所述离群点处理公式为:

其中,ESD

在所述目标基因比对数据中提取目标基因处理数值大于可疑离群点参考值的靶向基因;

将所述目标基因处理数值大于可疑离群点参考值的靶向基因判定为异常表达基因;

汇总所有靶向基因的判定结果,得到所述基因表达数据。

可理解的,所述拒绝域是由显著性水平决定的,一般显著性水平取值0.05。

进一步地,根据所述基因表达数据可以得到样本血液健康状态变化趋势。

示例性的,采集小张的血液,再获取得到预设样本,预处理预设样本,获取目标基因比对数据;

利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据;

假设检验目标基因比对数据:

预设预设假设检验结果为:目标基因比对数据为异常表达数据,经过假设检验验证目标基因比对数据为异常表达数据,则小张的血液状态为不健康;

离群点分析目标基因比对数据:根据所述的离群点分析公式对所述目标基因比对数据进行基因表达分析,得到离群分析数据,根据离群分析数据中离群点的数量,得到小张血液状态健康变化趋势。

若所检测出的异常离群点数量为正常离群点数量,则目前小张血液状态为健康状态;

若所检测出的异常离群点数量超出正常离群点数量,则目前小张血液状态向亚健康状态发展。

S4、利用预构建的倍体分析方法对所述目标变异检测数据和所述基因表达数据进行倍体分析得到倍体分析数据。

需解释的是,倍体分析方法,包括:

利用预构建的CaSpER软件完成对所述目标变异检测数据和所述基因分析数据进行分析得到倍体分析数据。

S5、在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据。

可解释的,阳性融合位点是染色体倒位融合位点、染色体中间缺失融合位点、染色体易位融合位点及其他非正常基因融合位点。

进一步地,参阅图2所示,所述在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据,包括:

S51、在所述基因比对数据筛选出染色体倒位融合位点、染色体中间缺失融合位点、染色体易位融合位点及非正常基因融合位点;

S52、汇总所述染色体倒位融合位点、染色体中间缺失融合位点、染色体易位融合位点及非正常基因融合位点得到阳性融合位点集;

S53、根据预设的疾病融合位点数据库过滤阳性融合位点集得到融合位点数据。

进一步的,染色体倒位是由于同一条染色体上发生了两次断裂,产生的片断颠倒180度后重新连接造成的,染色体易位是指染色体的片段的位置发生了改变。

需解释的是,融合基因,是指两个基因的部分序列发生融合形成的嵌合基因,一般由于染色体易位、缺失等原因所致,这种嵌合基因会在后续的生物学过程中形成异常转录本或蛋白质,进而导致或者促进肿瘤的发生,因此在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据,不可或缺。

S6、利用预构建的免疫组库分析软件组对所述样本测序数据进行免疫组库分析,得到免疫分析数据。

进一步地,所述利用预构建的免疫组库分析软件组对所述样本测序数据进行免疫组库分析,得到免疫分析数据,包括:

根据预构建的VDJtools和IgBLAST软件对所述样本测序数据进行免疫组库分析,得到免疫分析数据。

进一步地,免疫组库分析是通过分析样本免疫系统中的抗原受体基因家族,来揭示个体的免疫应答功能和疾病风险。

S7、对所述样本测序数据进行基因缺失分析,得到基因分析数据。

需解释的,所述对所述样本测序数据进行基因缺失分析,得到基因分析数据,包括:

根据预构建的rMATS软件对所述样本测序数据进行基因缺失分析,得到基因分析数据。

进一步地,基因缺失分析是对样本的IKZF1基因的外显子缺失进行分析。

需解释的是,IKZF1基因编码是一种具有锌指结构的转录因子蛋白,在淋巴细胞的分化和发育过程中起着重要的调控作用,IKZF1基因编码的分析有利于对患者病情的诊断、预后和分层治疗,以及慢性髓性白血病患者病情变化的评估。

S8、根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告。

进一步地,所述根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告,包括:

获取数据分析自动化模组,利用数据分析自动化模组将所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据排版展示,得到目标基因分析报告。

进一步地,所得到血液肿瘤RNA测序数据自动化分析系统可根据样本编号进行多样本分析任务投递,非专业操作人员可以通过所述血液肿瘤RNA测序数据自动化分析系统实现对样本RNA测序数据的一键式系统分析。

相比于背景技术所述:当前血液肿瘤RNA测序方法存在数据资源浪费、准确性低的现象,本发明实施例优化了血液肿瘤RNA测序数据自动化分析的流程,在进行优化的过程中,首先将所述样本测序数据与预构建的参考基因数据进行比对,得到初始基因比对数据,再对初始基因比对数据进行过滤和碱基校正处理,得到目标基因比对数据,再进行基因突变分析的过程中,对所述目标基因比对数据进行预设的变异组合检测,然后利用预构建的基因突变数据库对所述初始变异检测数据进行注释,得到目标变异检测数据,在进行基因表达分析检测的过程中,通过将假设检验公式与离群点分析公式结合的方式,实现利用正常基因表达数据对目标基因比对数据进行基因表达分析,得到基因表达数据的目的,最后分别对目标变异检测数据和所述基因表达数据进行倍体分析、利用预构建的融合位点数据库对所述阳性融合位点进行过滤、对所述样本测序数据进行免疫组库分析以及对所述样本测序数据进行基因缺失分析,得到倍体分析数据、融合位点数据、免疫分析数据以及基因分析数据,最终实现根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告的目标。因此本发明提出的血液肿瘤RNA测序数据自动化分析方法、装置电子设备及计算机可读存储介质,可以解决当前血液肿瘤RNA测序方法存在数据资源浪费、准确性低的问题。

如3所示,是本发明一实施例提供的血液肿瘤RNA测序数据自动化分析装置的功能模块图。

本发明所述血液肿瘤RNA测序数据自动化分析装置100可以安装于电子设备中。根据实现的功能,所述血液肿瘤RNA测序数据自动化分析装置100可以包括变异分析模块101、基因表达分析模块102、倍体及融合基因分析模块103、免疫及基因缺失分析模块104以及数据输出模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。

变异分析模块101,用于获取样本测序数据,将所述样本测序数据与预构建的参考基因数据进行比对,得到初始基因比对数据,对初始基因比对数据进行过滤和碱基校正处理,得到目标基因比对数据;对所述目标基因比对数据进行预设的变异组合检测,得到初始变异检测数据,利用预构建的基因突变数据库对所述初始变异检测数据进行注释,得到目标变异检测数据;

基因表达分析模块102,用于根据预构建的正常基因表达数据,利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据,所述离群点分析公式为:

其中,∈

倍体及融合基因分析模块103,用于利用预构建的倍体分析方法对所述目标变异检测数据和所述基因表达数据进行倍体分析得到倍体分析数据;在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据;

免疫及基因缺失分析模块104,用于利用预构建的免疫组库分析软件组对所述样本测序数据进行免疫组库分析,得到免疫分析数据;对所述样本测序数据进行基因缺失分析,得到基因分析数据;

数据输出模块105,用于根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告。

详细地,本发明实施例中所述血液肿瘤RNA测序数据自动化分析装置100中的所述各模块在使用时采用与上述的图1中所述的血液肿瘤RNA测序数据自动化分析方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。

实施例3:

如图4所示,是本发明一实施例提供的实现血液肿瘤RNA测序数据自动化分析方法的电子设备的结构示意图。

所述电子设备1可以包括处理器10、存储器11、总线12和通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如血液肿瘤RNA测序数据自动化分析程序。

其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如血液肿瘤RNA测序数据自动化分析程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如血液肿瘤RNA测序数据自动化分析程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。

所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。

图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。

进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。

可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。

所述电子设备1中的所述存储器11存储的血液肿瘤RNA测序数据自动化分析程序是多个指令的组合,在所述处理器10中运行时,可以实现:

获取样本测序数据,将所述样本测序数据与预构建的参考基因数据进行比对,得到初始基因比对数据,对初始基因比对数据进行过滤和碱基校正处理,得到目标基因比对数据;

对所述目标基因比对数据进行预设的变异组合检测,得到初始变异检测数据,利用预构建的基因突变数据库对所述初始变异检测数据进行注释,得到目标变异检测数据;

根据预构建的正常基因表达数据,利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据,所述离群点分析公式为:

其中,∈

利用预构建的倍体分析方法对所述目标变异检测数据和所述基因表达数据进行倍体分析得到倍体分析数据;

在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据;

利用预构建的免疫组库分析软件组对所述样本测序数据进行免疫组库分析,得到免疫分析数据;

对所述样本测序数据进行基因缺失分析,得到基因分析数据;

根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告。

具体地,所述处理器10对上述指令的具体实现方法可参考图1至3对应实施例中相关步骤的描述,在此不赘述。

进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。

本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:

获取样本测序数据,将所述样本测序数据与预构建的参考基因数据进行比对,得到初始基因比对数据,对初始基因比对数据进行过滤和碱基校正处理,得到目标基因比对数据;

对所述目标基因比对数据进行预设的变异组合检测,得到初始变异检测数据,利用预构建的基因突变数据库对所述初始变异检测数据进行注释,得到目标变异检测数据;

根据预构建的正常基因表达数据,利用预构建的假设检验公式与离群点分析公式对所述目标基因比对数据进行基因表达分析,得到基因表达数据,所述离群点分析公式为:

其中,∈

利用预构建的倍体分析方法对所述目标变异检测数据和所述基因表达数据进行倍体分析得到倍体分析数据;

在所述目标基因比对数据中筛选阳性融合位点,利用预构建的融合位点数据库对所述阳性融合位点进行过滤,得到融合位点数据;

利用预构建的免疫组库分析软件组对所述样本测序数据进行免疫组库分析,得到免疫分析数据;

对所述样本测序数据进行基因缺失分析,得到基因分析数据;

根据所述目标变异检测数据、基因表达数据、倍体分析数据、融合位点数据、免疫分析数据和基因分析数据构建目标基因分析报告。

在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

技术分类

06120116459056