掌桥专利:专业的专利平台
掌桥专利
首页

由计算机实施的吐温混合物的分析方法

文献发布时间:2023-06-19 19:32:07


由计算机实施的吐温混合物的分析方法

技术领域

本发明涉及聚合溶剂类化合物的分析方法技术领域,具体为一种由计算机实施的吐温混合物的分析方法。

背景技术

聚山梨酯类化合物,也称为吐温(Tween),是一系列聚氧乙烯失水山梨糖醇的部分脂肪酸酯形成的高分子化合物。根据其分子结构的不同,聚山梨酯类化合物可分为Tween20和Tween21、Tween 40、Tween 60和Tween61、Tween 80、Tween81和Tween85等。聚山梨酯类化合物,作为非离子型表面活性剂的一种,广泛应用于食品、化妆品和医药品中。在食品领域,聚山梨酯类化合物主要作为稳定剂、乳化剂、消泡剂等(GB2760-2014食品添加剂使用标准)应用于面包、蛋糕、奶油、冰淇淋及烘焙食品中。在药品领域,它被用作抗肿瘤药物的溶解助剂和中药注射剂的溶解助剂。2015年的《中国药典》二部收录了Tween 20、40、60和80作为药用辅料。在化妆品领域,它作为分散剂、乳化剂、增稠剂等广泛应用于乳液、膏、霜等。

目前存在着针对吐温混合物的分析需求,即需要确定包含吐温20、吐温40等多种物质的吐温混合物中所包含的吐温的类型。现有的Tween分析采用质谱分析方法分析样品,样品预处理后,利用阳离子线性模型收集数据,并采用eMSTAT和BioNumberics进行数据分析。

虽然使用eMSTAT和BioNumberics等通用软件能够对吐温混合物的质谱谱图进行数据分析,但是由于吐温为大分子化合物,其本身就已包含不同聚合度、不同酯化程度、不同杂质反应的高分子组分,而吐温混合物是多种吐温混合形成的,吐温混合物的质谱谱图的谱峰会变得尤其复杂,需另对谱图做成分鉴定以及相似度对比。现有的通用软件并非专门针对吐温混合物的分析开发,难以适配吐温混合物的分析特点,不具备吐温化合物数据后处理专业知识的用户难以通过操作此类通用软件完成数据分析工作。

发明内容

针对以上问题,本发明提供了一种由计算机实施的吐温混合物的分析方法,即使用户没有较为完备的相关高分子质谱数据分析的专业知识,计算机也可以通过执行该方法与用户无障碍交互,最终准确确定吐温混合物中包含的吐温的类型,解决现有的吐温混合物分析交互界面对用户不友好且分析准确度较低的技术问题。

本发明提供一种由计算机实施的吐温混合物的分析方法,用于确定吐温混合物中包含的吐温组分的类型,包括以下步骤:

获取吐温混合物样品在不同解离条件下的多组质谱数据;

根据用户设定的质荷比范围,从多组质谱数据中提取多组三维特征分量,对每种吐温组分对应的多组三维特征分量进行聚类分析;

显示基于多组三维特征分量构建的三维图,被聚类为与同一种吐温组分对应的一组三维特征分量在三维图中对应显示一个点,三维图中区分显示每种吐温组分所对应的点簇;

基于由用户确认的三维图所对应的质荷比范围,分析吐温混合物样品中包含的吐温组分的类型。

因为提取三维特征分量的过程是由用户设定的质荷比范围所控制或者监督的,吐温组分的质荷比范围或者质量数范围通常是可以事先通过其他测定手段而快速确定的,发明人发现,通过预先设定质荷比范围,可以有效减少提取三维特征或者聚类分析时所需要的运算量,大幅降低处理时间,同时有效提升分析结果的准确率。另外,以三维图的方式呈现给用户确认,不仅与用户之间的交互过程更加直观方便,而且方便用户从各个角度通过拖拽、旋转、平移、缩放等方式观察三维图中各点的聚类分析结果,便于用户迅速给出对于聚类分析结果的判断,提升了分析方法整体的运行效率。此外,结合质荷比范围的类型分析,也可以更加准确迅速地给出吐温混合物样品的类型判断结果,大幅降低其所需的运算量大小。

通过以上方式,本发明提供了一种分析方法,能够更加简单高效地与用户进行交互,用户在操作过程中只需输入质荷比范围,并根据点的离散程度判断聚类分析的结果,即可直观地给出监督聚类分析算法的依据,以更低的运算量给出更加准确的分析结果,整个交互过程直观,界面友好,且分析的准确度较高。

本发明的可选技术方案中,还包括以下步骤:

在三维图中显示未被聚类的多组三维特征分量对应的杂质点簇;

响应于至少一部分杂质点簇被标记为目标化合物或者目标混合物,将该杂质点簇对应的多组三维特征分量与目标化合物或者目标混合物关联保存为杂质点簇数据;之后,

在针对重新采集的吐温混合物样品进行分析时,将未被聚类的多组三维特征分量数据与杂质点簇数据进行比对,以确定目标化合物或者目标混合物是否存在或者分析其浓度。

通过以上方式,还可以对吐温混合物中的杂质成分进行分析。吐温混合物中的杂质成分,也会在谱图中出峰,但难以被聚类分析准确判别,容易干扰聚类分析的结果。进一步地,可以通过预先建立和保存相关杂质成分的信息的方式,将这些点作为杂质点簇数据,与其他测量点相互区别,可以减少杂质成分对吐温成分定性或者定量分析的干扰,并且能够在特定情况下,完成对于吐温混合物中杂质成分的定性或者定量分析。

本发明的可选技术方案中,还包括以下步骤:

根据点簇的离散程度,计算该点簇与吐温组分匹配的正确率。

根据该技术方案,离散程度较大时,表示该点簇与吐温组分匹配的概率较小,离散程度较小时,表明该点簇与吐温组分匹配的概率较高,采用该判别方法可以更加准确地确定该点簇对应的吐温混合物样品的类型。

本发明的可选技术方案中,吐温混合物样品是吐温20、吐温40、吐温60和吐温80中的一种或多种。

本发明的可选技术方案中,质谱数据由基质辅助激光解离-飞行时间质谱仪获得。

本发明的可选技术方案中,还包括以下步骤:

提供由多种吐温20、吐温40、吐温60和吐温80标准样品建立的吐温标准质谱数据集。

根据该技术方案,将多种吐温标准样品建立的吐温标准质谱数据集与待分析的吐温组分进行比对,能够确定吐温类型,提高吐温成分分析的便捷性。

本发明的可选技术方案中,从多组质谱数据中提取多组三维特征分量的步骤是基于主成分分析算法实现的。

根据该技术方案,主成分分析算法将许多原本相关性很高的数据转化为相互独立或不相关的数据,用更加简化的数据来替代原本复杂的质谱数据,以提升后续聚类分析的运算速度和准确性,且便于采用三维图的形式直观显示。

本发明的可选技术方案中,对每种吐温组分对应的多组三维特征分量进行聚类分析的步骤是基于K均值算法实现的。

附图说明

图1是本发明第一实施方式中由计算机实施的吐温混合物的分析方法流程图。

图2是本发明分子量范围设定为1000-2500对应的吐温混合物的聚类分析结果示意图。

图3是本发明分子量范围设定为2000-2500对应的吐温混合物的聚类分析结果示意图。

图4是本发明分子量范围设定为3000-5000对应的吐温混合物的聚类分析结果示意图。

图5是本发明第二实施方式中由计算机实施的吐温混合物的分析方法流程图。

图6是本发明第三实施方式中由计算机实施的吐温混合物的分析方法流程图。

图7是本发明第四实施方式中由计算机实施的吐温混合物的分析方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

【第一实施方式】

如图1所示,是本发明第一实施方式中由计算机实施的吐温混合物的分析方法流程图。请参阅图1,本发明提供一种由计算机实施的吐温混合物的分析方法,用于确定吐温混合物的类型,包括以下步骤:

步骤S1:获取吐温混合物样品在不同解离条件下的多组质谱数据;

步骤S2:根据用户设定的质荷比范围,从多组质谱数据中提取多组三维特征分量,对每种吐温组分对应的多组三维特征分量进行聚类分析;

步骤S3:显示基于多组三维特征分量构建的三维图,被聚类为与同一种吐温组分对应的一组三维特征分量在三维图中对应显示一个点,三维图中区分显示每种吐温组分所对应的点簇;

步骤S4:基于由用户确认的三维图所对应的质荷比范围,分析吐温混合物样品的类型。

本发明通过上述由计算机实施的吐温混合物的分析方法,用户在完成质谱分析后,无需自行进行数据分析,通过计算机实施的简单的数据后处理操作,就可以得到吐温混合物样品的类型,对于不具备吐温混合物的复杂质谱数据后处理专业知识的用户,也能够进行吐温混合物的分析,降低了吐温混合物分析的难度。

此外,因为提取三维特征分量的过程是由用户设定的质荷比范围所控制或者监督的,吐温组分的质荷比范围(即质量数范围)通常是可以事先通过其他测定手段而快速确定的,发明人发现,通过预先设定质荷比范围,可以有效减少提取三维特征或者聚类分析时所需要的运算量,大幅降低处理时间,同时有效提升分析结果的准确率。另外,以三维图的方式呈现给用户确认,不仅与用户之间的交互过程更加直观方便,而且方便用户从各个角度通过拖拽、旋转、平移、缩放等方式观察三维图中各点的聚类分析结果,便于用户根据点的离散程度迅速给出对于聚类分析结果的判断,提升了分析方法整体的运行效率。此外,结合质荷比范围的类型分析,也可以更加准确迅速地给出吐温混合物样品的类型判断结果,大幅降低其所需的运算量大小。

具体而言,本发明实施方式中,吐温混合物样品是吐温20、吐温40、吐温60和吐温80中的一种或多种。

通过上述方式,能够对包含吐温20、吐温40、吐温60和吐温80中的一种或多种进行成分分析,扩大了吐温混合物样品分析的适用范围。

本发明实施方式中,质谱数据包括质荷比、离子流的强度以及解离条件等相关数据,解离条件可以是激光强度、电场强度等任意可改变样品解离程度的物理量,通过对吐温混合物进行质谱分析,获得吐温混合物在不同解离条件下对应的多组质谱数据,对应多张质谱图。

本发明的优选实施方式中,质谱数据由基质辅助激光解离-飞行时间质谱仪获得。

本发明实施方式中,用户可以自行设定多个质荷比范围,并根据不同质荷比范围下聚类分析的结果反馈,选定合适的质荷比范围。本发明的具体实施例中,设定了三个质荷比范围,基于质荷比与分子量(质量数)一一对应的关系,设定的三个质荷比范围对应的分子量范围分别为1000-2500,2000-2500,3000-5000。图2、图3及图4分别为上述三个分子量范围对应的吐温混合物样品聚类分析结果示意图,从图3中可以看出,分子量范围为1000~2500Th的设定中,不同点簇之间的离散程度较大,同一点簇内数据的离散程度较小,即不同点簇代表了不同的样品组分,不同点簇之间离散程度大,相互之间的关联度小。而同一点簇的离散程度小,判断为同一样品组分的准确率高。反观图3,分子量范围为3000-5000对应的三维图中,数据点不仅在空间整体的离散程度较高,部分相对集中的区域内,数据点已经呈现较为分散的状态,无法实现较好的聚类分析结果。

进一步地,对每种吐温组分对应的多组三维特征分量进行聚类分析的步骤是基于K均值算法实现的。k-means算法是一种基于形心的划分数据的方法。其基本思想是,随机选取k个点,作为聚类中心;计算每个点分别到k个聚类中心的聚类,然后将该点分到最近的聚类中心,这样就行成了k个簇;再重新计算每个簇的质心(均值);重复以上步骤,直到质心的位置不再发生变化或者达到设定的迭代次数,即得到聚类分析结果。本发明通过给定多组三维特征分量,以及要划分的簇数(如吐温20、吐温40、吐温60及吐温80,四个簇),就能通过该算法将数据集划分为k个簇,每个簇对应一种吐温组分的类型。

本发明的优选实施方式中,从多组质谱数据中提取多组三维特征分量的步骤是基于主成分分析算法(principal components analysis,PCA)实现的。

主成分分析将多个变量通过线性变换以选出较少个数重要变量,设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息,通过主成分分析可以实现多组质谱数据的降维,将不同解离条件下的多组二维质谱图转换为三维空间的特征分量;基于吐温混合物的复杂性,采用PCA算法能够大大缩小质谱数据的数据量,降低数据分析工作量,通过提取质谱数据的三维特征分量,排除相同的数据,有利于降低聚类分析的工作量,并提高聚类分析结果的准确性。本发明的具体实施方式中,根据PCA算法结合K均值算法进行聚类分析的具体公式如下所示,

式中X

本发明的具体实施例中,基于主成分分析法和K均值算法得到的吐温混合物样品的三维特征分量及聚类结果如下表1所示。

表1基于PCA和K均值算法的结果示例

表1中,d

【第二实施方式】

图5是本发明第二实施方式中由计算机实施的吐温混合物的分析方法流程图。请参阅图5,本发明的第二实施方式提供了一种由计算机实施的吐温混合物的分析方法,其与第一实施方式不同的是,还包括步骤S5:

在三维图中显示未被聚类的多组三维特征分量对应的杂质点簇;

响应于至少一部分杂质点簇被标记为目标化合物或者目标混合物,将该杂质点簇对应的多组三维特征分量与目标化合物或者目标混合物关联保存为杂质点簇数据;之后,

在针对重新采集的吐温混合物样品进行分析时,将未被聚类的多组三维特征分量数据与杂质点簇数据进行比对,以确定目标化合物或者目标混合物是否存在或者分析其浓度。

通过以上方式,还可以对吐温混合物中的杂质成分进行分析。吐温混合物中的杂质成分,也会在谱图中出峰,但难以被聚类分析准确判别,容易干扰聚类分析的结果。进一步地,可以通过预先建立和保存相关杂质成分的信息的方式,将这些点作为杂质点簇数据,与其他测量点相互区别,可以减少杂质成分对吐温成分定性或者定量分析的干扰,并且能够在特定情况下,完成对于吐温混合物中杂质成分的定性或者定量分析。

【第三实施方式】

图6是本发明第三实施方式中由计算机实施的吐温混合物的分析方法流程图。请参阅图6,本发明的第二实施方式提供了一种由计算机实施的吐温混合物的分析方法,其与第一实施方式不同的是,还包括步骤S6:

根据点簇的离散程度,计算该点簇与吐温组分匹配的正确率。

通过上述方式,离散程度较大时,表示该点簇与吐温组分匹配的概率较小,离散程度较小时,表明该点簇与吐温组分匹配的概率较高,采用该判别方法可以更加准确地确定该点簇对应的吐温组分的相似度计算结果。

具体来说,通过以下公式:

可以计算该点簇与吐温组分匹配的正确率,其中d和σ分别表示样本(即一组三维特征分量在三维图中对应显示的一个点)到点簇中心的距离和点簇数据的最大边界半径。本发明的具体实施例中,将10种样品(T 80_1、T 80_2、T 20_1、T 20_2、AGTuningMix、NaI、T60_1、T 60_2、T 40_1、T 40_2)的质谱数据经过PCA和K均值算法进行聚类分析,获得的试验数据分类结果如下表2所示。

表2试验数据的概率表

如表2所示,表的第一列表示分析对象的标签,其余四列用百分比表示分析对象是否为特定吐温分类的概率(相对值)。可以看出,T80-1被聚类为吐温80的概率为81.2057,T80-2被聚类为吐温80的概率为95.7658,T20-1被聚类为吐温20的概率为95.3856,结果表明,该模型能较好地分类吐温。在输入与吐温完全不同的其他样本(如NaI)时,点簇与吐温组分匹配的概率较低,不会超过一定阈值,例如是60%的阈值。

【第四实施方式】

图7是本发明第四实施方式中由计算机实施的吐温混合物的分析方法流程图。请参阅图7,本发明的第四实施方式提供了一种由计算机实施的吐温混合物的分析方法,其与第一实施方式、第二实施方式、第三实施方式不同的是,还包括以下步骤S7:

提供由吐温20、吐温40、吐温60和吐温80标准样品建立的吐温标准质谱数据集。

通过上述方式,将多种吐温标准样品建立的吐温标准质谱数据集与待分析的吐温组分进行比对,能够确定吐温类型,提高吐温成分分析的便捷性以及准确性。

工业实用性

本发明提供的吐温混合物的分析方法可以用于吐温混合物的定性鉴定和半定量分析,尤其适用于作为药用辅料的吐温混合物的定性鉴定或者半定量分析。

以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术分类

06120115939262