掌桥专利:专业的专利平台
掌桥专利
首页

使用拉曼光谱法实时监测葡萄酒发酵特性

文献发布时间:2023-06-19 12:13:22


使用拉曼光谱法实时监测葡萄酒发酵特性

相关申请的交叉引用

本申请涉及并要求于2020年2月13日提交的美国临时专利申请 No.62/975,872的优先权权益,其全部内容通过引用并入本文。

技术领域

本公开通常涉及拉曼光谱法,并且具体地,涉及一种在生产环境中对葡萄酒发酵过程应用拉曼光谱法的方法。

背景技术

拉曼光谱法是用于测量来自样品的非弹性散射辐射(例如,光) 的波长和强度的技术,从而揭示样品的化学和结构组成。拉曼光谱法基于如下原理:单色激发光将根据接收入射辐射的特定分子(例如,蛋白质、肽、碳水化合物、细胞因子、盐等)被反射、吸收或散射。大部分能量在激发光的相同波长下散射,被称为弹性或瑞利散射。小得多的量(例如,~0.001%)在不同波长下散射,被称作非弹性或拉曼散射,其波长取决于被采样区域的分子组成。在拉曼光谱分析(可互换地,拉曼分析和拉曼光谱法)中,这些波长位移被捕获在包括拉曼散射光(即,拉曼信号)的拉曼光谱中,该拉曼光谱被分析以测定样品特性,包括化学特性和物理特性两者。

通常,拉曼分析的实际实现方式包括对拉曼光谱的数据处理和建模以分开、标识目标分析物的相对较弱的拉曼信号,然后对该信号的变化进行建模以产生有用的结果,针对这些有用的结果可采取动作。拉曼光谱法由于(a)它同时地测量多种组成部分的能力以及(b)在内部放置有它的样品/环境的复杂性而不是“即插即用”光学传感器技术。直接放置到样品(例如,细胞培养基)中的拉曼探针提供与样品内的所有分子成分的振动光谱信息有关的分子指纹或“拉曼签名”。因此,必须对原始光谱数据进行预处理,以既增强分析物信号又减少存在于原始数据中的来自其他种类的外部噪声。然后使用单变量和/或多变量分析方法(常常称为化学计量建模)来对经预处理的数据进行建模,以从拉曼光谱数据中提取最大量有关的相关信息,这些分析方法包括但不限于偏最小二乘(PLS)、间接硬建模(IHM)、主成分分析 (PCA)、机器学习(ML)及其任何变体,例如深度学习(DL)、人工神经网络(ANN)等。使用化学计量模型,拉曼分析能够提供代谢过程的多个标记,这进而能够既与使用已知实验室技术(例如,质谱法、气相色谱-质谱法(GC-MS)、液相色谱-质谱法(LC-MS)、酶法等)的离线测量结果又与非特定在线方法(例如,各式各样基于吸收的技术,诸如UV-Vis)相关联并被实时地跟踪。

拉曼光谱法具有许多独特的优点,这些优点使它变得理想地适于过程控制应用。可以常常实时地在固相、液相和气相下非破坏性地且非侵入性地调查许多有机和无机材料,而无需样品准备。激发辐射和返回的散射辐射能够通过波长透射窗直接透射到过程容器中或从中透射出来,并且经由光纤在长距离上透射以供远程分析。然而,因为拉曼效应是相对较弱的,所以它对需要快速采集时间的某些在线生物过程控制应用的适用性可能稍微受到阻碍。使用拉曼分析的可靠检测和量化需要灵敏且高度优化的仪器。还必须考虑在样品内通过激发辐射和样品过热生成的荧光辐射的问题。

由于拉曼效应的弱点,窄光束、高强度光源(例如,激光器)是从样品产生优质拉曼光谱所需的要求之一。在很大程度上,拉曼光谱的分辨率依靠所用激光源的带宽。优选连续波激光源,因为脉冲激光的成本更高、更复杂,以及为了足够的信噪比而利用较高的峰值功率,这可能损坏样品。对光源波长的选择取决于给定应用的要求。较低的可见波长和较高的UV(例如,大约300nm至500nm)可以在有机材料中引发强自发荧光,这能够掩盖相对较弱的拉曼信号。因此,较长的可见或近红外光源(例如,633-1064nm)可能更适合于有机目标。然而,拉曼信号强度与激发波长成反比(至四次幂)。因此,较长的波长可能需要较长的采集时间,这在某些生物处理应用中可能是有问题的。

在用于对发酵过程应用拉曼分析的这种技术领域中需要改进。

发明内容

本公开的一个方面公开了一种表征和监测发酵过程的方法。在本公开的至少一个实施例中,该方法包括:在发酵过程期间的不同时间采集发酵罐容器内的发酵过程的在线拉曼光谱以生成训练数据集;对训练数据集应用光谱预处理,使得由于非有关种类和/或特性而导致的非相关和协变变化被最小并且由于目标分析物而导致的相关变化被放大;在接近所采集的拉曼光谱的时间从发酵过程采集物理样品;使用化验测量技术来对目标分析物特性和/或组成执行离线测量;生成目标分析物的相关模型,使得训练数据集中的光谱变化与目标分析物特性和/或组成的离线测量相关;在后续运行期间的不同时间采集发酵罐容器内的发酵过程的该后续运行的在线拉曼光谱以生成过程数据集;以及将相关模型应用于过程数据集以定性地和/或定量地预测目标分析物的特性和/或组成的值。目标分析物包括发酵过程的不止一种种类或特性。

在另一个实施例中,该方法还包括在采集在线拉曼光谱之前或之后从物理样品的预定集采集离线拉曼光谱。在这样的实施例中,来自所采集的离线拉曼光谱的数据被包括在训练数据集中。在另一个实施例中,与拉曼光谱同时地采集物理样品。

在本公开的实施例中,该方法还包括准备实验样品并采集实验样品的离线拉曼光谱和离线化验测量结果,其中,实验样品的数据被包括在训练数据集中。在这样的实施例中,根据预定实验设计来准备实验样品,在该预定实验设计中将所选分析物变量准备为预定值,使得实验样品的变化将被统计地控制。

在另一实施例中,光谱预处理包括被适配成鉴别发酵过程的最佳预处理算法的一系列优化。在某些实施例中,使用单变量建模方法来生成相关模型。在某些实施例中,使用多变量建模方法来生成相关模型。

在本公开的实施例中,该方法还包括使用建模统计来迭代地细化相关模型,使得训练数据集与离线测量结果的相关性被增加。在另一个实施例中,该方法包括当目标分析物的值基于阈值极限偏离期望范围时生成信号、警报或报告。在各种实施方式中,目标分析物包括以下各项中的至少一种:乙醇浓度、果糖浓度、葡萄糖浓度、白利糖度值、NOPA值、pH值、氨浓度、酒石酸浓度、苹果酸浓度、总酸度值、柠檬酸浓度、乙酸浓度、葡萄糖酸浓度、乳酸浓度、甘油浓度、二氧化硫浓度和多酚含量值。

在本公开的另一方面中,一种计算机程序产品包括对指令进行编码的非暂时性机器可读存储介质,指令当由一个或多个可编程处理器执行时,使该一个或多个可编程处理器执行包括以下步骤的操作:在发酵过程期间的不同时间采集发酵罐容器内的发酵过程的在线拉曼光谱以生成训练数据集;对训练数据集应用光谱预处理,使得由于非有关种类和/或特性而导致的非相关和协变变化被最小化并且由于目标分析物而导致的相关变化被放大;生成目标分析物的相关模型,使得训练数据集中的目标分析物特性和/或组成的光谱变化和在接近所采集的拉曼光谱的时间从发酵过程取得的物理样品的离线化验测量结果相关;在发酵罐容器内的发酵过程的后续运行期间采集后续在线拉曼光谱;以及将相关模型应用于后续在线拉曼光谱以定性地和/或定量地预测目标分析物的特性和/或组成的值。在某些实施例中,目标分析物包括以下各项中的至少一种:乙醇浓度、果糖浓度、葡萄糖浓度、白利糖度值、NOPA值、pH值、氨浓度、酒石酸浓度、苹果酸浓度、总酸度值、柠檬酸浓度、乙酸浓度、葡萄糖酸浓度、乳酸浓度、甘油浓度、二氧化硫浓度和多酚含量值。在至少一个实施例中,操作还包括当目标分析物的值基于阈值极限偏离期望范围时生成信号、警报或报告。

在本公开的另一方面中,一种拉曼分析系统包括:光源,该光源被配置成发射激发光;光学探针,该光学探针经由光缆耦合到光源,使得激发光从探针的探针头发射到样品体积中,其中,探针被配置成经由光缆或另一光缆从样品体积接收和发送拉曼信号;光谱仪,该光谱仪被配置成光谱上分开所发送的拉曼信号;检测器,该检测器被配置成接收已分开的拉曼信号并将已分开的拉曼信号转换成拉曼光谱;以及控制器,该控制器被配置成:通过致动光源以发射激发光并从检测器接收拉曼光谱来在发酵过程期间的不同时间采集发酵罐容器内的发酵过程的在线拉曼光谱;对拉曼光谱应用相关模型以定性地和/或定量地预测目标分析物的特性和/或组成的值,其中,相关模型被适配为使得先前采集的拉曼光谱的目标分析物特性和/或组成的光谱变化与从先前发酵过程取得的物理样品的离线化验测量结果相关;并且通过周期性地采集后续在线拉曼光谱来监测发酵过程。

在一个实施例中,控制器还被配置成当目标分析物的值基于阈值极限偏离期望范围时生成信号、警报或报告。在某些实施例中,目标分析物包括以下各项中的至少一种:乙醇浓度、果糖浓度、葡萄糖浓度、白利糖度值、NOPA值、pH值、氨浓度、酒石酸浓度、苹果酸浓度、总酸度值、柠檬酸浓度、乙酸浓度、葡萄糖酸浓度、乳酸浓度、甘油浓度、二氧化硫浓度和多酚含量值。

附图说明

本文包含的所描述的实施例及其他特征、优点和公开以及实现它们的方式将变得显而易见,并且通过参考结合附图进行的本公开的各种实施例的以下描述,将更好地理解本公开,其中:

图1是根据本公开的拉曼分析系统的实施例的示意表示;

图2示出根据本公开的方法的实施例;

图3利用任意单位(a.u.)的绝对强度与拉曼位移(cm

图4利用任意单位(a.u.)的相对强度与拉曼位移(cm

图5利用测量的乙醇浓度(%v/v)与预测的乙醇浓度(%v/v)的关系示出根据本公开的使用乙醇相关模型的乙醇浓度预测的线性回归的曲线;以及

图6示出葡萄酒制造过程的示意图示。

具体实施方式

本公开包括使用分散拉曼光谱分析来执行实时非破坏性组成分析以进行葡萄酒生产,特别是葡萄汁发酵。照惯例,除了诸如pH、温度、溶解氧和溶解二氧化碳的宏观过程参数之外,很少测量葡萄酒发酵过程中涉及的分析物,因为必须离线做测试。例如,通常经由离线化验针对漂移校准在线频繁地测量的pH。由于收集时间、人员和成本,离线分析连续采集是不切实际的。这些限制剥夺了葡萄酒酿造者观察、测量并校正实时过程偏差的能力,这些实时过程偏差可能导致产品质量问题并降低产量。创造葡萄酒的独特性并确保最终产品与所期望的口味分布匹配需要监测过程的输入以及过程的每个阶段。葡萄汁属性以及诸如细菌和酵母菌(例如,天然的和/或人工的)的其他输入中的变化可显著地影响葡萄酒的质量。在葡萄酒酿造的各阶段中,发酵是最不同的,从而使监测和控制变得至关重要。

本公开包括用于使用拉曼分析来对葡萄汁发酵过程内的多种分析物的存在和浓度进行建模和测定的方法。使用所公开的方法,可以在发酵罐内以非破坏性和沉浸式方式实时地执行分析物测定,而无需为拉曼分析准备任何样品。所公开的方法已证明在若干发酵验证品种特定批次(例如,霞多丽和黑比诺葡萄酒品种)期间和/或像组合成能够以非品种特定方式应用的通用模型那样对多个组成特性进行建模和实时预测时有效。本公开使得葡萄酒生产者能够监测和调整发酵过程的过程特定参数,以既在整个葡萄酒生产过程中又在最终产品中实时地微调产品质量和产量。本公开还使得能够降低制造生产成本、针对非理想批次进行实时故障监测并且改进所制造产品的至关重要的质量属性。

在葡萄酒生产的葡萄汁发酵步骤期间,存在指示当前批次的质量的若干关键分析物。这些关键分析物中的一些包括乙醇浓度、果糖浓度、葡萄糖浓度、白利糖度(即,按质量计的总溶解糖含量)、通过邻苯二甲醛化验(NOPA)给出的可用氮水平、氨、pH、酒石酸、苹果酸、总酸度、柠檬酸、乙酸、葡萄糖酸、乳酸、甘油、二氧化硫、多酚含量和总酚浓度。这些示例性种类尤其被认为在葡萄酒(例如,红葡萄酒、白葡萄酒、粉红葡萄酒和橙葡萄酒)的制造中重要。出于反馈控制和质量控制目的具有实时在线测量结果提高产量并加快对发酵过程期间的质量问题的检测。

为了促进对本公开的原理的理解,现在将参考附图中图示的实施例,并且将使用具体语言来描述实施例。然而应理解,由此不旨在限制本公开的范围。

根据本公开的至少一个实施例,如图1所示,用于监测发酵过程的拉曼系统100可以包括光纤耦合的拉曼探针10,其被配置和布置成将激发光发送到被测发酵容器110内的被测发酵过程中并且收集从发酵容器内的样品体积发射的拉曼信号。探针10可以通过光纤电缆20 耦合到激发光源30,使得由光源30发射的激发光经由过程连接112入射在样品体积内的样品上。在至少一个实施例中,过程连接112包括开口并被配置成使得能够将探针10附接到发酵容器110,使得探针10 经由过程连接112的开口与样品直接接触。在另一个实施例中,过程连接112可以包括对光源30的激发光透明的窗口,使得探针10经由过程连接112的窗口与样品间接接触。在某些实施例中,过程连接112 是将探针10布置为使得激发光入射在样品上并且所得的拉曼信号入射在探针10上的任何合适的手段。探针10和光纤电缆20使得拉曼系统 100能够激发样品体积并在发酵容器110内原位收集所得的拉曼信号,从而从生产规模环境中正在进行的发酵过程生成实时数据。

探针10可以是任何合适的可商购的拉曼探针,包括由密歇根州安阿伯的凯撒光学系统公司(申请人)制造和销售的拉曼探针。探针10 可以包括探针头,其中收容有各种光学组件,作为非限制性示例,包括采样光学器件、光栅、滤波器、合束器以及被配置成将各种光学组件与光纤电缆20相接合的连接器。光纤电缆20可以包括多模光纤或单模光纤,其中的任何一个被配置成提供从光源30到探针10的激发路径,其将激发光发送到样品,以及从探针10到拉曼仪器70的收集路径,其将包含拉曼信号的散射光从样品发送到拉曼仪器70。在至少一个实施例中,光纤电缆20可以包括用于激发路径的激发电缆22和用于收集路径的单独的收集电缆24,其中可以使用包括例如光栅和合束器的光学组件的组合来在探针10处或之中组合激发路径和收集路径。例如,探针10中的合束器(例如,全息合束器)可以用于将激发路径与收集路径一起组合到公共光轴上,使得探针10中的公共采样光学器件可以被用于两个路径。

在至少一个实施例中,为过程监测应用配置的拉曼系统100可以在拉曼分析仪70与探针10之间包括相当长(例如,数百米)的光纤电缆20。每根光纤具有它自己的拉曼和弹性散射特征图,其可以在例如经由激发电缆22将激发光发射到样品中之前在探针10处被去除。例如,由于来自样品的瑞利散射而导致的强光源线(即,瑞利线)可以在进入光纤电缆20(例如,收集电缆24)之前被从在探针10处收集的拉曼信号中去除。否则,瑞利线可以在到光谱仪40途中生成竞争的光纤特征图。在某些实施例中,可以将全息光栅和/或空间滤波器插入到激发路径中以去除光纤特征图。可以通过收集路径中的陷波滤波器(例如,全息陷波滤波器)从所收集的拉曼信号中去除瑞利线。

在某些实施例中,拉曼系统100可以被配置成监测过程中的多个样品位置。在这样的实施例中,多个远程探针10可以经由多根光纤电缆20耦合到单个拉曼仪器70。如图1所示,拉曼仪器70可以包括光源30和光谱仪40,该光谱仪40被配置成光谱上分开经由光纤电缆20 发送的拉曼信号并且经由光谱仪40的光学组件将光谱上分开的拉曼信号馈送到拉曼仪器70的检测器50。拉曼系统100是色散拉曼系统并且包括衍射光栅和对应的光学组件以将拉曼信号分散(例如,光谱上分开)到检测器50上。例如,作为分散系统,拉曼系统100不需要可动组件,这些可动组件可能受到环境条件以及诸如傅立叶变换拉曼光谱法这样的替代系统的其他已知缺点影响。

光源30可以是包括但不限于激光器、激光二极管、氖钨灯、水银灯等的窄带高强度光源。检测器50可以是诸如但不限于电荷耦合器件 (CCD)或半导体阵列(例如,锗或铟镓砷(InGaAs)检测器)的阵列检测器(例如,多通道)。在某些实施例中,拉曼仪器70可以包括陷波滤波器、边缘通滤波器、带通滤波器和/或其他光学组件,这些其他光学组件被配置和布置成去除发送到光谱仪40的光的强弹性散射 (未移位的)瑞利分量,其否则将隐藏(例如,作为噪声)相对较弱的拉曼信号。在采用多个探针10的实施例中,拉曼仪器70可以包括定序器或分束器以多路复用光源30的输出。

拉曼仪器70还可以包括运行软件62的控制器60,该控制器被配置成控制拉曼系统100,包括光源30、光谱仪40和检测器50,并且从与之通信的检测器50接收和分析检测器数据。控制器60可以被配置用于对检测器数据进行数据采集和信号处理以执行本公开的方法。控制器60可以被配置成执行某些操作,包括控制结构以提供本文描述的功能。在某些实施例中,控制器60形成处理子系统的一部分,该处理子系统包括具有存储器、处理和/或通信硬件的一个或多个计算设备。控制器60可以是收容在拉曼分析仪70内的单个设备或分布式设备,并且控制器60的功能可以由硬件和/或软件执行。控制器60能够包括一个或多个算术逻辑单元(ALU)、中央处理单元(CPU)、存储器、限制器、调节器、滤波器、格式转换器或为了保持清楚而未示出的类似物。在至少一个实施例中,控制器60是可编程的以依照通过编程指令定义的操作逻辑如软件或固件来执行算法并处理数据。替换地或附加地,能够通过硬连线逻辑或其他硬件例如使用任何合适类型的专用集成电路(ASIC)来至少部分地定义控制器60的操作逻辑。控制器 60可以排他地专用于本文描述的功能或者可以被进一步用在拉曼系统 100的一个或多个其他子系统或方面的调节、控制和激活中。

控制器60可以包括被构造成在功能上执行控制器60的操作的一个或多个模块。本文的包括模块的描述强调控制器60的各方面的结构独立性并且图示控制器60的操作和职责的一个分组。执行类似的整体操作的其他分组被理解为在本公开的范围内。可以在计算机可读介质上以硬件和/或软件实现模块,并且模块可以跨各种硬件或软件组件分布。

拉曼系统100能够既将激发光远程地递送到特定处理位置又远程地收集拉曼信号。利用拉曼系统100检测物质的化学和物理信息特性的能力,当使用探针10来分析发酵过程时,能够在过程中的任何点并以非破坏性方式实时地收集化学和物理信息。

在本公开的实施例中,这种实时信息反馈提供若干优点,包括: (1)通过监测实际的化学、物理和组成信息对发酵过程进行实时反馈控制;(2)实时地预测各个特性的起点和终点二者的测定;(3)批次结束特性测定以放弃附加离线测试,从而实现实时产品发布;以及 (4)组成并应用既具体又通用的非品种特定规模可转移模型以便预测将来发酵过程内的每种分析物的能力。

利用在相同光谱内实时地收集多种物理和化学特性的光谱特征图的能力,拉曼系统100的实施例提取有关各种过程参数和若干关键分析物的定量组成、化学和物理信息。如果进行后续离线化验基准测量,则可以建立关于成分和/或特定特性以及这些相对变化如何与所采集的拉曼光谱联系起来的相关性,而无论光谱是实时地还是运行后采集的。

可以在单变量和/或多变量空间中进行此类相关以使在线拉曼光谱采集与经由发酵化验测量结果离线采集的离散可量化组成、化学和物理特性联系起来。光谱预处理以及诸如PLS、PCA、ML、DL、ANN 和/或IHM的多变量分析提供可以标绘在时间标度上以实时地向操作员通知和报警在发酵过程期间和之后的重要组成部分的可量化状态和/ 或相对状态。

根据本公开的实施例,在一个或多个发酵批次(例如,发酵过程从开始到结束的各个实例)期间,在每次运行期间使用拉曼系统100 来从发酵容器110以指定间隔采集拉曼光谱。在发酵过程期间和/或之后,经由离线化验定量地测量许多样品。在具体采样时间,所采集的样品的拉曼光谱用于建立一个或多个定量模型,这些模型使每种组成和/或特性与在特定运行或批次内发生的拉曼光谱变化(例如,峰和谷) 相关联。在可能不太相关的模态中(相对于在线测量结果),可以通过拉曼分析离线分析样品,然后使样品与它们相应的离线化验值相关联。在生成了定量模型之后,可以使用拉曼系统100的实施例来实时地应用模型,该拉曼系统包括与被表征、监测和控制的发酵过程通信的探针10。

根据如图2所示的本公开的至少一个实施例,表征、监测和控制被测发酵过程的方法200包括生成训练数据集、使用该训练数据集来开发化学计量相关模型、验证该模型并将该模型应用于将来生产发酵过程批次运行以表征、监测并控制生产发酵批次。方法200可以包括通过使用拉曼系统100来在发酵过程期间的不同时间点从发酵罐(例如,图1的发酵罐容器110)光谱上收集原始拉曼光谱的统计上大的在线过程光谱测量结果集来生成训练数据集。包括训练数据集的过程测量结果包括在发酵过程期间在发酵罐内的过程的组成部分(包括要在将来批次中预测的分析物特性和组成)的光谱变化。分析物中的变化使得能够开发出能够在将在将来批次运行中测量的范围内准确地且精确地预测将来分析物特性和组成的鲁棒模型。可以通过促进与离线测量结果相关来给在线过程测量结果加时间戳。可以使用预先测定的总采集时间量来捕获在线过程测量结果,该预先测定的总采集时间量被选择来生成足以产生所需要的测量准确度和精度的信噪比。

发酵批次之间的自然变化导致在拉曼暴露期间采集的拉曼信号和自发荧光信号两者中的绝对差。例如,葡萄品种与生长条件之间的变化创造发酵过程的葡萄汁输入中的不同糖分的浓度变化。由于这种自然变化,步骤202可能需要在发酵批次的在线采样期间动态地调整拉曼光谱暴露以得到优化值。此外,拉曼模型的精度取决于训练数据集内的拉曼光谱数据的质量。为了产生对一组给定要求来说精确的数据,可以使拉曼信号最大化(达到一个点),然而减小该测量结果的噪声 (达到一个点)以便提供足够的信噪比(S/N比)。拉曼绝对信号与总采集时间线性地有关,该总采集时间被定义为从一个或多个暴露中构建一个单独的拉曼光谱时的总采集时间量。常规经验法则指示操作员选择足够长的暴露时间,以考虑到被测种类(例如,分析物)的变化率(有时称作“时间误差”)提供足够的信噪比。为了减小来自拉曼模型的预测值的时间误差,应该在发酵罐内的被测分析物的各种变化率附近优化所选择的总采集时间,因为知道拉曼分析在整个测量时间期间对预测值具有平均效果。在考虑到所期望的精度测定并鉴于被测分析物的变化率优化了暴露和总采集时间设定之后,捕获变化的在线过程光谱测量结果被取得和分析以开发模型。

取决于拉曼方法的要求,在至少一个实施例中,统计上大的过程样品集可以包括发酵过程的各种独立样品以使得一个人能够预测过程值,其中建模量和效果对于在该时间点的“真实”接受值而言小于10%相对误差。在其他实施例中,统计上大的过程样品集可以包括过程的足够独立的样品以使得一个人能够断定建模量和效果中的变化处于 5%相对误差或以下。

方法200可以包括在发酵过程期间(例如,从发酵容器100)采集物理样品并且使用照惯例用于产生这些值的离线化验测量结果设备来对分析物特性和/或组成执行离线测量的步骤204,所述离线化验测量结果设备包括本文描述的那些现有技术(例如,非拉曼)设备和装置。作为非限制性示例,可以随着过程进行在2-4天的过程中每两小时从发酵过程批次采集物理样品。在至少一个实施例中,可以调节物理样品以中止发酵过程以便维持在从发酵罐100取得样品时存在的特性和组成。例如,可以从发酵罐100取得样品并将其放置在离心机中或以其他方式过滤以使活性酵母与其他组成部分分开,从而停止样品的发酵过程。作为另一个示例,可以将样品冷藏和冷冻以停止发酵过程,直到执行了离线化验测量结果为止。在至少一个实施例中,在收集步骤202的在线过程光谱测量结果时或附近从发酵过程取得物理样品。在至少一个实施例中,可以与步骤204的物理样品同时地收集步骤202 的在线过程光谱测量结果。来自步骤204的数据被添加到训练数据集。

根据本公开的至少一个实施例,方法200可以包括在采集在线光谱之前或之后从物理样品的预定集采集离线拉曼光谱的步骤206。在一个实施例中,当在线收集的物理样品缺少鲁棒预测过程变量模型所需的变化时,可以执行步骤206。所选择的物理样品应该在关键过程变量 (例如,分析物特性和/或组成)中的至少一个或多个中具有变化,对于这些关键过程变量,拉曼分析将被用于生产发酵过程期间的实时监测。离线光谱可以来自先前发酵中各个时间点的样品保留物。样品保留物包括从过去发酵批次取得并进行调节以供储存的物理样品。此类样品保留物提供过去批次的记录。可以将来自步骤206的数据添加到训练数据集。

替换地、附加地或任选地,在一个实施例中,方法200可以包括准备(例如,配制)实验样品并采集实验样品的离线拉曼光谱和离线化验测量结果的步骤208。例如,可以通过调整所选样品保留物内的种类的特性或组成来创建实验样品,照惯例称为“掺加”。这种调整可以包括增加或减少感兴趣分析物的存在或浓度。在至少一个实施例中,调整样品保留物可以遵循预定实验设计(DoE),其中所选过程变量(例如,分析物浓度)被有目的地且具体地设定为预定值以统计地控制实验样品的变化,从而测定变化的相对影响,包括相关影响。掺加可以用于扩展统计模型的范围,以帮助减轻发酵罐中的种类之间的拉曼信号协方差,并且通过使用预先测定的总采集时间量来放大拉曼信号方差以便与各个离线化验值相关来协助建模,该预先测定的总采集时间量被选择来生成足以产生所需要的测量准确度和精度的信噪比。来自步骤208的数据可以被添加到训练数据集。

方法200还包括对拉曼光谱训练数据集应用光谱预处理以使跨拉曼光谱的非有关种类和特性(例如,来自不感兴趣的种类/分析物)的非相关和协变光谱变化)最小化然而同时放大由于重要性的过程变量 (例如,目标分析物)而导致的相关变化的步骤210。光谱预处理可以包括对训练数据集的数学操纵以增加感兴趣分析物的特定特性或特性集的光谱变化。在一个实施例中,执行一系列优化以为特定发酵过程鉴别最佳预处理算法。光谱预处理可以包括能够从数据集变化到数据集但是可以遵循本领域的技术人员已知的一系列规则和标准数学工具的一系列过程。

方法200的步骤212包括测定是使用单变量建模方法学还是多变量建模方法学并且应用所选择的方法学来生成相关模型,该相关模型使用常规技术来使来自步骤202的预处理拉曼光谱数据采集(例如,光谱变化)中的光谱变化(例如,峰和谷)与在来自步骤204的离线化验测量结果的值中观察到的变化相关。例如,发酵过程分析物组成部分系统的复杂性、数据内的拉曼分析物峰的质量和/或光谱峰重叠的程度可以测定选择哪一种建模方法学。由于发酵光谱的内在复杂性,相对于单变量技术可以更经常应用多变量统计建模技术。步骤212包括计算训练数据集的预处理拉曼光谱数据与来自离线化验测量结果的线性相关性和/或非线性相关性以对感兴趣分析物进行建模。在一个实施例中,除了步骤202的光谱数据之外,还可以将所选择的方法学应用于步骤206的离线拉曼光谱数据采集。取决于拉曼光谱数据和离线化验测量结果的范围,相关模型可以包括一种或多种感兴趣分析物。在一个示例性实施例中,为每种感兴趣分析物生成单独的相关模型。在这样的实施例中,可以将每个单独的模型应用于相同的预处理拉曼光谱数据。在另一个实施例中,可以使用取决于给定目标分析物并被选择来相对于目标分析物优化光谱数据的质量的不同条件来采集原始光谱拉曼数据。

当统计上代表性量的拉曼光谱数据被捕获并与离线化验测量结果值时间匹配时,形成鲁棒相关性,对于这些鲁棒相关性,能够在使用本公开的方法来监测过程时做出将来预测。相关模型的鲁棒性受到训练数据集影响,并且例如,达到训练数据集包括足够不同的光谱化验组合以从发酵过程的开始到结束捕获发酵罐内的化学、物理和组成变化的范围的程度。如本文所描述的,只要样品表示发酵罐内的条件,就能够经由自然和/或人工手段(例如,使用步骤208)来捕获这种变化。

方法200的步骤214包括使用建模统计来迭代地细化相关模型以增强拉曼光谱与离线化验测量结果值的相关性和/或减小相关模型中的噪声、偏差和/或其他不想要的伪像。例如,可以使用统计曲线来细化相关模型,这些统计曲线示出从拉曼预测余留的相对光谱残差和浓度残差两者。此外,可以利用在预测值的(建模)空间对(建模)空间外误差中显示的曲线。

步骤214还可以包括通过对一个或多个发酵过程重复至少步骤 202和204来验证相关模型并且评估相关模型是否是足够预测性的。在这样的实施例中,从发酵过程采集验证拉曼光谱并与所对应的验证离线化验测量结果进行比较。不需要准备单独的训练数据集(例如,“验证”训练数据集)。在另一个实施例中,可以将来自步骤214的验证拉曼光谱和所对应的离线化验测量结果添加到训练数据集和方法200的剩余步骤以进一步细化和改进相关模型的鲁棒性。例如,当验证拉曼光谱除了包括存在于训练数据集中的变化之外还包括感兴趣分析物中的变化时,可以更新训练数据集并细化相关模型以包括那些变化和对其进行建模,从而改进相关模型的鲁棒性。

方法200还可以包括将相关模型应用于来自将来发酵批次的后续在线和/或离线数据集以便使用拉曼系统100来根据从进行中的将来发酵过程收集的实时拉曼光谱数据定性地和/或定量地预测感兴趣分析物值(例如,特性和/或组成)的步骤216。在本公开的上下文中,“预测”是使用相关模型来根据在线拉曼分析测量结果转换拉曼光谱数据以估计或预测感兴趣分析物的特性(例如,化学、物理和/或组成特性)的真实值。在一个实施例中,预测的分析物值可以用于实时地监测发酵过程,而无需离线测量结果(例如,通过拉曼分析或化验测量结果) 来向操作员或过程控制系统报警分析物值已偏离期望范围(例如,随着时间的推移基于阈值极限)。在这样的实施例中,步骤216可以包括使用拉曼系统100来生成信号、警报或报告给过程控制系统的操作员。步骤216还可以包括执行动作以校正或补偿分析物值偏差或者基于所生成的警报中止发酵过程。本领域的技术人员能够基于所预测的分析物值标识可以执行的其他动作,并且此类动作在本公开的范围内。

本公开的方法200能够提供关于发酵过程的实时信息,从而使得能够例如经由反馈回路步骤进行立即调整,以在任一个偏离期望或计划轨迹的情况下校正组成部分的特性和/或值,这能够降低成本和/或改进生产质量。附加地,在特定批次结束时将知道组成部分的特性和/或值(至少作为集合体),使得不需要执行附加离线测量结果(例如,质量控制检查),从而进一步降低成本。

在发酵过程期间,使用本公开的方法,应该将拉曼光谱的采集设定为总采集时间,以便在预处理和建模之后相对于一个预测的或一组预测的化学或物理测量结果提供一定水平的精度,而不论使用了单变量方法学还是多变量方法学。取决于与给定特性相关联的信号的强度并取决于光谱中有关波长位置处光谱内的噪声,每个拉曼光谱包含从这些化学、物理和组成特性到各种信噪比的若干光谱特征图。一旦应用了光谱预处理,如在步骤210中一样,然后就使信号与在数据集内在每种特性中发生的变化相关。

化学计量建模常常可能受到正在监测的过程的规模影响。然而,能够开发基于从一个或多个不同规模的生物反应器培养物获得的拉曼光谱数据的规模无关多变量模型,使得基于在测试规模(例如,基准和/或中试规模)下获得的拉曼光谱数据的模型在较大的制造规模(例如,1000L或更大)环境下准确且精确(参见例如US 10563163)。同样地,能够开发基于来自一个或多个不同规模的发酵过程的拉曼光谱数据的准确且精确的规模无关多变量模型。使用较小规模测试反应器的模型开发通常较快且成本更低,从而允许以较低的成本对更多的参数进行测试和建模。通过基于跨多个不同规模的发酵过程获得的拉曼光谱数据开发多变量模型,跨包括制造规模的一系列规模准确地测定关键过程参数是实用的。

本公开的系统和方法已被应用于制造规模的生产葡萄酒生产过程中的葡萄汁发酵。因此,申请人已测定了在预处理之后,能够使用本文公开的拉曼系统100和方法200的实施例来在发酵过程的原位测量期间实时地测定若干关键分析物,包括乙醇、果糖、葡萄糖、白利糖度、NOPA、pH、氨、酒石酸、苹果酸、总酸度、柠檬酸、乙酸、葡萄糖酸、乳酸、甘油、pH、二氧化硫和多酚含量。然而,受益于本公开的本领域的技术人员将认识到其他分析物是可能的。所得的相关模型使用适用于一个和/或所有葡萄品种的通用基础模型来针对多个葡萄酒品种—霞多丽、梅洛、雷司令和黑比诺—在多个发酵批次之上演示了足够的相关性。相关模型的相关性使用如测定系数(R

图3和图4示出使用拉曼系统100来在葡萄汁的发酵过程的若干批次过程中采集的原始和预处理拉曼光谱的示例。图3呈现其中每条曲线的灰度阴影随着时间的推移而呈现给定批次的原始拉曼光谱数据。图4再次呈现其中每条曲线的灰度阴影随着时间的推移而呈现给定批次的预处理拉曼光谱数据。每10分钟采集的原始光谱数据包含批次内(在每个具体时间点)捕获的分析物信息以及来自存在于过程中的其他来源的不想要的变化两者的原始光谱变化。为了使包括感兴趣分析物的期望组成信息的感兴趣分子特征图隔离和相关联,执行了光谱预处理以去除不想要的变化并且随着批次演变放大拉曼光谱内包含的分析物的光谱特征图。预处理光谱的光谱变化(即,峰和谷)指示分析物浓度的变化。

作为示例,对包含多个成分光谱特征图的图4的预处理光谱执行了多变量PLS分析,以提取每种具体感兴趣分析物。在此示例中,PLS 算法被配置成统计地将来自已知乙醇浓度值的变化(例如,从如本文所描述的离线化验采集)与在线拉曼光谱变化进行比较,并且进一步地,测定在两个变化之间存在强相关性。PLS算法被配置成将变化解构成相关度量,这些相关度量被标绘来标识关系并测定和/或评估基础模型的质量。图5示出使用经验证的相关模型对离线化验值与预测值之间的乙醇浓度的线性回归。如图5所示,跨乙醇浓度的范围的预测精度或误差基本上为零,从而具有0.974或大约1.0的测定系数(R

尽管发酵过程是成品葡萄酒的性质和质量的一个贡献者,但是可以将拉曼系统100和方法200应用于葡萄酒酿造过程的任何阶段,如图6中示意性地所示的。例如,能够应用拉曼系统100来评估葡萄本身—在收获前或收获后的藤上的特性。此外,能够应用拉曼系统100 来表征输入发酵葡萄汁的多个批次的特性以促进葡萄酒的混合。另外,能够将拉曼系统100应用于葡萄酒的稳定、陈化和过滤的阶段以在装瓶和最终包装之前和之后监测其特性和质量。在每个阶段,可以使用方法200的实施例来开发相关模型以通过在该阶段采集拉曼光谱并使所采集的拉曼光谱与离线化验测量结果和/或与已知标准样品相关联来对在目标阶段的过程进行建模,如本文在发酵过程的上下文中所描述的。因此,在每个阶段,可以基于来自每个阶段的在线监测的实时预测值来采取校正动作以改进质量,避免批次损失并降低整个葡萄酒酿造过程的总成本。

虽然已在本文中相当详细地描述了拉曼光谱分析系统以及生成化学计量模型以便使用该拉曼光谱分析系统的方法的各种实施例,但是这些实施例仅仅作为本文描述的本公开的非限制性示例被提供。因此应理解,在不脱离本公开的范围的情况下,可以做出各种变化和修改,并且等同物可以取代其要素。本公开不旨在为详尽的或者限制本公开的主题的范围。

另外,在描述代表性实施例时,本公开可能已将方法和/或过程呈现为步骤的特定序列。然而,就方法或过程不依靠本文阐述的步骤的特定次序而论,方法或过程不应该限于所描述的步骤的特定序列。步骤的其他序列是可能的,因此保持在本公开的范围内。

相关技术
  • 使用拉曼光谱法实时监测葡萄酒发酵特性
  • 使用拉曼光谱法自动控制细胞培养
技术分类

06120113214495