掌桥专利:专业的专利平台
掌桥专利
首页

识别地下钻井设备的操作异常

文献发布时间:2024-01-17 01:26:37


识别地下钻井设备的操作异常

相关申请的交叉引用

本申请要求于2020年12月18日提交且名为“Similarity and AnomalyRecognition in Drilling Operations”的美国临时申请号63/199,293的权益,所述申请特此以引用的方式整体并入本文。

技术背景

近年来,在提取和识别与地下钻井相关联的操作性能数据方面取得了重大改进。不幸的是,用于识别操作异常的常规系统仍然存在许多问题。例如,常规的钻井异常系统实施关键性能指标或钻井操作过程的具有低可解释性的其他综合量度。此外,某些常规的钻井异常系统不能进行实时异常识别。此外,一些常规的钻井异常系统促成了对某些可能看起来异常但实际上并非异常的钻井参数的选择性(和主观性)审查。

举例来说,常规的钻井异常系统可测量钻井操作过程,但这些系统往往无法以提供建设性反馈以改进所测量的过程的方式来测量钻井操作过程。例如,常规的钻井异常系统使用关键性能指标(或其他综合量度)。然而,这些指标往往是其自身的平均值或其他统计值,现场人员很难解释和/或针对特定的钻井操作过程制定改进计划。因此,关键性能指标往往被认为过于模糊/复杂而难以理解。诸如直方图的其他替代方案同样无法提供用于改进所测量的钻井操作过程的有效机制。

除了缺乏可解释性之外,常规的钻井异常系统在实时现场操作中往往没有多大用处。例如,一些常规的钻井异常系统使用关键性能指标或随时间推移而聚合钻井操作数据的其他量度。因此,此类常规的钻井异常系统通常不能在异常钻井操作过程发生时识别它们,因为关键性能指标仍然(总体上)在公差或可接受的范围内。因此,常规的钻井异常系统以降低的准确性和实时有效性操作。

部分地基于前述缺陷,一些常规的钻井异常系统促成了对某些钻井参数的选择性(和主观性)审查。例如,现场的钻井工程师可相对于钻井时段的历史汇总对一个或多个钻井参数的钻井时段平均值进行钻井时段后审查。此类手动方法往往无法产生准确的结果。事实上,识别出的异常很少是真正的异常,并且感知到的正常数据不一定是正常的。这些常见的不符之处是由于无数不同的变量造成的,仅凭观察和人类心智实际上无法以任何一致的准确度捕捉所述变量。事实上,各种钻井参数(例如,大钩载荷、滑车位置、每分钟转数、泵流速、钻进速度等)、钻机状态(例如,连接前活动、连接活动和连接后活动)、情境数据(例如,钻井操作员、日期和时间、地质构造、钻井量度、底部钻具组件、钻井液等)和其他影响因素之间的复杂的相互作用超出了人类心智所能评估的智力能力—更不用说确定异常了。

发明内容

本公开的各方面可包括动态地利用特征提取模型来确定时间序列钻井数据中的行为异常的方法、计算机可读介质和系统。特别地,所公开的系统将时间序列钻井数据分区为类似的活动,诸如连接前活动、连接活动和旋转钻井。从分区的数据中,所公开的系统使用特征提取模型提取特征集合。这种特征集合包括例如游动滑车的最大或最小速度(和/或加速度)、最大和最小滑车高度、上下移动的总滑车时间等。在一个或多个实施方案中,所公开的系统确定每个特征的对应的概率密度函数。随后,所公开的系统基于满足异常阈值的一个或多个特征的最小概率而确定异常。

在以下描述中概括了本公开的一个或多个实施方案的附加特征和优点。

附图说明

具体实施方式通过使用附图提供了具有附加特殊性和细节的一个或多个实施方案,如下文简要描述的。

图1示出了根据一个或多个实施方案的用于实施异常检测系统的计算系统环境。

图2示出了根据一个或多个实施方案的确定操作异常的钻井优化模型的概览。

图3示出了根据一个或多个实施方案的识别操作异常的异常检测系统。

图4A至图4B示出了根据一个或多个实施方案的识别操作异常并呈现异常可视化以供显示的异常检测系统。

图5A至图5B示出了根据一个或多个实施方案的提供与操作特征的聚类相关的一个或多个图形用户界面以供显示的异常检测系统。

图6A至图6C示出了根据一个或多个实施方案的实施异常检测系统以生成异常可视化的实验结果。

图7A至图7C示出了根据一个或多个实施方案的在计算装置上提供图形用户界面以用于查看操作特征和异常可视化并与之交互的异常检测系统。

图8示出了根据一个或多个实施方案的异常检测系统的示例示意图。

图9示出了根据一个或多个实施方案的用于识别地下钻井设备的操作异常的一系列动作的流程图。

图10示出了用于实施本公开的一个或多个实施方案的示例计算装置的框图。

具体实施方式

本文描述的一个或多个实施方案包括一种异常检测系统,所述异常检测系统结合钻机状态一起选择性地利用提取的时间序列数据的操作特征来识别异常并且呈现解释所识别的异常的图形表示。例如,在一个或多个实施方案中,异常检测系统使用对应于大钩载荷、滑车位置、每分钟转数或泵流速中的至少一者的传感器数据。然后,异常检测系统基于钻机状态及其时间跨度而对传感器数据进行分区。在某些实施方案中,异常检测系统使用分区的数据来提取操作特征并且确定相应的特征直方图。另外,在一个或多个实施方案中,异常检测系统将特征直方图转换为连续概率数据集以估计特征概率。基于估计的特征概率,异常检测系统可呈现异常可视化以在图形用户界面内显示,所述异常可视化指示识别的异常和导致所识别的异常的一个或多个操作特征。

正如刚才所提及,异常检测系统识别地下钻井设备的时间序列数据并且对所述时间序列数据进行分区。时间序列数据对应于来自跟踪地下钻井设备的操作的传感器的各种不同的传感器数据(例如,表面传感器数据)。在一个或多个实施方案中,异常检测系统针对诸如连接前活动、连接活动和连接后活动的特定钻机状态(或操作状态)将时间序列数据分区为一个或多个粒度级别。另外地或替代地,异常检测系统基于诸如钻井操作员、日期和时间、地质构造、底部钻具组件、钻井液的情境数据而对时间序列数据进行分区。更进一步地,异常检测系统可基于诸如扭矩、钻压和钻进速度的一个或多个钻井量度而对时间序列数据进行分区。

在某些实施方案中,异常检测系统使用分区的数据来提取操作特征。在特定的实施方案中,异常检测系统通过对分区的时间序列数据进行滤波来提取操作特征。在某些实施方式中,异常检测系统使用零滞后高斯差滤波器来估计特征信号,诸如针对不同操作特征的速度和加速度值。游动滑车的示例操作特征包括在时间x处的最大向上速度、最大向下加速度和向上到向下计数。应当了解,异常检测系统可以诸如直方图的离散数据集的形式表示操作特征的特征信号。

在一个或多个实施方案中,异常检测系统将估计的特征信号(例如,呈离散数据集的形式)转换为对应的概率密度函数。在特定的实施方案中,异常检测系统使用非参数模型(例如,Parzen窗模型)来生成概率密度函数。基于概率密度函数,异常检测系统确定每个操作特征的特征概率。

如果特征概率满足异常阈值,则异常检测系统确定所述操作特征异常。例如,在某些实施方式中,异常检测系统根据操作特征的概率值对所述操作特征进行排名。如果最低概率值小于异常阈值,则异常检测系统确定对应的一组时间序列数据异常。另外地或替代地,异常检测系统将异常阈值与操作特征的每个概率值进行比较以确定操作特征是否是异常。

此外,异常检测系统提供异常可视化以在图形用户界面内显示。在特定的实施方案中,异常可视化包括时间序列数据异常的指示。但在更细粒度的级别上,异常可视化还包括关于时间序列数据为什么异常的指示。具体地说,异常检测系统生成异常可视化,所述异常可视化包括哪些操作特征满足异常阈值,并且因此异常。例如,异常可视化包括异常操作特征的纯文本描述和/或异常操作特征的图形表示。

在一个或多个实施方案中,异常检测系统还提供时间序列数据的交互式图形表示。在特定的实施方案中,此类并入有特征曲线的聚类的交互式图形表示有助于特征工程和/或验证从分区的数据中提取的特征。举例来说,这些交互式图形表示显示了异常检测系统如何动态地确定异常并且基于可调整的(例如,可滑动的)异常阈值而更新特征曲线的聚类。

如上所述,常规的钻井异常系统存在许多问题。相比之下,异常检测系统可提供优于此类常规的钻井异常系统的各种优点。例如,异常检测系统可识别时间序列数据内的异常,并且此外,以可容易解释的方式指示所识别的异常。举例来说,异常检测系统从时间序列数据中提取操作特征并且提供异常可视化,所述异常可视化图形地描绘哪些操作特征导致异常及其原因。在一个或多个实施方案中,异常检测系统进一步提供交互式特征曲线的聚类,所述交互式特征曲线的聚类视觉地显示异常如何响应于用户交互(例如,异常阈值滑块的调整)而改变。

更进一步的是,异常检测系统相对于直接从时间序列数据聚类的一些钻井异常系统可提高可解释性。实际上,由于将远离聚类中心的样本解释为异常,一些钻井异常系统的这种方法可能会导致正误识。特别地,远离这些聚类中心的此类样本仍然可为“常见”采样或曲线和/或可能不直接表示异常。因此,异常检测系统相较于此类系统提高了可解释性,因为异常检测系统利用基于特征的方法,在所述方法中,聚类是基于提取的操作特征—而不是直接来自时间序列数据。因此,通过在特征级别上进行聚类,异常检测系统可提高聚类表示的准确性,并且进而提高其解释的稳定性。

同样地,异常检测系统可提高所实施的计算装置的操作灵活性,以利用可变长度和/或维度的时间序列数据。事实上,某些钻井异常系统在利用不同长度的时间序列数据时会遇到重大的准确性和聚类表示问题(例如,因为机器学习模型往往无法准确地在矩阵内组织不同长度的时间序列数据)。相比之下,异常检测系统使用基于特征的使得严格的输入约束变得毫无意义的方法。此外,通过避开曲线长度约束,异常检测系统可更灵活(且更准确)地表示异常事件。

除了提高可解释性和灵活性之外,异常检测系统还被配置为以批处理模式或实时模式识别异常。例如,与常规的钻井异常系统不同,本公开的异常检测系统可在异常检测系统接收到对应于一个或多个传感器的传感器数据时实时地识别异常时间序列数据。特别地,异常检测系统可基于对操作特征识别的特征信号而即时地生成特征概率。然后,异常检测系统可将特征概率与异常阈值进行比较以识别异常。进而,异常检测系统可在异常钻井操作期间以及实时(或接近实时)地呈现指示异常的异常可视化。

如前面的讨论所说明,本公开利用各种术语来描述异常检测系统的特征和益处。现在提供关于这些术语的含义的附加细节。例如,如本文所用,术语“时间序列数据”是指对应于地下钻井设备的钻井数据。在特定的实施方案中,时间序列数据包括跟踪地下钻井设备的操作的传感器的带时间戳的传感器数据。时间序列数据的示例包括大钩载荷、滑车位置、每分钟转数、泵流速、压力、扭矩等的测量值。

相关地,术语“地下钻井设备”是指用于在地质环境中执行钻井或勘探的一个或多个装置或部件。在特定的实施方案中,地下钻井设备可包括用于感测、钻井、注入、提取、压裂、起下钻管或与钻井、地质表面(或地下)、海洋/湖泊环境或地下水库相关的其他操作的装置或部件。地下钻井设备的一些示例包括游动滑车、钻柱、钻头、方钻杆滚子补心、旋转台、立管和泥浆泵。

同样如本文所用,术语“特征提取模型”是指呈用于确定操作特征的启发法、滤波器、算法或机器学习模型中的一种或多种形式的计算机可执行指令。在特定的实施方案中,特征提取模型根据时间、操作状态、情境数据和/或其他可分区的数据桶来为时间序列数据生成特征信号(例如,速度、加速度、时间、位置、方向、范围、计数等)。例如,特征提取模型包括零滞后高斯差(ZL-DoG)滤波器或高斯差(DoG)滤波器。

如本文进一步所用,术语“操作特征”是指特征信号的元素、性质或属性。在特定的实施方案中,操作特征包括特征信号的曲线特性。例如,游动滑车的操作特征包括在时间x处的最大向上速度、主要静止时间、最小高度、总方向变化计数、持续时间、总向下时间、最大向上加速度等。

另外,如本文所用,术语“异常”或“操作异常”是指时间序列数据的异常。在特定的实施方案中,异常包括由于对应于满足异常阈值(例如,非异常数据的最小概率值)的特征概率的一个或多个操作特征而造成的时间序列数据的异常值。此外,应当了解,异常阈值是可调整的和/或被配置为供用户定制。因此,异常不限于时间序列数据的特定子集。

同样如本文所用,术语“特征概率”是指给定操作特征对应于某个值的概率或估计的可能性。在特定的实施方案中,特征概率包括基于概率密度函数的估计的概率值。例如,在时间313秒处的最大向上速度的操作特征可对应于2.51%的特征概率,而5.72米的最小高度的另一个操作特征可对应于86.02%的特征概率。

此外,如本文所用,术语“操作状态”是指钻机状态。在特定的实施方案中,操作状态定义在给定时间点处正在进行的钻井操作的类别。例如,操作状态包括连接前活动(例如,其涉及钻孔排碴、将钻柱移动到连接点以及停止旋转和泵)。另外,例如,操作状态包括连接活动(例如,其涉及组装钻柱)。此外,操作状态可包括连接后活动(例如,其涉及钻井、起下钻管和/或从移除卡瓦直到钻头接触井底所发生的过程)。具体地说,连接后活动可包括启动泵、进行调查、确保底部钻具组件畅通无阻、开始旋转、重新设置钻压和下井。

如本文所用,术语“异常可视化”是指异常的图形表示。在特定的实施方案中,异常可视化可包括被识别为异常的每个操作特征的纯文本描述(例如,基于文本的通知、列表、解释或标识)。另外地或替代地,异常可视化可包括被识别为异常的操作特征的对应的特征概率。在某些情况下,异常可视化包括指示操作特征的正常或可接受的值与操作特征的给定异常值之间的差异的图表、图形或其他视觉表示。在一个或多个实施方案中,异常可视化还包括交互式部件。举例来说,异常可视化可包括在图形用户界面内形成一个或多个聚类的操作特征曲线(例如,特征信号的多维特征表示),诸如二维或三维T-SNE图。

同样如本文所用,术语“情境数据”是指为时间序列数据提供情境的钻井操作变量。例如,情境数据包括钻井操作员、日期和时间、地质构造、底部钻具组件、钻井液、钻井(或井编号)、油田或油藏标识符、全球定位坐标、国家(和/或省、州或县)等。情境数据的附加示例包括钻井量度或性能量度,诸如钻压、扭矩、立管压力、每分钟转数、钻进速度、狗腿严重度、效率/成本量度、安全/风险级别等。更进一步地,情境数据的其他示例可包括涉及钻井相关事件、事故或时间跨度的钻井事件。举例来说,作为钻井事件的情境数据可包括钻机非生产时间、起下钻头、扭断、泥浆马达故障、旋转导向系统故障、随钻测量故障、表面等待、井筒不稳定、井下工具故障、井眼缩径、涌流、卡钻、气体、丢失循环等。替代地,情境数据可包括一个或多个钻井事件发生的风险或概率。

如本文所用,术语“非参数模型”是指用于确定概率密度函数的计算机模型。非参数模型的示例包括用于密度估计的机器学习模型,诸如决策树、k最近邻分类器或核回归。在某些实施方式中,非参数模型包括Parzen窗方法(例如,如在以下项中所描述:SebastianRaschka,Kernel Density Estimation Via The Parzen-Rosenblatt Window Method,(2014年6月19日),存档于sebastianraschka.com/Articles/2014_kernel_density_est.html,(下文称为“Raschka”),所述文献的内容明确以引用的方式并入本文)。

现在将相对于绘示示例实施方案和实施方式的说明性附图提供关于异常检测系统的附加细节。例如,图1示出了根据一个或多个实施方案的用于实施异常检测系统104的计算系统环境(或“环境”)100。如图1所示,环境100包括服务器102、可选的第三方服务器106、客户端装置108和网络112。环境100的每个部件都可经由网络112来通信,并且网络112可为计算装置可通过其通信的任何合适的网络。下文相对于图10更详细地讨论了示例网络。

如图1所示,环境100包括客户端装置108。客户端装置108可为各种计算装置中的一种,包括智能手机、平板电脑、智能电视、台式计算机、膝上型计算机、虚拟现实装置、增强现实装置或如相对于图10所描述的其他计算装置。尽管图1示出了单个客户端装置108,但在某些实施方案中,环境100包括多个客户端装置108。客户端装置108还可经由网络112与服务器102通信。例如,客户端装置108可接收用户输入并且向服务器102提供与用户输入有关(例如,与调整异常阈值相关)的信息。

如图所示,客户端装置108包括对应的客户端应用程序110。特别地,客户端应用程序110可为web应用程序、安装在客户端装置108上的本机应用程序(例如,移动应用程序、桌面应用程序等)、或者由服务器102执行部分功能的基于云的应用程序。客户端应用程序110可向与客户端装置108相关联的用户呈现或显示信息,包括对一个或多个用户输入进行响应的信息。例如,异常检测系统104可指示客户端应用程序110在客户端装置108的用户界面处显示异常可视化,所述异常可视化描绘对应于从时间序列数据中提取的特定操作特征的异常。在一个或多个实施方案中,用户还可与客户端应用程序110交互以查看或修改操作特征曲线的聚类。

如所提及,环境100可选地包括第三方服务器106。第三方服务器106可包括如相对于图10所描述的各种计算装置。在某些实施方案中,第三方服务器106可收集、存储、传输或转发对应于与地下钻井设备相关联的一个或多个传感器的传感器数据。在另外或替代的实施方案中,第三方服务器106生成和/或存储在一个或多个地理区域中的观测到的钻井的钻井数据。例如,第三方服务器106可包括现场数据库(例如,具有一个或多个油田的所有钻井的钻井数据),异常检测系统104可从所述现场数据库检索和/或请求数据。尽管图1示出了单个第三方服务器106,但在特定的实施方案中,环境100可包括多个不同的第三方服务器106。此外,第三方服务器106可经由网络112与服务器102或多个客户端装置通信。

如图1所示,环境100包括服务器102。在一些实施方案中,服务器102包括内容服务器和/或数据收集服务器。服务器102还可包括应用服务器、通信服务器、web托管服务器、社交网络服务器或数字内容管理服务器。

在特定的实施方案中,服务器102识别地下钻井设备的时间序列数据。另外,服务器102可生成定义地下钻井设备随时间推移而进行的操作的操作特征(例如,通过利用特征提取模型和时间序列数据来进行)。此外,服务器102可生成操作特征的特征概率。进而,服务器102基于操作特征的特征概率而识别地下钻井设备的操作的异常。

尽管图1描绘了位于服务器102上的异常检测系统104,但在一些实施方案中,异常检测系统104可由环境100的一个或多个其他部件实施(例如,通过完全或部分位于一个或多个其他部件处来实施)。例如,异常检测系统104可由客户端装置108、第三方服务器106和/或另一个合适的装置来实施。

在某些实施方案中,尽管未在图1中示出,但环境100可具有不同的部件布置和/或可完全具有不同数量或组的部件。例如,客户端装置108和/或第三方服务器106可绕过网络112直接与异常检测系统104通信。

如上所述,异常检测系统104可有效且更灵活地确定时间序列数据中的操作异常。在更广泛的层面上,这种异常检测可通过加快井建设学习速率并提高钻井操作一致性来改进钻井优化模型。例如,异常检测支持钻井优化模型来自动地测量情境化的无形损失时间并使所述无形损失时间可视化,并且提出纠正措施。此外,如本文所公开的异常检测提供具有特征提取的钻井优化模型以实现程序遵守合规性和最佳操作过程的标准化。此外,异常检测支持钻井优化模型,所述钻井优化模型提供综合井建设干预、某些操作状态的反馈策略以及钻井优化工作流程的远程监控(例如,用于综合井建设)。根据一个或多个此类实施方案,图2示出了确定操作异常的钻井优化模型的概览。

例如,如图2所示,钻井优化模型206识别时间序列数据202。在一个或多个实施方案中,时间序列数据202包括为一个或多个钻井操作提供操作粒度的高频钻井。例如,时间序列数据202包括对应于跟踪地下钻井设备的操作的一个或多个传感器的原始传感器数据。

另外显示,钻井优化模型206识别情境数据204,诸如每日钻井报告(DDR)。例如,情境数据204可包括报告日期、报告编号、井名称或标识符(例如,美国石油协会编号)、工作名称、承包商信息、拨款授权编号、油田或地理区域、租赁信息、海拔、旋转方钻杆衬套(例如,方钻杆衬套距地面层的高度)、开钻日期、距开钻天数、测量深度、实际竖直深度、24小时进尺(例如,相对于前一天的测量深度的差异)、钻井小时数、当前操作、值班操作员、计划活动或操作状态等。应当理解,情境数据204可包括无数其他元素,诸如底部钻具组件、钻井液、地质构造等。

基于时间序列数据202和情境数据204,钻井优化模型206利用一个或多个引擎或计算机模型来执行一系列动作。例如,分区引擎208将时间序列数据202拆分成各种数据桶。举例来说,分区引擎208根据情境数据204的一个或多个类别,诸如操作状态、底部钻具组件或套管柱来拆分时间序列数据202。

基于分区的时间序列数据,特征提取模型210确定描述一个或多个钻井操作的各方面的各种操作特征。例如,特征提取模型210基于如速度、加速度、时间、位置、方向、范围、计数等特征信号而确定操作特征。此类操作特征(例如,对于游动滑车)的示例包括在时间x处的最大向上速度、主要静止时间、最小高度、总方向变化计数、持续时间、总向下时间、最大向上加速度等。

针对提取的操作特征中的每一个,异常检测模型212确定特征概率。随后,异常检测模型212使用特征概率来确定操作异常218。在特定的实施方案中,异常检测模型212使用强化事件(p≥ε)较为常见,而罕见事件(p<ε)构成异常的方法(例如,常见配置中的堆叠操作特征曲线相对于不常见配置中的异常值特征曲线)。例如,异常检测模型212通过将特征概率与异常阈值进行比较来确定操作异常218。基于满足异常阈值的一个或多个特征概率,异常检测模型212可确定时间序列数据202的一部分对应于操作异常。此外,如下文将描述的,异常检测模型212通过指示哪些操作特征导致操作异常来识别操作异常218。

在图2中还显示,时间序列聚类引擎214使用提取的特征来生成表示一个或多个特征信号的操作特征曲线的聚类。在特定的实施方案中,时间序列聚类引擎214确定操作特征曲线的聚类的数量。另外,在一个或多个实施方案中,时间序列聚类引擎214基于被识别为异常的操作特征而以特定的聚类配置呈现操作特征曲线以供显示。例如,时间序列聚类引擎214生成处于第一颜色的异常操作特征曲线和处于第二颜色的非异常操作特征曲线(例如,以对操作异常218进行用户友好的视觉解释)。在另外或替代的实施方案中,时间序列聚类引擎214通过利用来自时间异常检测模型216的时间异常数据来生成操作特征曲线的聚类。

在一个或多个实施方案中,时间异常检测模型216使用分区的时间序列数据来基于时间和某些统计约束而确定异常。例如,时间异常检测模型216使用基于正常过程变化的上限和下限的过程控制限来根据时间识别异常。作为另一个示例,时间异常检测模型216使用直方图或频率分布来确定分区的时间序列数据的基于时间的异常。

在某些实施方案中,钻井优化模型206生成机会建议220。例如,钻井优化模型206确定由于操作异常218而造成的损失的时间量或损失的机会(例如,损失的收入、损失的钻井时间、可量化的低效率等)。然后,基于损失的时间量或机会,钻井优化模型206确定纠正措施以减少今后的损失的时间量或机会。这些纠正措施可采用建议的形式以停止特定的钻井操作、使特定的钻井操作标准化或对操作员进行特定的钻井操作的培训、更换操作员、使用不同的底部钻具组件、变换钻井液等。

在一个或多个实施方案中,钻井优化模型206生成可视化222。可视化222可包括对应于操作异常218的异常可视化。在其他实施方案中,可视化222包括对应于机会建议220的各种不同图形描绘中的一种或多种。例如,可视化222可包括手指图、过程控制图表或直方图、情境化统计数据或钻井参数。与操作异常218一样,钻井优化模型206也可将可视化222显现给实施的客户端装置的图形用户界面。

如前所述,异常检测系统104可连同异常检测模型一起利用特征提取模型来有效且灵活地识别操作异常。图3示出了根据一个或多个实施方案的识别操作异常的异常检测系统104。例如,在动作302处,异常检测系统104识别地下钻井设备的时间序列数据。特别地,在动作302处,异常检测系统104识别带时间戳的数据或时间顺序数据(例如,其对应于大钩载荷、滑车位置、每分钟转数、泵流速等)。在某些实施方式中,动作302包括识别来自跟踪地下钻井设备的时间顺序数据的一个或多个传感器的传感器数据。例如,当传感器在地下钻井设备操作期间检测或测量某些值时,异常检测系统104可从一个或多个传感器实时地接收原始传感器数据。在其他情况下,异常检测系统104从被指定用于收集和转发传感器数据的第三方服务器实时地(或接近实时地)接收传感器数据。

在动作304处,异常检测系统104生成定义地下钻井设备随时间推移而进行的操作的操作特征。在一个或多个实施方案中,异常检测系统104通过对时间序列数据进行分区(例如,根据操作状态和/或其他情境数据)来生成操作特征。另外,在某些实施方案中,异常检测系统104对时间序列数据进行滤波以估计地下钻井设备的特征信号,如速度、加速度、时间、位置、方向、范围、计数等。此外,异常检测系统104可从估计的特征信号中提取包括特定值或属性的操作特征,诸如在时间x处的最大向上速度、主要静止时间、最小高度、总方向变化计数、持续时间、总向下时间、最大向上加速度等。

在动作306处,异常检测系统104生成操作特征的特征概率。在一个或多个实施方案中,异常检测系统104通过将表示操作特征的离散特征数据(例如,直方图)转换成用于概率估计的连续数据来生成特征概率。例如,异常检测系统104使用一个或多个非参数模型来确定每个离散特征数据集的概率密度函数。进而,异常检测系统104可确定每个操作特征的特征概率(例如,如图3的动作306中所描绘的)。

在动作308处,异常检测系统104基于特征概率而识别地下钻井设备的一个或多个钻井操作的异常(例如,如在时间序列数据中捕捉的)。在特定的实施方案中,异常检测系统104通过将特征概率与异常阈值进行比较来识别异常。例如,异常检测系统104确定特征概率中的一个或多个是否低于异常阈值。如果为是,则异常检测系统104将一个或多个特征概率识别为异常。

如上文简要讨论的,异常检测系统104可有效地识别时间序列数据内的异常并且提供可容易解释的异常可视化以供显示。图4A至图4B示出了根据一个或多个实施方案的识别操作异常并呈现异常可视化以供显示的异常检测系统104。例如,如图4A中的动作402处所示,异常检测系统104对时间序列数据进行分区以确定时间序列数据的特定数据桶或部分。在某些实施方案中,异常检测系统104根据操作状态404和/或情境数据406对时间序列数据进行分区。

举例来说,异常检测系统104根据操作状态404中的一个或多个(诸如与钻孔排碴、将钻柱移动到连接点以及停止旋转和泵相关的连接前活动)来拆分时间序列数据。另外地或替代地,异常检测系统104根据操作状态404中的其他操作状态(诸如与组装钻柱相关的连接活动、或者与钻井、起下钻管和/或从移除卡瓦直到钻头接触井底所发生的过程相关的连接后活动)来拆分时间序列数据。

以类似的方式,异常检测系统104可根据诸如钻井操作员、日期和时间、地质构造、钻井量度、底部钻具组件、钻井液的情境数据406来拆分时间序列数据。异常检测系统104也可使用其他类型的情境数据来对时间序列数据进行分区。例如,异常检测系统104可通过DDR(如上所述)内所包括的信息或基于事件的信息(诸如起下钻头、扭断、泥浆马达故障等)来拆分时间序列数据。

在某些实施方案中,在基于第一类别而拆分时间序列数据之后,异常检测系统104可再次根据第二类别的操作状态404或情境数据406来拆分时间序列数据以提高粒度级别。例如,异常检测系统104可通过钻台、起下钻井等再次拆分时间序列数据。在一个或多个实施方案中,异常检测系统104可根据需要针对不同类别的操作状态404或情境数据406进一步迭代分区步骤。在2020年12月18日提交且名为“SIMILARITY AND ANOMALY RECOGNITIONIN DRILLING OPERATIONS”的美国临时申请号63/199,293中描述了对时间序列数据进行分区的另外的细节,所述申请的全部内容明确以引用的方式并入本文。

在动作408处,异常检测系统104对分区的时间序列数据进行滤波以估计特征信号。在一个或多个实施方案中,对时间序列数据进行滤波包括使时间序列数据平滑以抑制突然变化或数据峰(例如,来自随机噪声)。此外,在某些实施方案中,异常检测系统104以减小或最小化时间滞后的方式对时间序列数据进行滤波(例如,以避免地下钻井设备的不期望的控制动态)。因此,在特定的实施方案中,异常检测系统104使用零滞后高斯差(DoG)滤波器来对时间序列数据进行滤波。另外,在一些情况下,异常检测系统104使用不到整个的滤波器。例如,异常检测系统104可使用在时域(但不在空间域)中定义的零滞后DoG滤波器的一半,使得正的最大值减小到负的最小值,然后增加到近似为零的值(例如,以渐近方式)。

在一个或多个实施方案中,异常检测系统104基于下文再现的算法1而在时域中使用零滞后DoG滤波器:

在一个或多个实施方案中,异常检测系统104使用归一化滤波器和256个样本的窗口大小,对于采样率为1Hz的信号具有各种常数,诸如k=1.0185和M=19.62。

应当了解,异常检测系统104可在动作408处使用附加或替代类型的滤波器。例如,在某些实施方式中,异常检测系统104使用微商、有限差分逼近器、Savitzky-Golay滤波器或高斯拉普拉斯算子(LoG)。类似地,在一个或多个实施方案中,异常检测系统104可利用在空间域中定义的滤波器(例如,其中深度可为测量深度、总竖直深度等)。在2018年6月15日提交的名为“DYNAMIC FIELD OPERATIONS SYSTEM”的国际申请号PCT/US2018/037680中提供了用于对时间序列数据进行滤波的各种算法和/或滤波器的另外的细节,所述申请的全部内容明确以引用的方式并入本文。

基于对时间序列数据进行滤波,异常检测系统104估计某些特征信号。例如,异常检测系统104生成指示各种波形峰和谷、斜率、凹度、坐标定位和/或其他数字信号模式或值的滤波的数字信号。这些数字信号或波形定量地表示地下钻井设备的特征信号,如速度、加速度、时间、位置、方向、范围、计数等。

在动作410处,异常检测系统104从特征信号中提取操作特征并且确定离散特征数据集。在特定的实施方案中,异常检测系统104根据特征信号确定某些值(例如,随时间变化的速度值、最大加速度值、向上移动计数到向下移动计数等)。例如,异常检测系统104在特定的时间间隔、计数等处从特征信号中对值进行采样。在某些情况下,异常检测系统104在每个时间间隔或频率、计数等处从特征信号中对值进行采样(例如,根据时间序列数据的间隔或采样频率)。

另外地或替代地,异常检测系统104基于波形图案或结构而从特征信号中对值进行采样。例如,异常检测系统104在峰(例如,局部峰或绝对峰)处或在谷(例如,局部谷或绝对谷)处从特征信号中对值进行采样。作为附加示例,异常检测系统104基于波形的某些质量或属性,诸如阈值斜率、凹度、阈值时间处的位置等而从特征信号中对值进行采样。

在某些实施方案中,异常检测系统104修改来自特征信号的值以提取操作特征。例如,异常检测系统104将来自特征信号的值进行组合以确定比率。作为附加示例,异常检测系统104将值归一化,将值转换为码或标识符等。

基于所确定的值,异常检测系统104生成对应的离散特征数据集。换句话说,对于滑车位置,异常检测系统104提取多个特征。在一个或多个实施方案中,对于滑车位置,异常检测系统104提取28个离散特征。例如,异常检测系统104提取各特征,诸如在时间x处的最大向上速度、最大向上速度、在时间x处的最大向下速度、最大向下速度、最大向上加速度、最大向下加速度、先上移后下移时间、最大高度、最小高度、高度动态范围、静止高度平均值、主要静止时间、向下最小高度、向下最大距离、总向上时间、总向下时间、总静止时间、开始上移时间、开始下移时间、相对于向上的下移时间、向上到向下计数、向下到向上计数、总方向变化计数、上移最大值、下移最小值、上下移动比率、静止时间比率、持续时间等。应当了解,异常检测系统104可针对不同的操作参数(例如,其对应于泵流速、压力、每分钟转数等,而不是像上文列出的那样的滑车位置)提取不同的特征。

在动作412处,异常检测系统104确定离散特征数据集的概率密度函数。通过确定概率密度函数,异常检测系统104可将离散特征数据集转换为连续数据集,以用于随后估计特征概率(如下文将相对于动作414讨论的)。在一个或多个实施方案中,异常检测系统104利用非参数模型(一种不需要与离散特征数据集的潜在分布有关的知识或假设的模型)来确定概率密度函数。例如,异常检测系统104使用机器学习模型来进行密度估计,诸如决策树、k-最近邻分类器或核回归。在某些实施方式中,异常检测系统104使用如在Raschka中所描述的Parzen窗方法来确定概率密度函数。例如,异常检测系统104使用具有高斯核的Parzen窗方法来根据以下示例表达式确定离散特征数据集的概率密度函数:

其中x

替代地,在动作412处,异常检测系统104可利用不同的算法或模型来确定概率密度函数。例如,如果异常检测系统104识别出离散特征数据集对应于特定分布,则异常检测系统104可实施分布特定的算法以进行密度估计。举例来说,异常检测系统104可实施不同的算法(或算法的组合)来确定概率密度函数—其中首选算法取决于对应于卡方分布、指数分布、f分布、对数正态分布、正态分布、t分布、均匀分布或威布尔分布的离散特征数据集。

在图4B中,在动作414处,异常检测系统104基于概率密度函数而确定操作特征的特征概率。例如,异常检测系统104使用操作特定的概率密度函数来估计给定操作特征的对应的特征概率。举例来说,异常检测系统104使用依据时间的最大向上速度的第一概率密度函数来估计在时间x处发生最大向上速度的概率。同样,异常检测系统104使用最大高度的第二概率密度函数来估计最大高度为y的概率,以此方式依次类推。

在特定的实施方案中,给定操作特征值,异常检测系统104基于概率密度函数通过求解概率(在每个相应的概率密度函数中)来生成特征概率。因此,确定的概率表示给定操作特征落入区间(a,b)内的可能性—或者用其他话说—在区间(a,b)中在其概率密度函数下的面积内。因此,较高的概率值更有可能出现,而较低的概率值不太可能出现。

在动作416处,异常检测系统104将特征概率与异常阈值进行比较以识别操作异常。例如,异常检测系统104确定所有特征的平均概率,然后相对于平均概率设置阈值。在特定的实施方案中,异常检测系统104将操作特征的最低特征概率与异常阈值进行比较(例如,以二进制方式识别时间序列数据的一部分是否包括异常)。另外地或替代地,异常检测系统104将特征概率中的每一个与异常阈值进行比较,使得异常检测系统104可指示(经由异常可视化)导致时间序列数据整体异常的每个异常操作特征。

基于比较,异常检测系统104可确定特征概率是否满足异常阈值。例如,如果特征概率小于或等于异常阈值,则特征概率满足异常阈值(并且因此是异常的)。作为另一个示例,如果特征概率在异常阈值的一定百分比或范围内,则特征概率满足异常阈值。

另外地或替代地,应当了解,异常检测系统104可在动作416处利用不同的异常阈值。例如,在某些实施方案中,异常检测系统104使用较低的异常阈值,使得较少的操作特征是异常的。相比之下,异常检测系统104可使用较高的异常阈值,使得更多的操作特征是异常的。在这些或其他实施方案中,异常阈值可包括预定值或默认值。此外,在某些实施方案中,异常阈值是可配置的或用户可调整的值。例如,如相对于图7B至图7C所示,异常阈值可根据用户与用户界面元素(例如,交互式滑块)的交互进行调整。

在动作418处,异常检测系统104提供异常可视化以在(例如,实施的客户端装置的)图形用户界面内显示。异常可视化包括对操作异常的指示。例如,异常可视化提供操作异常的图形描绘(例如,图表、纯文本描述、特征概率相对于操作异常的比较等)。在特定的实施方案中,异常检测系统104提供包括导致操作异常的操作特征的异常可视化。例如,如图4B所示,异常可视化包括某个操作特征的直方图以及所述操作特征的异常值及其对应的特征概率。在某些实施方式中,异常检测系统104生成异常可视化,所述异常可视化包括每个操作特征和对应的特征概率的表格或列表(例如,从最高概率到最低概率排序)。在一个或多个实施方案中,表格或列表包括详细说明每个异常操作特征及其异常特征概率的异常部段。例如,动作418示出三个特征导致异常。因此,如在动作418中所示,异常检测系统104不仅提供异常的指示,而且提供导致异常的特征。了解导致异常的特征允许终端用户推断出能够做什么来修复异常或避免将来出现类似的异常。

如上文所讨论,异常检测系统104可提供更加用户友好的图形用户界面,以用于改进对操作异常的解释和更加直观的特征工程。图5A至图5B示出了根据一个或多个实施方案的提供与操作特征的聚类相关的一个或多个图形用户界面以供显示的异常检测系统104。如图5A中的动作502处所示,异常检测系统104确定操作特征曲线的聚类的数量。特征曲线是特征信号(例如,随经过的秒数变化的滑车位置)的多维特征表示。在某些实施方案中,异常检测系统104使用一种或多种不同的方法来确定聚类的数量。

在至少一种方法中,异常检测系统104利用启发法来确定操作特征曲线的聚类的数量以确定改进数据拟合但防止过度拟合的聚类的数量。例如,在某些实施方案中,异常检测系统104利用手肘法。在手肘法下,异常检测系统104确定随聚类的数量变化而发生的变化。基于变化图,异常检测系统104将对应于曲线图的肘部的聚类的数量选择作为将使用的聚类的数量。

在另外或替代的方法中,异常检测系统104使用线性回归的R值来确定操作特征曲线的聚类的数量。例如,异常检测系统104通过识别对应于95%的R值的聚类数量来确定聚类的数量。此外,在某些实施方案中,异常检测系统104使用误差阈值来确定操作特征曲线的聚类的数量。例如,异常检测系统104通过识别对应于误差阈值0.1的聚类数量来确定聚类的数量。

在动作504处,异常检测系统104确定操作特征曲线的聚类(例如,根据所确定的聚类的数量)。在某些实施方案中,异常检测系统104实施一种或多种不同的聚类算法来对操作特征曲线进行聚类或辨别所述操作特征曲线。在一个或多个实施方案中,异常检测系统104使用K均值算法来对操作特征曲线进行聚类。为了执行K均值聚类算法,异常检测系统104通过混排操作特征数据集,然后在不替换的情况下随机选择用于质心的K个数据点(其中K是从动作502确定的聚类的数量)来将质心初始化。进而,异常检测系统104保持迭代直到质心没有变化为止。例如,异常检测系统104确定数据点与所有质心之间的平方距离之和,将每个数据点分配给较为靠近的聚类(或质心),并且通过求取从属于聚类的所有数据点的平均值来确定聚类的质心。应当了解,可实施附加或替代的聚类算法。例如,在某些实施方式中,异常检测系统104使用相似性传播、层次聚类、小批量K均值、均值漂移、谱聚类、高斯混合模型、BIRCH、DBSCAN、OPTICS等中的一种或多种。

此外,在某些实施方式中,异常检测系统104仅利用操作特征曲线的子集来确定操作特征曲线的聚类。例如,在某些实施方案中,异常检测系统104排除异常操作特征曲线并且仅使用非异常操作特征曲线来确定聚类。在一个或多个实施方案中,仅使用非异常特征曲线有助于提高所确定的聚类的准确性。

在动作506处,异常检测系统104提供聚类以在图形用户界面内显示(例如,如图5A的动作506或图7A至图7C所示)。在特定的实施方案中,异常检测系统104提供聚类相对于彼此的图形描绘(例如,在二维或三维T-SNE图中)。例如,如在动作506中所描绘,异常检测系统104将滑车位置的(例如,各种长度的)操作特征曲线投影到二维T-SNE特征空间中。操作特征曲线的位置取决于操作特征的值。在某些实施方式中,异常检测系统104利用不同的颜色编码或热图来区分不同的聚类,或者表示某些操作状态或情境数据(例如,当天时刻或井眼深度)。另外地或替代地,异常检测系统104利用不同的图形配置(例如,配色或图案)来将异常操作特征曲线与非异常特征曲线区分开。

在图5B中,在动作508处,异常检测系统104确定对应于操作特征的聚类之间的差异分数。在某些实施方案中,异常检测系统104利用一种或多种不同的方法来确定差异分数。例如,在一个或多个实施方案中,异常检测系统104将一个聚类的操作特征曲线的平均值与另一个聚类的操作特征曲线的平均值进行比较。因此,在特定的实施方案中,差异分数包括平均值的差异。在其他实施方案中,异常检测系统104利用不同类型的操作特征值,诸如范围、中值、标准偏差、线性拟合、指数拟合或其他统计量度来确定聚类之间的差异分数。

在动作510处,异常检测系统104连同差异分数一起提供操作特征以在图形用户界面内显示。在特定的实施方案中,异常检测系统104呈现操作特征的某些聚类的图形描绘(例如,操作特征曲线的多个聚类相对于彼此的图形描述)。在某些实施方式中,异常检测系统104以一种或多种诸如直方图、散点图等不同的形式呈现聚类。另外地或替代地,异常检测系统104示出每个聚类的平均值(或其他统计量度)。

此外,在一个或多个实施方案中,异常检测系统104显现聚类之间的差异分数(例如,如在图5B的动作510中所示,描绘了针对操作特征“向上到向下计数”的“聚类1”与“聚类2”之间的差异分数为1.0)。在某些实施方式中,异常检测系统104还呈现指示针对某个操作特征(或如图5B的动作510中所示的多个操作特征)的两个或更多个特定聚类之间的差异分数的表格或图表。

因此,异常检测系统104可通过避开为特征工程或参数提取提供很少价值的“黑盒”类型的分析来提高可解释性。相反,异常检测系统104可经由图形用户界面指示两个给定聚类为什么是分开的以及分开的程度。另外,在一个或多个实施方案中,如上文相对于图5A至图5B所描述,特征空间中的聚类可提供提取的特征是相关的检查。

如上所述,异常检测系统104可呈现异常可视化以增强用户可解释性。图6A至图6C示出了根据一个或多个实施方案的实施异常检测系统以生成异常可视化的实验结果。如图6A所示,异常检测系统104生成异常可视化600。异常可视化600包括操作特征曲线(例如,用于滑车位置)的聚类的布置。为了生成这种聚类的布置,异常检测系统104动态地确定操作特征曲线的聚类的数量,确定操作特征曲线的实际聚类,并且生成聚类以供显示,如上文相对于图5A所描述。

此外,异常可视化600示出了一些操作特征曲线如何紧密聚集,以及甚至在某些区域中重叠。这些操作特征曲线代表常见曲线(或非异常曲线)。此外,异常可视化600示出了较为远离特定聚类,不与其他操作特征曲线重叠等的一些操作特征曲线。这些操作特征曲线代表异常操作特征曲线。

类似地,异常可视化600示出了操作特征曲线的聚类之间的相互关系。例如,一个聚类可对应于油基钻井泥浆的最大向下速度,而另一个聚类可对应于水基钻井泥浆的最大向下速度。以此方式,异常检测系统104可识别并视觉地描绘操作特征曲线的聚类之间的差异—从而有助于提高可解释性。

图6B类似地示出异常检测系统104生成异常可视化602以供显示。特别地,异常可视化602包括与图6A的异常可视化600中所表示的相同聚类的操作特征曲线。然而,不同于图6A,图6B中的异常可视化602还包括热图604。热图604提供颜色编码或颜色映射以在视觉上指示附加属性(例如,“开始时刻”)。也就是说,异常检测系统104描绘了从根据情境数据“开始时刻”分区的时间序列数据中提取的特定操作特征的操作特征曲线的聚类。为此,异常检测系统104使用热图604来通过色码而显示0-24的时间元素以指示给定操作特征曲线(例如,最大向下速度)的开始时间。

作为另一个示例,图6C还示出了异常检测系统104生成异常可视化606以供显示—其中异常可视化606包括与异常可视化600、602相同聚类的操作特征曲线。在这种情况下,图6C示出了又一个属性(例如,“井眼深度”)。因此,异常检测系统104生成具有在热图608中指示的颜色的操作特征曲线,所述热图表示从近似为零到超过10,000(例如,英尺或米)的深度。应当了解,异常检测系统104可根据无数其他类型的情境数据、操作状态等来生成表示操作特征曲线的聚类的异常可视化。以此方式,异常检测系统104可提供具有多个方面视觉信息的异常可视化,以容易得在操作特征曲线的聚类之间得出结论。

如上文所讨论,异常检测系统104可提供异常可视化来在图形用户界面内显示以用于直观的用户交互和解释。图7A至图7C示出了根据一个或多个实施方案的在计算装置700上提供图形用户界面以用于查看操作特征和异常可视化并与之交互的异常检测系统104。例如,如图7A所示,异常检测系统104提供用于在计算装置700处显示的用户界面702a。用户界面702a包括从时间序列数据中提取的操作特征的图形描绘。

为了生成用户界面702a以供显示,异常检测系统104执行如上文相对于图4A所描述的一系列动作。例如,异常检测系统104对时间序列数据进行分区(例如,根据操作状态、情境数据或两者的组合)。此外,异常检测系统104对时间序列数据进行滤波以估计特征信号(例如,利用零滞后DoG滤波器)。进而,异常检测系统104提取操作特征并且确定图7A所示的离散特征数据集。

响应于用户导航(例如,页面底部处的导航选项卡),异常检测系统104提供如图7B所示的用户界面702b。用户界面702b包括异常可视化706a-706c、特征曲线表示708和异常阈值滑块710(以及其他元素)。例如,响应于对特征曲线表示708中的一个或多个聚类的一部分的用户选择,异常检测系统104填充异常可视化706a-706c。就像上文相对于图6A至图6C讨论的异常可视化一样,图7B中的异常可视化706a-706c描绘了操作特征曲线(或点,这取决于维数或特征空间)。

此外,异常可视化706a-706c描绘了包括异常操作特征曲线和非异常操作特征曲线两者的操作特征曲线。具体地说,异常阈值滑块710被设置为低值或最小值(例如,零)。因此,异常检测系统104生成异常可视化706a-706c以包括许多(如果不是全部的话)异常操作特征曲线以及非异常操作特征曲线,因为对应的特征概率超过了异常阈值。

随后,响应于用户与异常阈值滑块710的交互,异常检测系统104如图7C所示对应地更新用户界面。特别地,图7C示出了用户界面702c包括被调整或重新定位(例如,横向向右滑动)的异常阈值滑块710。作为用户交互的结果,异常检测系统104还更新(例如,增加)异常阈值。通过更新异常阈值,异常检测系统104进而将更多的操作特征曲线识别为异常。例如,如上文所讨论,异常检测系统104再次将特征概率与更新的异常阈值进行比较以识别异常。

基于更新的异常阈值,异常检测系统104之后如图7C所示相应地修改或更新异常可视化706a-706c。例如,异常检测系统104通过排除或去除新识别的异常操作特征曲线来聚焦于常见操作特征曲线的呈现。另外地或替代地,异常检测系统104改变某些操作特征曲线(例如,对应于现在无法满足或超过异常阈值的特征概率的操作特征曲线)的不透明度或数字颜色。

以类似的方式,放宽或降低异常阈值的更新使得异常检测系统104(对用户界面)添加先前排除的现在与更新的异常阈值相符的操作特征曲线。另外地或替代地,异常检测系统104可改变操作特征曲线的数字颜色或不透明度级别以指示操作特征曲线现在基于调整的异常阈值是“常见的”(或非异常的)。

转向图8,现在将提供关于异常检测系统104的各种部件和能力的附加细节。特别地,图8示出了根据本公开的一个或多个实施方案的由计算装置800实施的异常检测系统104的示例示意图。同样如图所示,异常检测系统104可包括时间序列数据管理器802、特征提取引擎804、特征概率生成器806、异常检测控制器808、用户界面管理器810和数据存储设施812。

时间序列数据管理器802可识别、生成、检索、请求、存储、传输、转换和/或分析时间序列数据(如相对于前述附图所描述的)。在特定的实施方案中,时间序列数据管理器802识别对应于与地下钻井设备相关联的一个或多个传感器的传感器数据。例如,时间序列数据管理器802识别大钩载荷、滑车位置、泵流速等的时间顺序数据或带时间戳的数据。

特征提取引擎804从时间序列数据中生成、获得、存储和/或传输操作特征(如相对于前述附图所描述的)。在特定的实施方案中,特征提取引擎804通过将时间序列数据拆分成对应于各种级别的操作状态、情境数据等的不同数据桶来对时间序列数据进行分区。此外,特征提取引擎804对分区的时间序列数据进行滤波(例如,利用零滞后DoG滤波器)以生成特征信号,诸如速度、加速度等。基于特征信号,特征提取引擎804可确定各种不同的操作特征或离散数据集(例如,在时间x处的最大速度)。

特征概率生成器806确定操作特征的特征概率(如相对于前述附图所描述的)。在特定的实施方案中,特征概率生成器806将用于操作特征的离散数据集转换成连续数据。例如,特征概率生成器806利用非参数模型(例如,Parzen窗方法)来确定每个操作特征的概率密度函数。进而,特征概率生成器806可基于概率密度函数而确定对应的特征概率。

异常检测控制器808基于特征概率而确定操作异常(如相对于前述附图所描述的)。在特定的实施方案中,异常检测控制器808将特征概率与异常阈值进行比较。基于特征概率比较,异常检测系统104可确定哪些操作特征导致整体操作异常。

用户界面管理器810可提供、管理和/或控制图形用户界面(或简称为“用户界面”)。特别地,用户界面管理器810可生成用户界面并且通过显示屏幕来显示所述用户界面,所述显示屏幕由允许用户执行功能的多个图形部件、对象和/或元素组成。例如,用户界面管理器810可从用户接收用户输入,诸如点击/敲击以调整异常阈值滑块,或在异常可视化中选择特定聚类的操作特征曲线。另外,用户界面管理器810可呈现各种类型的信息,包括文本、数字媒体项、异常操作特征、异常可视化或其他信息。

数据存储设施812维护异常检测系统104的数据。数据存储设施812(例如,经由一个或多个存储器装置)可根据执行异常检测系统104的功能的需要来维护任何类型、大小或种类的数据,诸如地下钻井设备的时间序列数据。

计算装置800的每个部件可包括软件、硬件或两者。例如,计算装置800的部件可包括存储在计算机可读存储介质上并可由诸如客户端装置或服务器装置的一个或多个计算装置的处理器执行的一个或多个指令。当由一个或多个处理器执行时,异常检测系统104的计算机可执行指令可使计算装置(例如,计算装置800)执行本文描述的方法。替代地,计算装置800的部件可包括硬件,诸如用于执行某个功能或功能组的专用处理装置。替代地,计算装置800的部件可包括计算机可执行指令和硬件的组合。

此外,计算装置800的部件可例如被实施为一个或多个操作系统、一个或多个独立应用程序、应用程序的一个或多个模块、一个或多个插件程序、一个或多个库函数或可由其他应用程序调用的函数和/或云计算模型。因此,计算装置800的部件可被实施为独立应用程序,诸如桌面或移动应用程序。此外,计算装置800的部件可被实施为托管在远程服务器上的一个或多个基于web的应用程序。

计算装置800的部件也可在一套移动装置应用程序或“app”中实施。举例来说,计算装置800的部件可在应用程序中实施,包括但不限于勘探与生产软件应用程序,如

图1至图8、对应的文本和示例提供了根据一个或多个实施方案的异常检测系统104的若干不同的系统、方法、技术、部件和/或装置。除了以上描述之外,还可根据包括用于实现特定结果的动作的流程图来描述一个或多个实施方案。例如,图9示出了根据一个或多个实施方案的用于识别地下钻井设备的操作异常的一系列动作900的流程图。异常检测系统104可执行该系列动作900中的一个或多个动作,以作为对结合其他附图描述的一个或多个动作的补充或替代。虽然图9示出了根据一个实施方案的动作,但替代实施方案可省略、添加、重新排序和/或修改图9所示的任何动作。图9的动作可作为方法的一部分来执行。替代地,非暂时性计算机可读介质可包括当由一个或多个处理器执行时使计算装置执行图9的动作的指令。在一些实施方案中,系统可执行图9的动作。

如图所示,该系列动作900包括动作902:识别地下钻井设备的时间序列数据。此外,该系列动作900还包括动作904:利用特征提取模型并从时间序列数据中生成定义地下钻井设备随时间推移而进行的操作的操作特征。在某些实施方案中,生成操作特征包括利用特征提取模型来对时间序列数据进行滤波以估计特征信号,所述特征信号包括速度、加速度、波形峰或波形谷中的至少一者。

该系列动作900还包括动作906:生成操作特征的特征概率。在某些实施方案中,生成特征概率包括确定从时间序列数据分区的离散特征数据集的概率密度函数。

该系列动作900还包括动作908:基于操作特征的特征概率而识别地下钻井设备的操作的异常。在某些实施方案中,识别异常包括将特征概率与异常阈值进行比较。

应当理解,该系列动作900中概括的动作仅作为示例提供,并且在不背离所公开的实施方案的本质的情况下,一些动作可为可选的、组合成更少的动作或扩展成附加动作。另外,本文描述的动作可被重复或彼此并行执行,或者与相同或相似动作的不同实例并行执行。作为图9中未示出的附加动作的示例,该系列动作900中的动作可包括以下动作:基于地下钻井设备的操作状态而对时间序列数据进行分区,所述操作状态包括连接前活动、连接活动或连接后活动中的至少一者;以及从分区的时间序列数据中生成操作特征。

作为图9中未示出的附加动作的另一个示例,该系列动作900中的动作可包括以下动作:提供异常可视化以在图形用户界面内显示,所述异常可视化包括以下各者中的至少一者:导致异常的一个或多个操作特征的纯文本描述;或导致异常的一个或多个操作特征的特征概率的子集。

在图9中未示出的附加动作的又一个示例中,该系列动作900中的动作可包括以下动作:提供时间序列数据的操作特征曲线以及附加时间序列数据的附加操作特征曲线以在图形用户界面内显示;以及基于调整异常阈值的用户交互而更新一个或多个操作特征曲线。

作为图9中未示出的附加动作的另外的示例,该系列动作900中的动作可包括以下动作:利用特征提取模型通过对时间序列数据进行滤波以估计特征信号来生成定义地下钻井设备随时间推移而进行的操作的操作特征,所述特征信号包括速度、加速度、波形峰或波形谷中的至少一者;通过将来自特征信号的离散特征数据转换为连续特征数据来生成操作特征的特征概率;以及通过将操作特征的特征概率与异常阈值进行比较来识别地下钻井设备的操作的异常。

在图9中未示出的附加动作的再另一个示例中,该系列动作900中的动作可包括以下动作:利用特征提取模型以最小化时间滞后的方式对时间序列数据进行滤波。

在图9中未示出的附加动作的另一个示例中,该系列动作900中的动作可包括以下动作:基于地下钻井设备的操作状态而对时间序列数据进行分区,所述时间序列数据包括大钩载荷、滑车位置、每分钟转数或泵流速中的至少一者;以及从分区的时间序列数据中生成操作特征。

在图9中未示出的附加动作的又一个示例中,该系列动作900中的动作可包括以下动作:通过利用非参数模型以基于来自特征信号的离散特征数据而估计概率密度函数来生成操作特征的特征概率。

在图9中未示出的附加动作的又一个示例中,该系列动作900中的动作可包括以下动作:通过以下方式将操作特征的特征概率与异常阈值进行比较:识别特征概率的最小特征概率;以及将最小特征概率与异常阈值进行比较,所述异常阈值是预设值或用户可配置值。

作为图9中未示出的附加动作的另外的示例,该系列动作900中的动作可包括以下动作:提供异常可视化以在图形用户界面内显示,所述异常可视化包括导致异常的一个或多个操作特征的特征概率的子集。

另外,在图9中未示出的附加动作的另一个示例中,该系列动作900中的动作可包括以下动作:识别地下钻井设备的时间序列数据;利用特征提取模型并从时间序列数据中生成定义地下钻井设备随时间推移而进行的操作的操作特征;生成操作特征的特征概率;基于操作特征的特征概率而识别地下钻井设备的操作的异常;以及提供异常可视化以在图形用户界面内显示,所述异常可视化包括以下各者中的至少一者:导致异常的一个或多个操作特征的纯文本描述;或导致异常的一个或多个操作特征的特征概率的子集。

此外,在图9中未示出的附加动作的另一个示例中,该系列动作900中的动作可包括以下动作:提供用于调整异常阈值的交互式滑块以在图形用户界面内显示;提供时间序列数据的操作特征曲线以及附加时间序列数据的附加操作特征曲线以在图形用户界面内显示;以及响应于检测到移动交互式滑块的滑动输入,更新异常阈值和一个或多个操作特征曲线。

另外,在图9中未示出的附加动作的另一个示例中,该系列动作900中的动作可包括以下动作:添加满足更新的异常阈值的一个或多个操作特征曲线;或者执行以下各者中的至少一者:改变无法满足更新的异常阈值的一个或多个操作特征曲线的数字颜色或不透明度;或者从显示中去除无法满足更新的异常阈值的一个或多个操作特征曲线。

此外,该系列动作900中的动作还可包括以下动作:确定表示与多个时间序列数据相关联的一个或多个操作特征的多个操作特征曲线的聚类;以及提供多个操作特征曲线的聚类以在图形用户界面内显示。

更进一步地,在图9中未示出的附加动作的另一个示例中,该系列动作900中的动作可包括以下动作:经由图形用户界面识别用户交互以选择多个操作特征曲线的一个或多个聚类的至少一部分;以及响应于识别用户交互而更新异常可视化。

另外,在图9中未示出的附加动作的另一个示例中,该系列动作900中的动作可包括以下动作:对于操作特征,确定两个或更多个聚类之间的差异分数;以及连同两个或更多个聚类之间的差异分数一起提供操作特征以在图形用户界面内显示。

作为图9中未示出的附加动作的另一个示例,该系列动作900中的动作可包括以下动作:识别地下钻井设备的情境数据,所述情境数据包括钻井操作员、日期和时间、地质构造、钻井量度、底部钻具组件或钻井液中的一者或多者;基于情境数据而对时间序列数据进行分区;以及从分区的时间序列数据中生成操作特征。

本公开的实施方案可包括或利用专用或通用计算机,所述计算机包括计算机硬件,例如像一个或多个处理器和系统存储器,如下文更详细地讨论的。本公开范围内的实施方案还包括用于承载或存储计算机可执行指令和/或数据结构的物理和其他计算机可读介质。特别地,本文描述的一个或多个过程可至少部分地被实施为体现于非暂时性计算机可读介质中并可由一个或多个计算装置(例如,本文描述的任何媒体内容访问装置)执行的指令。一般而言,处理器(例如,微处理器)从非暂时性计算机可读介质(例如,存储器)接收指令,并且执行那些指令,从而执行一个或多个过程,包括本文描述的一个或多个过程。

计算机可读介质可为可由通用或专用计算机系统访问的任何可用介质。存储计算机可执行指令的计算机可读介质是非暂时性计算机可读存储介质(装置)。承载计算机可执行指令的计算机可读介质是传输介质。因此,作为举例而非限制,本公开的实施方案可包括至少两种截然不同的计算机可读介质:非暂时性计算机可读存储介质(装置)和传输介质。

非暂时性计算机可读存储介质(装置)包括RAM、ROM、EEPROM、CD-ROM、固态驱动器(“SSD”)(例如,基于RAM)、闪存存储器、相变存储器(“PCM”)、其他类型的存储器、其他光盘存储装置、磁盘存储装置或其他磁存储装置、或者可用于以计算机可执行指令或数据结构的形式存储期望的程序代码手段并可由通用或专用计算机访问的任何其他介质。

“网络”被定义为使得电子数据能够在计算机系统和/或模块和/或其他电子装置之间传输的一个或多个数据链路。当通过网络或另一种通信连接(硬接线、无线或硬接线或无线的组合)向计算机传送或提供信息时,计算机适当地将连接视为传输介质。传输介质可包括网络和/或数据链路,所述网络和/或数据链路可用于以计算机可执行指令或数据结构的形式承载期望的程序代码手段并且可由通用或专用计算机访问。以上的组合也应被包括在计算机可读介质的范围内。

此外,在到达各种计算机系统部件时,呈计算机可执行指令或数据结构的形式的程序代码手段可自动地从传输介质传送到非暂时性计算机可读存储介质(装置)(或反之亦然)。例如,通过网络或数据链路接收的计算机可执行指令或数据结构可缓冲在网络接口模块(例如,“NIC”)内的RAM中,然后最终传送到计算机系统RAM和/或计算机系统处的易失性较低的计算机存储介质(装置)。因此,应当理解,非暂时性计算机可读存储介质(装置)可被包括在也(或甚至主要)利用传输介质的计算机系统部件中。

计算机可执行指令包括例如当由处理器执行时使通用计算机、专用计算机或专用处理装置执行某个功能或功能组的指令和数据。在一些实施方案中,计算机可执行指令由通用计算机执行以将通用计算机变为实施本公开的元素的专用计算机。计算机可执行指令可为例如二进制文件、诸如汇编语言的中间格式指令或甚至源代码。虽然已经用特定于结构特征和/或方法动作的语言描述了本主题,但应当理解,在所附权利要求中限定的主题不必限于所描述的上述特征或动作。相反,所描述的特征和动作被公开作为实施权利要求的示例形式。

本领域技术人员应当了解,本公开可在网络计算环境中用许多类型的计算机系统配置进行实践,所述计算机系统配置包括个人计算机、台式计算机、膝上型计算机、消息处理器、手持式装置、多处理器系统、基于微处理器或可编程的消费电子产品、网络PC、小型计算机、大型计算机、移动电话、PDA、平板电脑、传呼机、路由器、交换机等。本公开还可在分布式系统环境中实践,其中通过网络链接(通过硬接线数据链路、无线数据链路或通过硬接线与无线数据链路的组合)的本地和远程计算机系统都执行任务。在分布式系统环境中,程序模块可位于本地和远程存储器存储装置两者中。

本公开的实施方案也可在云计算环境中实施。如本文所用,术语“云计算”是指用于实现对共享的可配置计算资源池的按需网络访问的模型。例如,可在市场中采用云计算来提供对共享的可配置计算资源池的无所不在的且方便的按需访问。共享的可配置计算资源池可经由虚拟化快速地供应并且通过较少的管理工作或服务提供商交互来发布,然后相应地调节大小。

云计算模型可由各种特性组成,例如像按需自助服务、广泛的网络访问、资源池化、快速弹性、可计量的服务等。云计算模型还可公开各种服务模型,例如像软件即服务(“SaaS”)、平台即服务(“PaaS”)和基础设施即服务(“IaaS”)。还可使用诸如私有云、社区云、公共云、混合云等不同的部署模型来部署云计算模型。此外,如本文所用,术语“云计算环境”是指采用云计算的环境。

图10示出了可被配置为执行上文描述的一个或多个过程的示例计算装置1000的框图。应当了解,诸如计算装置1000的一个或多个计算装置可代表上文描述的计算装置(例如,计算装置700、计算装置800、服务器102、第三方服务器106或客户端装置108)。在一个或多个实施方案中,计算装置1000可为移动装置(例如,移动电话、智能手机、PDA、平板电脑、膝上型计算机、相机、跟踪器、手表、可穿戴装置等)。在一些实施方案中,计算装置1000可为非移动装置(例如,台式计算机或另一种类型的客户端装置)。此外,计算装置1000可为包括基于云的处理和存储能力的服务器装置。

如图10所示,计算装置1000可包括一个或多个处理器1002、存储器1004、存储装置1006、输入/输出接口1008(或“I/O接口1008”)和通信接口1010,它们可通过通信基础设施(例如,总线1012)通信地耦合。虽然在图10中示出了计算装置1000,但图10所示的部件不意图进行限制。在其他实施方案中可使用附加或替代的部件。另外,在某些实施方案中,计算装置1000包括比图10所示的那些更少的部件。现在将以附加细节描述图10所示的计算装置1000的部件。

在特定的实施方案中,处理器1002包括用于执行指令(诸如构成计算机程序的那些)的硬件。作为示例而非限制,为了执行指令,处理器1002可从内部寄存器、内部高速缓存、存储器1004或存储装置1006检索(或获取)指令并且对所述指令进行解码并执行所述指令。

计算装置1000包括耦合到处理器1002的存储器1004。存储器1004可用于存储数据、元数据和供处理器执行的程序。存储器1004可包括易失性和非易失性存储器中的一种或多种,诸如随机存取存储器(“RAM”)、只读存储器(“ROM”)、固态盘(“SSD”)、闪存、相变存储器(“PCM”)或其他类型的数据存储。存储器1004可为内部或分布式存储器。

计算装置1000包括存储装置1006,所述存储装置包括用于存储数据或指令的存储器。作为示例而非限制,存储装置1006可包括上文描述的非暂时性存储介质。存储装置1006可包括硬盘驱动器(HDD)、闪存存储器、通用串行总线(USB)驱动器或这些或其他存储装置的组合。

如图所示,计算装置1000包括一个或多个I/O接口1008,所述I/O接口被提供来允许用户向计算装置1000提供输入(诸如用户笔划)、从所述计算装置接收输出,并且以其他方式向和从所述计算装置传送数据。这些I/O接口1008可包括鼠标、小键盘或键盘、触摸屏、相机、光学扫描仪、网络接口、调制解调器、其他已知的I/O装置或此类I/O接口1008的组合。可用触笔或手指激活触摸屏。

I/O接口1008可包括用于向用户呈现输出的一个或多个装置,包括但不限于图形引擎、显示器(例如,显示屏幕)、一个或多个输出驱动器(例如,显示驱动器)、一个或多个音频扬声器和一个或多个音频驱动器。在某些实施方案中,I/O接口1008被配置为向显示器提供图形数据以呈现给用户。图形数据可表示一个或多个图形用户界面和/或可服务于特定实施方式的任何其他图形内容。

计算装置1000还可包括通信接口1010。通信接口1010可包括硬件、软件或两者。通信接口1010提供用于在计算装置与一个或多个其他计算装置或一个或多个网络之间通信(例如像,基于分组的通信)的一个或多个接口。作为示例而非限制,通信接口1010可包括用于与以太网或其他基于导线的网络通信的网络接口控制器(NIC)或网络适配器,或者用于与无线网络(诸如WI-FI)通信的无线NIC(WNIC)或无线适配器。计算装置1000还可包括总线1012。总线1012可包括将计算装置1000的部件彼此连接的硬件、软件或两者。

在前面的说明书中,已经参考本发明的具体示例实施方案描述了本发明。参考本文讨论的细节描述了本发明的各种实施方案和方面,并且附图示出了各种实施方案。上文的描述和附图是对本发明的说明,而不应被解释为对本发明进行限制。描述了许多具体细节以提供对本发明的各种实施方案的透彻理解。

在不脱离本发明精神或基本特性的情况下,可以其他特定形式体现本发明。所描述的实施方案应在所有方面都仅被视为是说明性而不是限制性的。例如,可用更少或更多的步骤/动作来执行本文描述的方法,或者可以不同的顺序来执行这些步骤/动作。另外,本文描述的步骤/动作可被重复或彼此并行执行,或者与相同或相似步骤/动作的不同实例并行执行。本发明的范围因此由所附权利要求而非前文描述指明。在权利要求的含义和等效范围内的所有变化被包含在所述权利要求的范围内。

技术分类

06120116210795