掌桥专利:专业的专利平台
掌桥专利
首页

一种云平台存储链路监测方法、装置、介质

文献发布时间:2023-06-19 18:37:28


一种云平台存储链路监测方法、装置、介质

技术领域

本申请涉及云计算领域,特别是涉及一种云平台存储链路监测方法、装置、介质。

背景技术

随着云计算技术的发展,越来越多的企业选择通过云平台处理业务和为用户提供服务。OpenStack平台是一种常用的云计算平台管理项目,用于将多台物理设备的资源(CPU、内存等)整合成一个大的资源池,以便于用户根据OpenStack平台提供的API接口启动虚拟机和获取云计算资源。

为了保证OpenStack平台中的云服务进程正常工作,需要使用OpenStack平台提供的监控进程对云平台内服务进行监控,以及时发现异常信息并对云计算平台进行维护,但目前OpenStack平台监控进程仅能够采集云平台内服务器和虚拟主机的运行状态信息,当云计算平台的外接存储设备发送故障时,云计算平台无法正常进行数据读写,导致无法正常为用户提供云计算服务。而OpenStack监控进程无法对存储设备的状态进行监测,导致维护人员无法及时定位问题,影响云计算平台的稳定性和用户的使用体验。

由此可见,如何提供一种云平台存储链路监测方法,以便于维护人员及时发现云平台存储链路故障,是本领域技术人员亟需解决的问题。

发明内容

本申请的目的是提供一种云平台存储链路监测方法、装置、介质,以对云平台的存储链路的工作状态进行监测,以便于维护人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

为了解决上述技术问题,本申请提供了一种云平台存储链路监测方法,包括:

获取待检测节点的节点信息,以确定与所述待检测节点连接的存储设备的设备类型;

根据所述设备类型确定与所述待检测节点对应的存储链路监控进程;

通过所述存储链路监控进程监测与所述待检测节点对应的存储链路。

优选的,所述获取待检测节点的节点信息的步骤前还包括:

根据云平台Inventory文件确定所述待检测节点;

在所述待检测节点中部署所述存储链路监控进程。

优选的,所述在所述待检测节点中部署所述存储链路监控进程包括:

在所述待检测节点中运行存储链路监控容器镜像,其中,所述储链路监控容器镜像为根据存储链路监控脚本生成的telegraf容器镜像。

优选的,所述获取待检测节点的节点信息的步骤前,还包括:

判断所述待检测节点是否为计算节点;

若为计算节点,则执行所述获取待检测节点的节点信息的步骤。

优选的,所述存储设备包括:分布式存储设备、FC链路集中式存储设备和ISCSI链路集中式存储设备。

优选的,当所述存储设备为分布式存储设备时,所述通过所述存储链路监控进程监测与所述待检测节点对应的存储链路包括:

利用网络诊断工具判断所述存储设备的IP地址是否为有效地址;

若所述IP地址为无效地址,则确定所述存储链路断开;

当所述存储设备为FC链路集中式存储设备时,所述通过所述存储链路监控进程监测与所述待检测节点对应的存储链路包括:

获取预设目录下的FC链路状态文件;

根据所述FC链路状态文件确定所述存储链路是否断开;

当所述存储设备为ISCSI链路集中式存储设备时,所述通过所述存储链路监控进程监测与所述待检测节点对应的存储链路包括:

向所述ISCSI链路集中式存储设备发送校验数据包;

判断所述校验数据包是否成功发送,若未成功发送,则确定所述ISCSI链路集中式存储设备断开。

优选的,所述通过所述存储链路监控进程检测与所述待检测节点对应的存储链路的步骤后,还包括:

当检测到所述存储链路断开时,向管理人员发送告警信息。

为了解决上述技术问题,本申请还提供了一种云平台存储链路监测装置,包括:

获取模块,用于获取待检测节点的节点信息,以确定与所述待检测节点连接的存储设备的设备类型;

确定模块,用于根据所述设备类型确定与所述待检测节点对应的存储链路监控进程;

检测模块,用于通过所述存储链路监控进程监测与所述待检测节点对应的存储链路。

为了解决上述技术问题,本申请还提供了一种云平台存储链路监测装置,包括存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现所述的云平台存储链路监测方法的步骤。

为了解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的云平台存储链路监测方法的步骤。

本申请提供了一种云平台存储链路监测方法,包括:获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型,以便于选取相应的进程对待检测节点的通信链路进行监测;根据设备类型确定与待检测节点对应的存储链路监控进程;通过存储链路监控进程监测与待检测节点对应的存储链路。由此可见,本申请所提供的技术方案,根据待检测节点的存储设备类型自适应的选择存储链路监控进程对待检测节点的存储链路进行监测,以便于管理人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

此外,本申请提供了一种云平台存储链路监测装置、介质,包括:获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型,以便于选取相应的进程对待检测节点的通信链路进行监测;根据设备类型确定与待检测节点对应的存储链路监控进程;通过存储链路监控进程监测与待检测节点对应的存储链路。由此可见,本申请所提供的技术方案,根据待检测节点的存储设备类型自适应的选择存储链路监控进程对待检测节点的存储链路进行监测,以便于管理人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

附图说明

为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种云平台存储链路监测方法的应用场景图;

图2为本申请实施例所提供的一种云平台存储链路监测方法的流程图;

图3为本申请实施例所提供的一种云平台存储链路监测装置的结构图;

图4为本申请实施例所提供另一种的云平台存储链路监测装置的结构图;

附图标记如下:1为云计算平台,2为服务器,3为存储设备,4为客户端。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。

本申请的核心是提供一种云平台存储链路监测方法、装置、介质,以对云平台的存储链路的工作状态进行监测,以便于维护人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

图1为本申请实施例所提供的一种云平台存储链路监测方法的应用场景图,如图1所示,服务器通过虚拟机节点为用户提供计算服务。在服务器工作过程中,当云计算平台的外接存储设备发送故障时,云计算平台无法正常进行数据读写,导致无法正常为用户提供云计算服务。而OpenStack监控进程无法对存储设备的状态进行监测,导致维护人员无法及时定位问题,影响云计算平台的稳定性和用户的使用体验。为了解决这一问题,本申请提供了一种云平台存储链路监测方法,包括:获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型,以便于选取相应的进程对待检测节点的通信链路进行监测;根据设备类型确定与待检测节点对应的存储链路监控进程;通过存储链路监控进程监测与待检测节点对应的存储链路。由此可见,本申请所提供的技术方案,根据待检测节点的存储设备类型自适应的选择存储链路监控进程对待检测节点的存储链路进行监测,以便于管理人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。

图2为本申请实施例所提供的一种云平台存储链路监测方法的流程图,如图2所示,该方法包括:

S10:获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型。

云计算平台中的节点包括计算节点、控制节点等,为了保证虚拟机能够正常为用户提供云计算服务,通常需要对虚拟机挂载的计算节点进行监控。

在具体实施中,根据与待检测节点连接的存储设备的设备类型采用不同的监控进程对待检测节点进行检测。其中,待检测节点为根据云平台Inventory文件确定的节点。

S11:根据设备类型确定与待检测节点对应的存储链路监控进程。

S12:通过存储链路监控进程监测与待检测节点对应的存储链路。

可以理解的是,为了保证能够正常对存储链路的工作状态进行监控,需要预先在待检测节点中部署存储链路监控进程。为了提高部署效率,本申请所提供的技术方案通过采用容器化部署的方式部署存储链路监控进程。存储链路监控容器镜像为根据存储链路监控脚本生成的telegraf容器镜像。云平台常用的存储设备的类型包括:分布式存储设备时、FC链路集中式存储设备、ISCSI链路集中式存储设备等,不同类型的存储设备所对应的监控脚本也不相同。相应的,当存储设备为分布式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:利用网络诊断工具判断存储设备的IP地址是否为有效地址;若IP地址为无效地址,则确定存储链路断开;当存储设备为FC链路集中式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:获取预设目录下的FC链路状态文件;根据FC链路状态文件确定存储链路是否断开;当存储设备为ISCSI链路集中式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:向ISCSI链路集中式存储设备发送校验数据包;判断校验数据包是否成功发送,若未成功发送,则确定ISCSI链路集中式存储设备断开。

进一步的,当检测到存储链路断开时,云计算平台及时向管理人员发送预警信息,以保证云计算平台正常工作。

本实施例中提供了一种云平台存储链路监测方法包括:获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型,以便于选取相应的进程对待检测节点的通信链路进行监测;根据设备类型确定与待检测节点对应的存储链路监控进程;通过存储链路监控进程监测与待检测节点对应的存储链路。由此可见,本申请所提供的技术方案,根据待检测节点的存储设备类型自适应的选择存储链路监控进程对待检测节点的存储链路进行监测,以便于管理人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

在具体实施中,为了保证能够正常对存储链路的工作状态进行监控,需要预先在待检测节点中部署存储链路监控进程。在上述实施例的基础上,获取待检测节点的节点信息的步骤前还包括:根据云平台Inventory文件确定待检测节点;在待检测节点中部署存储链路监控进程。

其中,Inventory文件用于配置一个组的多台主机、组和主机之间的关系,Inventory文件的默认的文件路径为/etc/ansible/hosts;此外,还可以在系统中同时使用多个Inventory文件,也可以从动态源,或从云服务器上拉取Inventory配置信息。

容器是一种构建、打包和部署软件的方法。容器包括所有代码、运行时、库以及容器化工作负载需要运行的所有其他内容。容器部署是指将容器推送(或部署)到其目标环境的行为,容器化部署具有速度快、敏捷性和灵活性高、能够有效利用和优化计算资源的优点。

作为优选的实施例,在上述实施例的基础上,在待检测节点中部署存储链路监控进程包括:

在待检测节点中运行存储链路监控容器镜像,其中,储链路监控容器镜像为根据存储链路监控脚本生成的telegraf容器镜像。

其中,Telegraf是一个基于插件驱动的、用Golang语言开发的开源数据收集代理软件。Telegraf本身提供的输入和输出插件非常丰富,用户也可以根据自己的需求自行编写Telegraf插件(需要重新编译)。Telegraf是influxdata公司的时间序列平台TICK技术栈中的“T”,主要用于收集时间序列型数据,比如服务器CPU指标、内存指标、各种IoT设备产生的数据等等。

在具体实施中,创建存储链路监控容器镜像的步骤包括:选取初始镜像作为telegraf容器镜像的基础镜像,以便于后续操作,通常选择centos8.2镜像作为基础镜像;编译telegraf可执行文件,并拷贝到telegraf容器镜像;将存储链路的监控算法加入到telegraf容器镜像;推送telegraf容器镜像到云平台的私有镜像仓库,以便于后续根据私有镜像仓库中的telegraf容器镜像在指定节点上部署存储链路监控容器镜像。

可以理解的是,服务器中通常包括计算节点和控制节点,其中,计算节点用于为用户提供虚拟机计算服务。因此,通常仅需要在计算节点中部署存储链路检测进程。

作为优选的实施例,获取待检测节点的节点信息的步骤前,还包括:判断待检测节点是否为计算节点;若为计算节点,则执行获取待检测节点的节点信息的步骤。在具体实施中,通过判断当前telegraf pod所在节点是否为计算节点,若为计算节点,则获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型;根据设备类型确定与待检测节点对应的存储链路监控进程;通过存储链路监控进程监测与待检测节点对应的存储链路。

在具体实施中,云计算平台常用的存储设备类型包括:分布式存储设备、FC链路集中式存储设备和ISCSI链路集中式存储设备。相应的,当存储设备为分布式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:利用网络诊断工具判断存储设备的IP地址是否为有效地址;若IP地址为无效地址,则确定存储链路断开。具体的,通过网络诊断工具周期性的ping各个分布式存储节点,若IP地址为无效地址,则确定存储链路断开。

当存储设备为FC链路集中式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:获取预设目录下的FC链路状态文件;根据FC链路状态文件确定存储链路是否断开。

当存储设备为ISCSI链路集中式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:向ISCSI链路集中式存储设备发送校验数据包;判断校验数据包是否成功发送,若未成功发送,则确定ISCSI链路集中式存储设备断开。

在具体实施中,为了保证云平台服务器能够正常工作,需要在云平台服务器故障时及时向管理人员发送告警信息,以便于管理人员能够对服务器进行及时维护。

作为优选的实施例,通过存储链路监控进程检测与待检测节点对应的存储链路的步骤后,还包括:当检测到存储链路断开时,向管理人员发送告警信息。

具体的,向管理人员发送告警信息包括:将告警信息发送到云平台操作界面,或向管理人员的邮箱发送告警信息。进一步的,还需要将异常信息写入日志文件中,以便于后续根据异常信息对云计算平台进行维护。

在上述实施例中,对于云平台存储链路监测方法进行了详细描述,本申请还提供云平台存储链路监测装置对应的实施例。需要说明的是,本申请从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。

图3为本申请实施例所提供的一种云平台存储链路监测装置的结构图,如图3所示,该装置包括:

获取模块10,用于获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型;

确定模块11,用于根据设备类型确定与待检测节点对应的存储链路监控进程;

检测模块12,用于通过存储链路监控进程监测与待检测节点对应的存储链路。

由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。

为了保证能够正常对存储链路的工作状态进行监控,需要预先在待检测节点中部署存储链路监控进程。为了提高部署效率,本申请所提供的技术方案通过采用容器化部署的方式部署存储链路监控进程。存储链路监控容器镜像为根据存储链路监控脚本生成的telegraf容器镜像。云平台常用的存储设备的类型包括:分布式存储设备时、FC链路集中式存储设备、ISCSI链路集中式存储设备等,不同类型的存储设备所对应的监控脚本也不相同。相应的,当存储设备为分布式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:利用网络诊断工具判断存储设备的IP地址是否为有效地址;若IP地址为无效地址,则确定存储链路断开;当存储设备为FC链路集中式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:获取预设目录下的FC链路状态文件;根据FC链路状态文件确定存储链路是否断开;当存储设备为ISCSI链路集中式存储设备时,通过存储链路监控进程监测与待检测节点对应的存储链路包括:向ISCSI链路集中式存储设备发送校验数据包;判断校验数据包是否成功发送,若未成功发送,则确定ISCSI链路集中式存储设备断开。

本实施例中提供了一种云平台存储链路监测装置,该装置包括:获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型,以便于选取相应的进程对待检测节点的通信链路进行监测;根据设备类型确定与待检测节点对应的存储链路监控进程;通过存储链路监控进程监测与待检测节点对应的存储链路。由此可见,本申请所提供的技术方案,根据待检测节点的存储设备类型自适应的选择存储链路监控进程对待检测节点的存储链路进行监测,以便于管理人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

图4为本申请实施例所提供另一种的云平台存储链路监测装置的结构图,如图4所示,该云平台存储链路监测装置包括:存储器20,用于存储计算机程序;

处理器21,用于执行计算机程序时实现如上述实施例云平台存储链路监测方法的步骤。

本实施例提供的终端设备可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。

其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。

存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的云平台存储链路监测方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于存储链路监控进程、节点信息等。

在一些实施例中,云平台存储链路监测装置还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。

本领域技术人员可以理解,图4中示出的结构并不构成对云平台存储链路监测装置的限定,可以包括比图示更多或更少的组件。

本申请实施例提供的云平台存储链路监测装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:

获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型;

根据设备类型确定与待检测节点对应的存储链路监控进程;

通过存储链路监控进程监测与待检测节点对应的存储链路。

本实施例中提供了一种云平台存储链路监测装置,该装置包括:获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型,以便于选取相应的进程对待检测节点的通信链路进行监测;根据设备类型确定与待检测节点对应的存储链路监控进程;通过存储链路监控进程监测与待检测节点对应的存储链路。由此可见,本申请所提供的技术方案,根据待检测节点的存储设备类型自适应的选择存储链路监控进程对待检测节点的存储链路进行监测,以便于管理人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

最后,本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。本实施例中提供了一种云平台存储链路监测介质,用于存储上述云平台存储链路监测方法,包括:获取待检测节点的节点信息,以确定与待检测节点连接的存储设备的设备类型,以便于选取相应的进程对待检测节点的通信链路进行监测;根据设备类型确定与待检测节点对应的存储链路监控进程;通过存储链路监控进程监测与待检测节点对应的存储链路。由此可见,本申请所提供的技术方案,根据待检测节点的存储设备类型自适应的选择存储链路监控进程对待检测节点的存储链路进行监测,以便于管理人员及时发现和维护存储链路的故障,从而提高云平台的稳定性和可靠性。

可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上对本申请所提供的云平台存储链路监测方法、装置、介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

技术分类

06120115636379