掌桥专利:专业的专利平台
掌桥专利
首页

一种基于全业务链的端对端的状态采集运维分析系统

文献发布时间:2024-04-18 19:58:26


一种基于全业务链的端对端的状态采集运维分析系统

技术领域

本发明涉及IT运维管理技术领域,具体涉及了一种基于全业务链的端对端的状态采集运维分析系统。

背景技术

随着IT建设的不断深入和完善,计算机硬软件系统的运行维护已经成为了各行各业各单位领导和信息服务部门普遍关注和不堪重负的问题。IT运维管理是指单位IT部门采用相关的方法、手段、技术、制度、流程和文档等,对IT软硬件运行环境、IT业务系统和IT运维人员的综合管理。

IT运维系统对网络设备、服务器设备、操作系统运行状况进行监控和管理,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理,对系统和业务数据进行统一存储、备份和恢复,业务包括对企业自身核心业务系统运行情况的监控与管理。而目前的IT资产管理,存在安全设备、数据独立、需要热工协同分析,终端设备、服务器、存储设备、网络设备等IT资产人工统计,缺失在线监测、统计及安全风险管控手段等问题。

发明内容

本发明所解决的技术问题在于提供一种基于全业务链的端对端的状态采集运维分析系统,能够对业务链中的IT资产数据获取并自动分析,进行预警。

本发明提供的基础方案:一种基于全业务链的端对端的状态采集运维分析系统,包括状态监控模块、状态识别模块以及视图展示模块;

状态监控模块,用于对业务链中IT资产的运行数据进行获取及监控,所述IT资产包括硬件设备、软件、数据以及网络;

状态识别模块,用于IT资产的运行数据进行识别分析,判断是否存在数据异常,当出现数据异常时生成预警信息进行预警;

视图展示模块,用于对业务链中的IT资产的运行数据以及预警信息,生成运维视图进行展示。

本发明的原理及优点在于:对业务链中的IT资产的运行数据进行获取并监控,IT资产包括有网络设备、交换机、服务器、电脑终端、移动终端等硬件设备资产,操作系统、文件系统、应用、安全系统等软件资产,数据库、中间件这类数据资产。网络拓扑、端口状态、端口流量等网络资产,对业务链条中所有IT资产运行状态进行获取并监控。同时对IT资产的运行状态进行分析,判断是否存在数据异常。例如对操作系统的CPU利用、内存使用率、系统平均负载、每次I/O读写耗时等。又或者是对网络资产的当前网络利用率、当前宽带利用率,当存在异常时便生成预警信息。之后通过视图展示模块对业务链中IT资产的运行数据以及预警信息进行显示。

相比于现有技术,通过对业务量中的IT资产的运行数据进行采集和识别,可以对网络、服务器、存储一体化运维,实现网络、服务器、存储、终端设备状态监控、资产采集、分析、报表,实时掌握IT家底。同时将IT资产的运行情况、预警信息通过视图的方式进行展示。安全团队可通过视图显示实时掌握IT资产的运行情况,根据不同的角色身份,在安全事件响应过程中指派不同任务,协同工作,提高应急处置工作效率。

进一步,还包括数据分类模块,视图展示模块包括若干展示大屏,所述展示大屏包括应用监控大屏、服务器监控大屏、操作系统监控大屏、中间件监控大屏、数据库监控大屏以及网络监控大屏;

数据分类模块,用于对运行数据进行分类,根据分类通过不同的展示大屏对运行数据进行展示。

对数据进行分类后,通过不同大屏进行展示。全面展示各业务系统运行状态、性能态势以及节点对业务的影响风险、业务服务链展示、业务服务动作控制等。

进一步,还包括业务识别模块;

业务识别模块,用于识别各IT资产之间的业务关系;

所述视图展示模块包括业务链展示模块;

业务链展示模块,用于根据各IT资产之间的业务关系,以IT资产作为拓扑图中的节点生成数据链路,并根据数据链路生成业务链监控图,通过业务链监控图显示IT资产的运行数据以及预警信息,并统计全业务链中的节点数量以及数据链路数量。

根据IT资产的业务关系,生成数据链路,将IT资产作为业务链路中的节点。如服务器下设有几台主机,服务器所使用的系统等。通过拓扑链路图的形式进行展示。将业务链中所有IT资产通过此方法进行展示,形式业务链监控图,同时在业务链监控图中显示IT资产的运行数据以及预警信息,如点击业务链监控图中IT资产的图标,便可查看IT资产的运行数据,表示具有预警信息。此外,对业务链中IT资产的数量以及数据链路数量进行统计显示。

进一步,所述业务链展示模块包括数据链路识别模块、异常标记模块以及详情查看模块;

数据链路识别模块,用于当数据链路中存在节点具有数据异常时,识别其上一级节点以及下一级节点中是否存在数据异常;

异常标记模块,用于将具有数据异常的节点在业务链监控图中标注,并统计业务链监控图中所有的异常节点以及异常数量;

详情查看模块,用于对异常节点的数据异常的运行数据详情进行查看。

当数据链路中有节点存在数据异常时,识别其上一级节点以及下一级节点中是否也存在数据异常,并将具有数据异常的在业务链监控图中标注,如通过改变业务链监控图中的IT资产图标颜色。当安全团队查看到业务链监控图中IT资产的图标变色后,便可知晓该IT资产存在数据异常。点击IT资产图标,便可查看具有异常的数据。

进一步,还包括数据记录模块、数据统计模块

数据记录模块,用于对IT资产产生的数据异常进行记录;

数据统计模块,用于根据数据异常的记录,对各IT资产的历史数据异常进行统计;

视图展示模块,还用于对IT资产的历史数据异常进行展示。

对异常数据进行记录并统计,便于对各个IT资产的使用情况进行判断。

进一步,还包括故障诊断模块、运维管理模块;

故障诊断模块,用于当IT资产出现数据异常时,根据数据异常,对IT资产进行故障诊断,并生成诊断结果;

运维管理模块,用于将诊断结果发送给运维人员,并获取运维人员上传的运维记录。

当IT资产出现数据异常时,根据其数据异常,对IT资产进行故障诊断,得到诊断结果,并将针对结果发送给运维人员,使运维人员进行运维。实现自动化运维、高效运维,保障业务连续行运行。

进一步,还包括硬件信息模块、硬件统计模块;

硬件信息模块,用于获取并存储硬件设备的设备信息,所述设备信息包括设备类型、设备品牌、保险信息、部署位置;

硬件统计模块,用于根据硬件设备的运行数据对硬件设备的运行状态进行识别,包括利用率、状态分布;

视图展示模块,还用于对硬件设备的运行状态进行展示。

对硬件设备的设备参数以及部署位置进行获取,并识别硬件识别运行状态进行展示。

进一步,所述硬件信息模块包括设备维保模块

设备维保模块,用于根据硬件设备的保险信息,识别硬件设备的维保状态,包括未过保设备、将过保设备、已过保设备。

附图说明

图1为本发明一种基于全业务链的端对端的状态采集运维分析系统实施例的逻辑框图;

图2为本发明一种基于全业务链的端对端的状态采集运维分析系统实施例中展示大屏的示意图;

图3为本发明一种基于全业务链的端对端的状态采集运维分析系统实施例中的业务链监控图。

具体实施方式

下面通过具体实施方式进一步详细说明:

实施例基本如附图1所示:

一种基于全业务链的端对端的状态采集运维分析系统,包括状态监控模块、状态识别模块、视图展示模块、数据分类模块、业务识别模块、数据记录模块、数据统计模块、故障诊断模块、运维管理模块、硬件信息模块、硬件统计模块。

状态监控模块,用于对业务链中IT资产的运行数据进行获取及监控,IT资产包括硬件设备、软件、数据、网络。其中硬件设备包括有温湿度传感器、红外探测器、门禁、电子围栏、摄像头、电量仪、UPS、电力设备、PDU、配电柜等环境硬件,还包括路由器、交换机、防火墙、服务器、光端机、光传输、LTE设备、无线通信设备、物联网设备等网络设备,还包括有计算机类设备、服务器类设备、嵌入式设备、信号处理设备等计算机设备,对硬件设备运行时的数据进行采集。软件包括操作系统、文件系统、安全系统、应用等,对软件的软件运行状态、软件资源占用、软件健康程度、软件交互状态、软件异常中断与干扰等运行数据进行获取。数据包括有业务信息数据、交换流转数据、数据库数据、KAFKA分发数据、网络截包数据等。网络包括网络拓扑、端口状态、端口流量等。数据采集通过各种专业探针获取数据信息包含设备基本信息、软件状态信息、硬件状态信息、信号特征参数、数据处理信息等,主要方式包括:一是通过snmp、udp、tcp、syslog、restful、http、rs485等通信协议,对接适配前端各分系统设备,屏蔽各厂家设备协议的差异化,实现对上层平台接口格式标准化,无需对被监控对象进行改造;二是在各类专用设备或器件上加装小型化状态采集处理设备,对待监控设备进行状态采集,分析获取设备的状态及性能,适用于对部分关键设备的性能监测。三是通过主动探测采集各装备系统的处理软件、网络通信、数据状态的信息。

状态识别模块,用于对IT资产的运行数据进行识别分析,判断是否存在数据异常,当存在数据异常时,生成预警信息。通过预设判断规则,当运作数据触发判断规则时,便判断存在数据异常,生成关于IT资产的预警信息。

视图展示模块,用于对业务链中的IT资产的运行数据以及预警信息,生成运维视图进行展示。视图展示模块包括有图展示模块包括若干展示大屏,所述展示大屏如图2所示包括应用监控大屏、服务器监控大屏、操作系统监控大屏、中间件监控大屏、数据库监控大屏以及网络监控大屏。数据分类模块,对运行数据进行分类,根据分类通过不同的展示大屏对运行数据进行展示。如通过操作系统监控大屏显示系统运行时间、CPU使用率、内存使用率、分区使用率等。中间件大屏显示网络速率、web应用等。通过数据库监控大屏显示换成命中率、每秒读写速率等。

业务识别模块,用于识别IT资产之间的业务关系。当有新的IT资产加入后,自动识别。

所述视图展示模块包括业务链展示模块;

业务链展示模块,用于根据IT资产的业务关系,以IT资产作为拓扑图中的节点生成数据链路,并根据数据链路生成如图3所示的业务链监控图,通过业务链监控图显示IT资产的运行数据以及预警信息,并统计全业务链中的节点数量以及数据链路数量。

根据IT资产的业务关系,生成数据链路,将IT资产作为业务链路中的节点。如服务器下设有几台主机,服务器所使用的系统等。通过拓扑链路图的形式进行展示。将业务链中所有IT资产通过此方法进行展示,形式业务链监控图,同时在业务链监控图中显示IT资产的运行数据以及预警信息,如点击业务链监控图中IT资产的图标,便可查看IT资产的运行数据,表示具有预警信息。此外,对业务链中IT资产的数量以及数据链路数量进行统计显示。

业务链展示模块包括数据链路识别模块、异常标记模块以及详情查看模块。

数据链路识别模块,用于当数据链路中存在节点具有数据异常时,识别其上一级节点以及下一级节点中是否存在数据异常。根据节点所在位置,识别其上一级节点以及下一级节点中的数据异常。

异常标记模块,用于将具有数据异常的节点在业务链监控图中标注,例如正常的IT资产,在业务链监控图中通过绿色图标显示,具有数据异常的IT资产,在业务链监控图中通过红色或橙色的图标显示,并统计业务链监控图中所有的异常节点以及异常数量并进行显示。

详情查看模块,用于对异常节点的数据异常的运行数据详情进行查看。通过点击业务链路图中的IT资产的图标,对IT资产的运行数据进行查看,并将异常数据标红。

数据记录模块,用于对IT资产产生的数据异常进行记录。当IT资产产生异常后并进行一次记录。

数据统计模块,用于根据数据异常的记录,对各IT资产的历史数据异常进行统计;

视图展示模块,还用于对IT资产的历史数据异常进行展示。

故障诊断模块,用于当IT资产出现数据异常时,根据数据异常,对IT资产进行故障诊断,并生成诊断结果。本实施例中,采用神经对故障进行诊断,具体的,首先,需要收集IT资产的运行数据。这可能包括错误日志、系统状态、性能指标等。这些数据应该足够多,且覆盖了可能出现问题的各种情况。收集的数据可能需要进行一些预处理,例如清洗(去除噪声和无效数据)、标准化(使数据在同一尺度上)和特征工程(提取有用的特征)。之后进行模型训练,使用预处理后的数据训练一个神经网络模型。这个模型通常是一个深度神经网络,可以有多个隐藏层。输出层应该有一个单元,对应于要预测的故障类型(例如硬件故障、软件故障等)。其他层的单元数量取决于问题的复杂性。在独立的测试数据集上测试训练好的模型的性能,这可以通过计算准确率、召回率、F1分数等指标来完成。之后将其部署到实际环境中,用于实时故障诊断。

运维管理模块,用于将诊断结果发送给运维人员,并获取运维人员上传的运维记录。分析出故障后,将故障诊断结果发送给运维人员以告知。

硬件信息模块,用于获取并存储硬件设备的设备信息,设备信息包括设备类型、设备品牌、保险信息、部署位置。

硬件统计模块,用于根据硬件设备的运行数据对硬件设备的运行状态进行识别,包括利用率、状态分布。

视图展示模块,还用于对硬件设备的运行状态进行展示。

硬件信息模块包括设备维保模块。

设备维保模块,用于根据硬件设备的保险信息,识别硬件设备的维保状态,包括未过保设备、将过保设备、已过保设备。

以上的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

相关技术
  • 基于区块链的业务处理方法、业务端、用户端和系统
  • 一种端到端业务告警状态监测方法及系统
技术分类

06120116490905