掌桥专利:专业的专利平台
掌桥专利
首页

数据源状态判定方法及装置、计算机可读存储介质

文献发布时间:2023-06-19 11:11:32


数据源状态判定方法及装置、计算机可读存储介质

本申请是向中国知识产权局提交的申请日为2017年11月1日、申请号为201711053363.1、发明名称为“数据源状态判定方法及装置、计算机可读存储介质”的申请的分案申请。

技术领域

本申请涉及通信技术领域,特别涉及一种数据源状态判定方法及装置。

背景技术

随着科技的发展,出现了越来越多的数据源,如视频数据源和网页数据源。终端可以通过与数据源通信,以获取数据源上的数据。

在终端与数据源通信的过程中,若数据源提供的数据出错,或数据源的通信效果较差,则终端从数据源上获取数据失败,此时数据源处于待维修状态。因此,亟需一种判定数据源状态的方法。相关技术中,通过在终端与数据源通信的网络中部署探针装置,并控制该探针装置对数据源的状态进行判定。示例的,在判定数据源状态时,可以首先控制探针装置模拟终端请求数据源上的数据。然后,控制探针装置检测是否接收到数据源发送的数据,以及检测接收到的数据是否为其请求的数据,进而确定数据源的状态是否为待维修状态。

由于相关技术中,探针装置对数据源的状态判定结果往往存在误差,因此,数据源的状态判定结果准确度较低。

发明内容

本申请提供了一种数据源状态判定方法及装置,可以解决数据源的状态判定结果准确度较低的问题。所述技术方案如下:

第一方面,提供了一种数据源状态判定方法,所述方法包括:确定在第一预设时间段内用于获取目标数据源上数据的p个第一终端,p≥1;获取每个所述第一终端在所述第一预设时间段内的数据获取失败率,其中,若在数据源上某一数据的预计获取时间段内,终端未获取到所述某一数据,则终端获取所述某一数据失败;根据所述p个第一终端在所述第一预设时间段内的数据获取失败率,确定所述目标数据源的状态是否为待维修状态。

相关技术中是控制探针装置模拟终端请求数据的过程,并根据该过程中的一些参数判定数据源的状态。由于该过程与实际终端获取数据源上数据的过程存在差异,因此,数据源的状态判定结果较不准确。而本申请中,由于第一终端的数据获取失败率是在第一终端获取数据过程中获取的,所以,获取得到的数据获取失败率的真实度较高,根据该数据获取失败率对目标数据源的状态是否为待维修状态的判定结果较为准确。

另外,由于相关技术中探针装置的成本较高,而本发明实施例提供的数据源状态判定方法无需借助探针装置实现,因此,大大减小了相关技术中数据源状态检测的成本。

可选的,所述根据所述p个第一终端在所述第一预设时间段内的数据获取失败率,确定所述目标数据源的状态是否为待维修状态,包括:根据所述p个第一终端在所述第一预设时间段内的数据获取失败率,确定所述目标数据源在所述第一预设时间段内发送数据的目标待维修率;判断所述目标数据源是否满足预设判定条件,所述预设判定条件包括:所述目标待维修率大于所述概率阈值;在所述目标数据源满足所述预设判定条件时,确定所述目标数据源的状态为所述待维修状态。也即是,本申请中根据终端的数据获取失败率,得到数据源的数据发送失败率,进而根据数据发送失败率判定数据源的状态。

可选的,所述根据所述p个第一终端在所述第一预设时间段内的数据获取失败率,确定所述目标数据源在所述第一预设时间段内发送数据的目标待维修率,包括:根据所述p个第一终端在所述第一预设时间段内的数据获取失败率,确定所述p个第一终端中目标终端的个数q,其中,所述目标终端在所述第一预设时间段的时长内的数据获取失败率大于预设的概率阈值;将所述p个第一终端中目标终端的占比,作为所述目标待维修率。

可选的,在所述判断所述目标待维修率是否大于所述概率阈值之前,所述方法还包括:确定每个所述第一终端连接的网络接入节点,所述p个第一终端共连接r个网络接入节点,r≥1;统计所述r个网络接入节点中每个网络接入节点连接的第一终端的个数;根据所述每个网络接入节点连接的第一终端的个数确定所述第一终端的离散度,所述预设判定条件还包括:所述第一终端的离散度大于所述离散度阈值。也即是,本申请中结合所述第一终端的离散度判断数据源的状态,从而能够避免由于终端的分布较集中而引起的终端可用率较低,提高了数据源状态判定结果的准确度。

可选的,所述预设判定条件还包括:所述p个第一终端所连接的网络接入节点的个数大于预设的节点数量阈值。也即是,本申请中结合终端的个数判断数据源的状态,在终端的个数较多时,确定出的所述第一终端的离散度更准确,数据源状态判定结果的准确度更高,以及避免由于网络接入节点的数量较少引起的终端的数据获取失败率较高。

可选的,所述预设判定条件还包括:所述第一终端的总数大于预设的终端数量阈值。也即是,本申请中结合终端的数量判断数据源的状态,从而能够提高确定出的目标数据源的目标待维修率的准确程度,提高了数据源状态判定结果的准确度。

可选的,所述获取概率阈值,包括:确定m个第二预设时间段中每个第二预设时间段对应的第二终端,所述第二终端用于在其对应的第二预设时间段内获取所述目标数据源上的数据,所述m个第二预设时间段均位于所述第一预设时间段之前,且所述每个第二预设时间段的时长均等于所述第一预设时间段的时长,m≥1;获取每个所述第二终端在其对应的第二预设时间段内的数据获取失败率;根据获取到的第二终端的数据获取失败率,确定所述目标数据源的待维修率基准值;根据所述待维修率基准值确定所述概率阈值。

也即是,本申请中参考与目标数据源相关的历史数据确定待维修率基准值,并根据该待维修率基准值确定该概率阈值,进而根据该概率阈值判定目标数据源的状态是否为待维修状态。若目标数据源发送数据的目标待维修率大于该概率阈值,则可以表明该目标数据源的离群度较高,该目标数据源是不正常的数据源,并确定目标数据源的状态为待维修状态。

可选的,所述获取概率阈值,包括:确定n个参考数据源中每个参考数据源对应的第三终端,所述第三终端用于在所述第一预设时间段内获取其对应的参考数据源上的数据,n≥1;获取每个所述第三终端在所述第一预设时间段内的数据获取失败率;根据所述每个参考数据源对应的第三终端在所述第一预设时间段内的数据获取失败率,确定所述每个参考数据源在所述第一预设时间段内发送数据的参考待维修率;根据所述目标待维修率以及所述n个参考数据源的n个参考待维修率,确定所述概率阈值。

也即是,本申请中参考其他参考数据源发送数据的参考待维修率,以确定该概率阈值,进而根据该概率阈值判定目标数据源的状态是否为待维修状态。若目标数据源发送数据的目标待维修率大于该概率阈值,则可以表明该目标数据源的离群度较高,该目标数据源是不正常的数据源,并确定目标数据源的状态为待维修状态。

可选的,所述参考数据源与所述目标数据源的类型相同。也即为了提高确定出的概率阈值的准确度,数据源状态判定装置所参考的参考数据源的类型可以与目标数据源的类型相同。

第二方面,提供了一种数据源状态判定装置,所述数据源状态判定装置包括:第一确定模块,用于确定在第一预设时间段内用于获取目标数据源上数据的p个第一终端,p≥1;获取模块,用于获取每个所述第一终端在所述第一预设时间段内的数据获取失败率,其中,若在数据源上某一数据的预计获取时间段内,终端未获取到所述某一数据,则终端获取所述某一数据失败;第二确定模块,用于根据所述p个第一终端在所述第一预设时间段内的数据获取失败率,确定所述目标数据源的状态是否为待维修状态。

可选的,所述第二确定模块包括:第一确定单元,根据所述p个第一终端在所述第一预设时间段内的数据获取失败率,确定所述目标数据源在所述第一预设时间段内发送数据的目标待维修率;获取单元,用于获取预设的概率阈值;第一判断单元,用于判断所述目标数据源是否满足预设判定条件,所述预设判定条件包括:所述目标待维修率大于所述概率阈值;第二确定单元,用于在所述目标数据源满足所述预设判定条件时,确定所述目标数据源的状态为所述待维修状态。

可选的,所述第一确定单元用于:根据所述p个第一终端在所述第一预设时间段内的数据获取失败率,确定所述p个第一终端中目标终端的个数q,其中,所述目标终端在所述第一预设时间段的时长内的数据获取失败率大于预设的概率阈值;将所述p个第一终端中目标终端的占比,作为所述目标待维修率。

可选的,所述数据源状态判定装置还包括:第三确定模块,用于确定每个所述第一终端连接的网络接入节点,所述p个第一终端共连接r个网络接入节点,r≥1;统计模块,用于统计所述r个网络接入节点中每个网络接入节点连接的第一终端的个数;第四确定模块,用于根据p以及所述每个网络接入节点连接的第一终端的个数确定所述第一终端的离散度,所述预设判定条件还包括:所述第一终端的离散度大于所述离散度阈值。

可选的,所述预设判定条件还包括:所述p个第一终端所连接的网络接入节点的个数大于预设的节点数量阈值。

可选的,所述预设判定条件还包括:所述第一终端的总数大于预设的终端数量阈值。

可选的,所述获取单元用于:确定m个第二预设时间段中每个第二预设时间段对应的第二终端,所述第二终端用于在其对应的第二预设时间段内获取所述目标数据源上的数据,所述m个第二预设时间段均位于所述第一预设时间段之前,且所述每个第二预设时间段的时长均等于所述第一预设时间段的时长,m≥1;获取每个所述第二终端在其对应的第二预设时间段内的数据获取失败率;根据获取到的第二终端的数据获取失败率,确定所述目标数据源的待维修率基准值;根据所述待维修率基准值确定所述概率阈值。

可选的,所述获取单元用于:确定n个参考数据源中每个参考数据源对应的第三终端,所述第三终端用于在所述第一预设时间段内获取其对应的参考数据源上的数据,n≥1;获取每个所述第三终端在所述第一预设时间段内的数据获取失败率;根据所述每个参考数据源对应的第三终端在所述第一预设时间段内的数据获取失败率,确定所述每个参考数据源在所述第一预设时间段内发送数据的参考待维修率;根据所述目标待维修率以及所述n个参考数据源的n个参考待维修率,确定所述概率阈值。

可选的,所述参考数据源与所述目标数据源的类型相同。

第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述计算机可读存储介质在计算机上运行时,使得计算机执行如第一方面所述的数据源状态判定方法。

第四方面,提供了一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如第一方面所述的数据源状态判定方法。

第五方面,提供了一种数据处理装置,所述数据处理装置包括:至少一个处理器、至少一个网络接口、存储器和至少一个通信总线,所述处理器用于执行所述存储器中存储的程序,以实现第一方面所述的数据源状态判定方法。

附图说明

图1为本发明实施例提供的一种数据源状态判定方法的应用场景示意图;

图2为本发明实施例提供的一种数据源状态判定装置的具体应用场景示意图;

图3为本发明实施例提供的一种数据源状态判定装置的结构示意图;

图4为本发明实施例提供的一种数据源状态判定方法的方法流程图;

图5为本发明实施例提供的一种目标终端判定结果示意图;

图6为本发明实施例提供的一种概率阈值确定方法的方法流程图;

图7为本发明实施例提供的另一种概率阈值确定方法的方法流程图;

图8为本发明实施例提供的另一种数据源状态判定方法的方法流程图;

图9为本发明实施例提供的另一种数据源状态判定装置的结构示意图;

图10为本发明实施例提供的一种第二确定模块的结构示意图;

图11为本发明实施例提供的又一种数据源状态判定装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

图1为本发明实施例提供的一种数据源状态判定方法的应用场景示意图,如图1所示,该应用场景中存在多个终端和多个数据源。如终端A1、终端A2和终端A3,数据源B1、数据源B2和数据源B3。终端通过运营商网络中的网络接入节点与数据源连接,示例的,终端A1和终端A2通过网络接入节点C1与数据源B1和B2连接,终端A3通过网络接入节点C2与数据源B3连接。示例的,图1中的终端可以为手机、电视或电脑,图1中的数据源可以为服务器或服务器集群,网络接入节点可以为交换机等能够提供数据交接服务的设备。

需要说明的是,该多个数据源可以按照数据在数据源上存储的时间的长短分为两类数据源,其中,第一类数据源上的数据在该第一类数据源上存储的时间大于预设时长阈值,第二类数据源上的数据在该第二类数据源上存储的时间小于或等于该预设时长阈值。例如,当多个数据源均为视频数据源时,该多个数据源中的第一类数据源可以称为点播视频数据源,第二类数据源可以称为直播视频数据源。当某一数据源为网页数据源时,该网页数据源为第一类数据源。

示例的,当终端为电视(television,TV)时,TV连接的数据源可以为直播视频数据源和点播视频数据源。图2为本发明实施例提供的一种数据源状态判定装置的具体应用场景示意图。如图2所示,TV可以通过机顶盒(Set Top Box,STB)和光网络终端(Opticalnetwork terminal,ONT)与运营商网络中的网络接入节点连接。该网络接入节点为光线路终端(optical line terminal,OLT)。进一步的,该运营商网络还可以包括与该OLT依次连接的交换机(line switch,LSW)、宽带远程接入服务器(Broadband Remote AccessServer,BRAS)、地市核心路由器(Core router,CR)和省干CR。其中,省干CR可以连接有直播视频数据源和点播视频数据源,BRAS和地市CR均可以连接有点播视频数据源。

图3为本发明实施例提供的一种数据源状态判定装置的结构示意图。需要说明的是,图1中的终端与网络接入节点的连接关系由资管设备(图1中未示出)管理,该数据源状态判定装置可以与资管设备连接。该数据源状态判定装置还可以与每个终端连接,或者数据源状态判定装置可以与每个终端和网络接入节点之间的通信设备连接。该数据源状态判定装置可以用于判定图1中的任一数据源的状态是否为待维修状态。

如图3所示,该数据源状态判定装置可以包括:至少一个处理器10221(例如中央处理器)、至少一个网络接口10222、存储器10223和至少一个总线10224,总线10224用于实现处理器、网络接口和存储器之间的连接通信;存储器10223与网络接口10222分别通过总线10224与处理器10221相连。处理器10221用于执行存储器10223中存储的可执行模块,例如计算机程序。存储器10223可能包含高速随机存取存储器(Random Access Memory,RAM),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个网络接口10222(有线或者无线)实现该数据处理装置与至少一个其他装置之间的通信连接。在一些实施方式中,存储器10223存储了程序10225,程序10225能够被处理器10221执行以实现图3所示的数据源状态判定方法。

图4为本发明实施例提供的一种数据源状态判定方法的方法流程图,该数据源状态判定方法可以用于判定图1中任一数据源的状态是否为待维修状态,该数据源状态判定方法可以用于图3所示的数据源状态判定装置。如图4所示,该数据源状态判定方法包括:

步骤401、确定在第一预设时间段内用于获取目标数据源上数据的p个第一终端,p≥1。

需要说明的是,终端在需要获取数据源上的数据时,需要首先向数据源发送数据请求,数据源在接收到该数据请求后,可以根据该数据请求向该终端发送数据。目标数据源可以为图1所示的应用环境中的任一数据源。数据源状态判定装置可以检测图1所示的应用环境中每个终端获取的数据所在的数据源,进而确定在第一预设时间段内用于获取目标数据源上数据的p个第一终端。

其中,数据源状态判定装置可以通过对终端与数据源之间传输的数据包进行深度包检测(Deep Packet Inspection,DPI),确定终端获取的数据所在的数据源。数据源状态判定装置在进行DPI时,可以对数据包进行分析,以获取数据包中的信息,如发送该数据包的数据源的标识以及接收该数据包的终端的标识。且当终端为TV,网络接入节点为ONT时,TV和ONT之间连接有STB,STB上存储有TV播放的视频数据信息,数据源状态判定装置可以与ONT连接,并通过STB采集该视频数据信息,从而确定该终端获取的数据所在的数据源。

示例的,第一预设时间段的时长可以为5分钟,如12点整至12点05分。在步骤401中数据源状态判定装置可以确定用于在这5分钟内获取目标数据源上数据的p个第一终端。该p个第一终端可以为在第一预设时间段内用于获取目标数据源上数据的所有终端,也即该目标数据源的所有在线终端。

步骤402、获取每个第一终端在第一预设时间段内的数据获取失败率。

终端在需要获取数据源上的某一数据时,终端获取该数据的失败概率称为终端的数据获取失败率。每个第一终端在该第一预设时间段内均用于获取目标数据源上的数据,第一终端获取目标数据源上的数据的失败概率为第一终端的数据获取失败率。需要说明的是,当终端需要获取的数据所在的数据源的状态为待维修状态时,该终端的数据获取失败率往往较高。

示例的,当第一终端均为TV时,TV连接的STB用于统计TV的数据获取失败率,数据源状态判定装置可以与该STB建立连接,并获取STB统计得到的TV在第一预设时间段内的数据获取失败率。

又示例的,该数据源状态判定装置可以直接与第一终端建立连接,第一终端在向目标数据源请求某一数据后,该第一终端能够确定该某一数据的预计获取时间段,也即该第一终端预计接收到该某一数据的时间段。例如,在第一终端向目标数据源请求某一数据后,该目标数据源可以向第一终端发送通知消息,该通知消息可以用于指示第一终端请求的该某一数据预计到达第一终端的时间段,也即该某一数据的预计获取时间段。第一终端可以检测第一预设时间段内的每个预计获取时间段内是否接收到相应的数据。若第一终端在某一预计时间段内获取到该预计时间段相应的数据(也即该预计时间段内应该接收到的数据),则第一终端可以认为成功获取到了该数据。若第一终端未在预计获取时间段内获取到该预计时间段相应的数据,则第一终端可以认为获取该数据失败。也即是,第一终端只有在某一数据的预计获取时间段内获取到该数据,第一终端才会认为其成功获取到该数据。第一终端可以将该第一预设时间段内的获取到相应的数据的预计获取时间段个数,与该第一预设时间段内的所有预计获取时间段个数之比,确定为该第一终端在第一预设时间段内的数据获取失败率。

例如,第一终端在第一预设时间段内预计获取到10个数据(如数据包,或数据帧),也即该第一预设时间段包括10个预计获取时间段。若第一终端在这10个预计获取时间段内,共成功获取7个数据,则该第一终端在第一预设时间段内的数据获取失败率为30%。

需要说明的是,若终端获取某一数据失败,则该终端无法有效的展示该数据,从而使得终端的用户体验较差。因此,该第一终端在第一预设时间段内的数据获取失败率,能够反映终端在展示获取到数据的过程中用户体验较差的概率,该数据获取失败率也即是能够反映用户体验的数据,该数据获取失败率也可以称为终端的不可用率。

步骤403、根据p个第一终端在第一预设时间段内的数据获取失败率,确定目标数据源在第一预设时间段内发送数据的目标待维修率。

数据源状态判定装置上可以存储有预设的概率阈值。数据源状态判定装置在获取到每个第一终端在第一预设时间段内的数据获取失败率后,可以将每个第一终端在第一预设时间段内的数据获取失败率与该预设的概率阈值进行比较。当某一第一终端在第一预设时间段内的数据获取失败率大于该预设的概率阈值时,数据源状态判定装置可以确定该第一终端为目标终端。当某一第一终端在第一预设时间段内的数据获取失败率小于预设的概率阈值时,该数据源状态判定装置可以确定第一终端并不是目标终端。在将p个第一终端在第一预设时间段内的数据获取失败率均与预设的概率阈值进行比较后,该数据源状态判定装置能够确定该p个第一终端中目标终端的个数q,q为小于或等于p的整数。

数据源状态判定装置可以将p个第一终端中目标终端的占比(也即q与p的比值),确定为目标数据源在第一预设时间段内发送数据的目标待维修率。

例如,图5为本发明实施例提供的一种目标终端判定结果示意图,如图5所示,在第一预设时间段内共存在8个第一终端,如第一终端1、第一终端2、第一终端3、第一终端4、第一终端5、第一终端6、第一终端7和第一终端8。数据源状态判定装置在确定某一第一终端为目标终端时,可以对该第一终端标记“1”,在确定某一第一终端不是目标终端时,可以对该第一终端标记“0”。也即,在第一预设时间段内用于获取目标数据源上数据的第一终端共有8个,且这8个第一终端中的4个第一终端为目标终端,数据源状态判定装置可以将4与8的比值50%确定为目标数据源在第一预设时间段内的数据发送失败率。

需要说明的是,本发明实施例中数据源状态判定装置将p个第一终端中目标终端的占比确定为目标数据源发送数据的目标待维修率,实际应用中,数据源状态判定装置还可以对p和q进行其他运算得到该目标待维修率,例如,将q与2p的比值作为目标待维修率,本发明实施例对此不作限定。

步骤404、获取概率阈值。

步骤405、判断目标待维修率是否大于概率阈值。若目标待维修率大于概率阈值,则执行步骤406;若目标待维修率小于或等于概率阈值,则执行步骤401。

在确定出目标数据源在第一预设时间段内发送数据的目标待维修率与概率阈值后,可以比较目标待维修率与概率阈值。在确定目标待维修率与概率阈值的大小关系后,若目标待维修率大于预设的概率阈值,则数据源状态判定装置可以执行步骤406;若目标待维修率小于或等于预设的概率阈值,则数据源状态判定装置可以执行步骤401,也即重复检测目标数据源的状态是否为待维修状态。

步骤406、确定目标数据源的状态为待维修状态。

在步骤405中的判断结果为目标待维修率大于概率阈值时,数据源状态判定装置可以确定此时目标数据源已经处于待维修状态,此时,目标数据源向终端发送数据的失败率较高(也即目标数据源向终端发送数据的成功率较低),目标数据源向终端提供数据的能力较差,目标数据源处于质差的状态。此时,亟需对目标数据源进行维修,以提高目标数据源向终端发送数据的成功率。相应的,维修人员可以根据目标数据源的状态为待维修状态的判定结果,对目标数据源进行维修,以提高目标数据源发送数据的成功率,以及终端的数据获取成功率,提高终端的用户体验,使目标数据源脱离质差的状态。

相关技术中,在检测数据源的状态时,会控制探针装置会模拟终端请求数据的过程,且在请求数据后检测数据源发送的数据,并根据检测结果判定数据源的状态。由于该过程与实际终端获取数据源上数据的过程存在差异,因此,数据源的状态判定结果较不准确。而本发明实施例中,由于第一终端的数据获取失败率是在第一终端获取数据过程中获取的,所以获取得到的数据获取失败率的真实度较高,根据该数据获取失败率对目标数据源的状态是否为待维修状态的判定结果较为准确。

另外,由于相关技术中采用探针装置进行数据源状态判定,因此数据源状态判定的成本较高,而本发明实施例提供的数据源状态判定方法无需借助探针装置实现,所以大大减小了数据源状态的成本。

需要说明的是,步骤404中的概率阈值可以为预设的固定数值,数据源状态判定装置可以直接获取该预设的固定数值,并将该固定数值作为概率阈值。可选的,步骤404中的概率阈值还可以为数据源状态判定装置统计得到的数值,以下将对数据源状态判定装置如何统计得到概率阈值的过程进行讲解。

在第一种可实现方式中,数据源状态判定装置可以基于历史数据确定概率阈值。图6为本发明实施例提供的一种数据源状态判定方法中确定概率阈值的方法流程图。如图6所示,步骤404可以包括:

步骤4041a、确定m个第二预设时间段中每个第二预设时间段对应的第二终端,其中,第二终端用于在其对应的第二预设时间段内获取目标数据源上的数据,m个第二预设时间段均位于第一预设时间段之前,且每个第二预设时间段的时长均等于第一预设时间段的时长,m≥1。

第一预设时间段的时长和第二预设时间段的时长均为预设时长(如5分钟)。数据源状态判定装置需要在第一预设时间段之前的每个第二预设时间段内,统计用于获取目标数据源上数据的第二终端。如数据源状态判定装置在第一预设时间段前的1个小时内,统计连续的12个第二预设时间段内每个第二预设时间段对应的第二终端。

需要说明的是,m个第二预设时间段可以存在时间交集(如一个第二预设时间段为12点整到12点05分,另一个第二预设时间段为12点03分到12点08分),m个第二预设时间段也可以不存在时间交集(如一个第二预设时间段为12点整到12点05分,另一个第二预设时间段为12点06分到12点11分),本发明实施例对此不作限定。

步骤4042a、获取每个第二终端在其对应的第二预设时间段内的数据获取失败率。

示例的,0≤i≤m,数据源状态判定装置在确定第i个第二预设时间段对应的r

步骤4043a、根据获取到的第二终端的数据获取失败率,确定目标数据源的待维修率基准值。

数据源状态判定装置在获取到r

数据源状态判定装置还可以根据公式:

步骤4044a、根据待维修率基准值确定概率阈值。

数据源状态判定装置可以根据中心极限定理规律,将步骤401中确定出的第一终端的个数p,以及步骤4043a中确定出的待维修率基准值X,输入

需要说明的是,在计算概率阈值时采用的公式

数据源状态判定装置在该第一种可实现方式中,可以参考与该目标数据源相关的历史数据确定目标数据源的待维修率基准值,以及根据该待维修率基准值确定该概率阈值,进而根据该概率阈值判定目标数据源的状态是否为待维修状态。若目标数据源发送数据的目标待维修率大于该概率阈值,则可以表明该目标数据源的离群度较高,该目标数据源是不正常的数据源,并确定目标数据源的状态为待维修状态。

在第二种可实现方式中,数据源状态判定装置可以基于目标待维修率以及参考数据源发送数据的参考待维修率确定概率阈值。图7为本发明实施例提供的另一种概率阈值确定方法的方法流程图。如图7所示,步骤404可以包括:

步骤4041b、确定n个参考数据源中每个参考数据源对应的第三终端,其中,第三终端用于在第一预设时间段内获取其对应的参考数据源上的数据,n≥1。

数据源状态判定装置可以在执行步骤401的同时,确定n个参考数据源,并确定n个参考数据源中每个参考数据源对应的第三终端,n≥1。例如,数据源状态判定装置可以确定在第一预设时间段内用于获取这n个参考数据源中,第j个参考数据源上数据的t

步骤4042b、获取每个第三终端在第一预设时间段内的数据获取失败率。

在确定第三终端后,数据源状态判定装置还需要确定第三终端在该第一预设时间段内的数据获取失败率。数据源状态判定装置确定第三终端的数据获取失败率的过程可以参考步骤402中确定第一终端的数据获取失败率的过程,本发明实施例在此不做赘述。

步骤4043b、根据每个参考数据源对应的第三终端在第一预设时间段内的数据获取失败率,确定每个参考数据源在第一预设时间段内发送数据的参考待维修率。

需要说明的是,数据源状态判定装置确定参考数据源发送数据的参考待维修率的过程可以参考步骤403,本发明实施例在此不做赘述。

示例的,t

步骤4044b、根据目标待维修率以及n个参考数据源的n个参考待维修率,确定概率阈值。

在确定目标数据源发送数据的目标待维修率,以及n个参考数据源的n个参考待维修率之后,该数据源状态判定装置还可以对该目标待维修率和n个参考待维修率进行四分位统计,以确定目标待维修率和n个参考待维修率中的1/4分位数和3/4分位数。需要说明的是,对目标待维修率和n个参考待维修率进行四分位统计也即是,将目标待维修率和n个参考待维修率按照从小到大的顺序进行排序,并确定从小到大排列在前25%处的失败率为该1/4分位数,以及确定从小到大排列在前75%处的失败率为该3/4分位数。

在确定目标待维修率和n个参考待维修率中的1/4分位数和3/4分位数之后,数据源状态判定装置可以将该1/4分位数和3/4分位数输入Y=Q3+1.5(Q3-Q1),以得到概率阈值Y,其中,Q1为1/4分位数,Q3为3/4分位数。需要说明的是,Y=Q3+1.5(Q3-Q1)中(Q3-Q1)的系数为1.5,实际应用中,该系数还可以为其他数值(如1.2),本发明实施例对此不作限定。

在该第二种可实现方式中,数据源状态判定装置可以参考其他参考数据源的参考待维修率,以确定该概率阈值,进而根据该概率阈值判定目标数据源的状态是否为待维修状态。若目标数据源的目标待维修率大于该概率阈值,则可以表明该目标数据源的离群度较高,该目标数据源是不正常的数据源,并确定目标数据源的状态为待维修状态。

进一步的,为了提高确定出的概率阈值的准确度,数据源状态判定装置所参考的参考数据源的类型可以与目标数据源的类型相同。例如,当目标数据源为直播视频数据源时,该n个参考数据源均为直播视频数据源;当目标数据源为点播视频数据源时,该n个参考数据源均为点播视频数据源。可选的,该n个参考数据源可以为全网数据源中与目标数据源类型相同的所有数据源。

综上所述,由于本发明实施例提供的数据源状态判定方法中,在第一终端获取目标数据源中数据的第一预设时间段内还获取了第一终端的数据获取失败率,也即是该第一终端的数据获取失败率是在第一终端获取数据过程中获取的,所以,获取得到的数据获取失败率的真实度较高,根据该数据获取失败率对目标数据源的状态是否为待维修状态的判定结果较为准确。

图8为本发明实施例提供的另一种数据源状态判定方法的方法流程图,该数据源状态判定方法可以用于判定图1中任一数据源的状态,该数据源状态判定方法可以用于图3所示的数据源状态判定装置。如图8所示,该数据源状态判定方法包括:

步骤801、确定在第一预设时间段内用于获取目标数据源上数据的p个第一终端,p≥1。

需要说明的是,步骤801可以参考步骤401,本发明实施例在此不做赘述。

步骤802、获取每个第一终端在第一预设时间段内的数据获取失败率。

需要说明的是,步骤802可以参考步骤402,本发明实施例在此不做赘述。

步骤803、根据p个第一终端在第一预设时间段内的数据获取失败率,确定目标数据源在所述第一预设时间段内发送数据的目标待维修率。

需要说明的是,步骤803可以参考步骤403,本发明实施例在此不做赘述。

步骤804、获取概率阈值。

需要说明的是,步骤804可以参考步骤404,本发明实施例在此不做赘述。

步骤805、确定每个第一终端连接的网络接入节点,p个第一终端共连接r个网络接入节点,r≥1。

数据源状态判定装置在确定p个第一终端后,还可以确定每个第一终端连接的网络接入节点。示例的,数据源状态判定装置可以通过运营商网络中的资管信息,确定每个第一终端连接的网络接入节点。当第一终端为TV时,数据源状态判定装置可以确定第一终端连接的OLT,也即获取每个第一终端连接的OLT的标识。该p个第一终端共连接有r个网络接入节点。

步骤806、统计r个网络接入节点中每个网络接入节点连接的第一终端的个数。

在确定每个第一终端连接的网络接入节点后,数据源状态判定装置还可以根据每个第一终端连接的网络接入节点,统计r个网络接入节点中每个网络接入节点连接的第一终端的个数。

示例的,假设第一终端1连接网络接入节点1,第一终端2连接网络接入节点1,第一终端3连接网络接入节点2,第一终端4连接网络接入节点3,第一终端5连接网络接入节点3,第一终端6连接网络接入节点4,第一终端7连接网络接入节点4,第一终端6连接网络接入节点4。则如表1所示,数据源状态判定装置可以确定:网络接入节点1共连接有两个第一终端,网络接入节点2共连接有一个第一终端,网络接入节点3共连接有两个第一终端,网络接入节点4共连接有三个第一终端。

表1

步骤807、根据每个网络接入节点连接的第一终端的个数确定所述第一终端的离散度。

示例的,根据基尼指数公式可以得到所述第一终端的离散度

示例的,若p=8,8个第一终端共连接四个网络接入节点,这四个网络接入节点中的第一个网络接入节点(如网络接入节点1)共连接有两个第一终端,第二个网络接入节点(如网络接入节点2)共连接有一个第一终端,第三个网络接入节点(如网络接入节点3)共连接有两个第一终端,第四个网络接入节点(如网络接入节点4)共连接有三个第一终端,则第一终端的离散度

又示例的,若存在10个网络接入节点,且每个网络接入节点所连接的第一终端的数量如表2所示时,则数据源状态判定装置得出的第一终端的离散度D≈0.5605。

表2

又示例的,若存在10个网络接入节点,且每个网络接入节点所连接的第一终端的数量如表3所示时,则数据源状态判定装置得出的第一终端的离散度D≈0.8933。

表3

步骤808、判断目标数据源是否满足预设判定条件,预设判定条件包括:目标待维修率大于概率阈值,且第一终端的离散度大于预设的离散度阈值。若目标数据源满足预设判定条件,则执行步骤809;若目标数据源不满足预设判定条件,则执行步骤801。

在确定目标待维修率、以及第一终端的离散度后,数据源状态判定装置可以判断目标数据源是否满足预设判定条件。当目标待维修率大于概率阈值,且第一终端的离散度大于预设的离散度阈值时,数据源状态判定装置则可以确定目标数据源满足预设判定条件。也即是,数据源状态判定装置在确定目标数据源同时满足上述两个条件时,才能确定目标数据源满足预设判定条件。示例的,该预设的离散度阈值可以为0.8。

需要说明的是,本发明实施例中该预设判定条件共包括:目标待维修率大于概率阈值,且第一终端的离散度大于预设的离散度阈值;实际应用中,预设判定条件可以包括:目标待维修率大于概率阈值,且第一终端的离散度大于预设的离散度阈值,以及p个第一终端所连接的网络接入节点的个数大于预设的节点数量阈值;或者,预设判定条件包括:目标待维修率大于概率阈值,以及第一终端的总数大于预设的终端数量阈值;或者,预设判定条件包括:目标待维修率大于概率阈值,第一终端的离散度大于预设的离散度阈值,以及第一终端的总数大于预设的终端数量阈值;或者,预设判定条件包括:目标待维修率大于概率阈值,第一终端的离散度大于预设的离散度阈值,p个第一终端所连接的网络接入节点的个数大于预设的节点数量阈值,以及第一终端的总数大于预设的终端数量阈值。

示例的,该预设的节点数量阈值可以为3,该预设的终端数量阈值可以为100。

步骤809、确定目标数据源的状态为待维修状态。

需要说明的是,步骤809可以参考步骤407,本发明实施例在此不做赘述。

综上所述,由于本发明实施例提供的数据源状态判定方法中,在第一终端获取目标数据源中数据的第一预设时间段内还获取了第一终端的数据获取失败率,也即是该第一终端的数据获取失败率是在第一终端获取数据过程中获取的,所以,获取得到的数据获取失败率的真实度较高,根据该数据获取失败率对目标数据源的状态是否为待维修状态的判定结果较为准确。

图9为本发明实施例提供的另一种数据源状态判定装置的结构示意图,如图9所示,该数据源状态判定装置90可以包括:

第一确定模块901,用于确定在第一预设时间段内用于获取目标数据源上数据的p个第一终端,p≥1;

获取模块902,用于获取每个第一终端在第一预设时间段内的数据获取失败率,其中,若在数据源上某一数据的预计获取时间段内,终端未获取到该某一数据,则终端获取该某一数据失败;

第二确定模块903,用于根据p个第一终端在第一预设时间段内的数据获取失败率,确定目标数据源的状态是否为待维修状态。

综上所述,由于本发明实施例提供的数据源状态判定装置中,在第一终端获取目标数据源中数据的第一预设时间段内,获取模块还获取了第一终端的数据获取失败率,也即是该第一终端的数据获取失败率是在第一终端获取数据过程中获取的,所以,获取模块获取得到的数据获取失败率的真实度较高,第二确定模块根据该数据获取失败率对目标数据源的状态是否为待维修状态的判定结果较为准确。

图10为本发明实施例提供的一种第二确定模块的结构示意图,如图10所示,第二确定模块903可以包括:

第一确定单元9031,根据p个第一终端在第一预设时间段内的数据获取失败率,确定目标数据源在第一预设时间段内发送数据的目标待维修率;

获取单元9032,用于获取预设的概率阈值;

第一判断单元9033,用于判断目标数据源是否满足预设判定条件,预设判定条件包括:目标待维修率大于概率阈值;

第二确定单元9034,用于在目标数据源满足预设判定条件时,确定目标数据源的状态为待维修状态。

可选的,第一确定单元9031可以用于:根据p个第一终端在第一预设时间段内的数据获取失败率,确定p个第一终端中目标终端的个数q,其中,目标终端在第一预设时间段的时长内的数据获取失败率大于预设的概率阈值;将p个第一终端中目标终端的占比,作为目标待维修率。

图11为本发明实施例提供的又一种数据源状态判定装置的结构示意图,如图11所示,在图8的基础上,该数据源状态判定装置80还可以包括:

第三确定模块904,用于确定每个第一终端连接的网络接入节点,p个第一终端共连接r个网络接入节点,r≥1;

统计模块905,用于统计r个网络接入节点中每个网络接入节点连接的第一终端的个数;

第四确定模块906,用于根据p以及每个网络接入节点连接的第一终端的个数确定第一终端的离散度,预设判定条件还包括:第一终端的离散度大于离散度阈值。

可选的,所述预设判定条件还包括:所述p个第一终端所连接的网络接入节点的个数大于预设的节点数量阈值。

可选的,所述预设判定条件还包括:所述第一终端的总数大于预设的终端数量阈值。

可选的,获取单元9033可以用于:

确定m个第二预设时间段中每个第二预设时间段对应的第二终端,第二终端用于在其对应的第二预设时间段内获取目标数据源上的数据,m个第二预设时间段均位于第一预设时间段之前,且每个第二预设时间段的时长均等于第一预设时间段的时长,m≥1;

获取每个第二终端在其对应的第二预设时间段内的数据获取失败率;

根据获取到的第二终端的数据获取失败率,确定目标数据源的待维修率基准值;

根据待维修率基准值确定概率阈值。

可选的,获取单元9033可以用于:

确定n个参考数据源中每个参考数据源对应的第三终端,第三终端用于在第一预设时间段内获取其对应的参考数据源上的数据,n≥1;

获取每个第三终端在第一预设时间段内的数据获取失败率;

根据每个参考数据源对应的第三终端在第一预设时间段内的数据获取失败率,确定每个参考数据源在第一预设时间段内发送数据的参考待维修率;

根据目标待维修率以及n个参考数据源的n个参考待维修率,确定概率阈值。

可选的,参考数据源与目标数据源的类型相同。

综上所述,由于本发明实施例提供的数据源状态判定装置中,在第一终端获取目标数据源中数据的第一预设时间段内,获取模块还获取了第一终端的数据获取失败率,也即是该第一终端的数据获取失败率是在第一终端获取数据过程中获取的,所以,获取模块获取得到的数据获取失败率的真实度较高,第二确定模块根据该数据获取失败率对目标数据源的状态是否为待维修状态的判定结果较为准确。

在上述实施例中,能够全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,能够全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机能够是通用计算机、计算机网络、或者其他可编程装置。所述计算机指令能够存储在计算机的可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令能够从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心传输。所述计算机可读存储介质能够是计算机能够存取的任何可用介质或者包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质能够是磁性介质(例如,软盘、硬盘、磁带)、光介质,或者半导体介质(例如固态硬盘)等。

本发明实施例提供的数据源状态判定方法实施例能够与数据源状态判定装置实施例互相参考,本申请对此不作限定。需要说明的是,本发明实施例提供的方法实施例步骤的先后顺序能够进行适当调整,步骤也能够根据情况进行相应增减,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。

以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 数据源状态判定方法及装置、计算机可读存储介质
  • 门锁定装置的状态判定装置及方法和计算机可读存储介质
技术分类

06120112833078