导航：首页> 计算；推算；计数>样本数据生成、模型训练、异常运行原因确定方法及装置

样本数据生成、模型训练、异常运行原因确定方法及装置

文献发布时间：2024-04-18 19:58:53

技术领域

本文件涉及计算机技术领域，尤其涉及一种样本数据生成、模型训练、异常运行原因确定方法及装置。

背景技术

通过确定应用程序的异常运行原因，可以指导开发人员进一步优化应用程序。现有技术中可以借助于自动化的原因分析系统，定位应用程序的异常运行原因，然而该原因分析系统依赖于海量同类异常的数据，对于偶发的应用程序异常，由于缺少同类异常的数据，因此导致该原因分析系统定位原因的准确率降低。

发明内容

本说明书实施例提供了一种样本数据生成、模型训练、异常运行原因确定方法及装置，针对偶发的应用程序异常，不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因，提高了确定应用程序的异常运行原因的准确率。

第一方面，本说明书实施例提供了一种样本数据生成方法，包括：

通过目标应用程序对应的自动化归因模型，确定所述目标应用程序的至少一个异常运行原因，对至少一个所述异常运行原因进行分类，得到异常运行原因类型；

从所述目标应用程序的历史异常运行数据中，获取所述异常运行原因类型对应的异常运行数据，并确定所述异常运行数据在预设的运行数据指标项下的数据指标值；

确定所述异常运行原因类型和所述数据指标值之间的对应关系，根据所述对应关系，将所述异常运行原因类型和所述数据指标值作为模型训练样本数据。

第二方面，本说明书实施例提供了一种模型训练方法，包括：

获取如上述第一方面所述的方法生成的模型训练样本数据；

利用所述模型训练样本数据，训练预先搭建的神经网络结构直至收敛，将训练收敛的所述神经网络结构，作为所述目标应用程序的异常运行原因确定模型；

其中，所述神经网络结构中的参数用于表示同一所述异常运行原因类型对应的各个所述数据指标值分别对该同一所述异常运行原因类型的贡献权重。

第三方面，本说明书实施例提供了一种异常运行原因确定方法，包括：

获取如上述第二方面所述的方法所训练的所述目标应用程序的异常运行原因确定模型，以及，获取所述目标应用程序的待分析异常运行数据；

确定所述待分析异常运行数据在所述运行数据指标项下的待分析数据指标值；

通过所述异常运行原因确定模型对所述待分析数据指标值进行处理，根据处理结果，确定所述目标应用程序的异常运行原因类型。

第四方面，本说明书实施例提供了一种样本数据生成装置，包括：

原因分类单元，用于通过目标应用程序对应的自动化归因模型，确定所述目标应用程序的至少一个异常运行原因，对至少一个所述异常运行原因进行分类，得到异常运行原因类型；

指标确定单元，用于从所述目标应用程序的历史异常运行数据中，获取所述异常运行原因类型对应的异常运行数据，并确定所述异常运行数据在预设的运行数据指标项下的数据指标值；

样本生成单元，用于确定所述异常运行原因类型和所述数据指标值之间的对应关系，根据所述对应关系，将所述异常运行原因类型和所述数据指标值作为模型训练样本数据。

第五方面，本说明书实施例提供了一种模型训练装置，包括：

样本获取单元，用于获取如上述第四方面所述的装置生成的模型训练样本数据；

模型训练单元，用于利用所述模型训练样本数据，训练预先搭建的神经网络结构直至收敛，将训练收敛的所述神经网络结构，作为所述目标应用程序的异常运行原因确定模型；

其中，所述神经网络结构中的参数用于表示同一所述异常运行原因类型对应的各个所述数据指标值分别对该同一所述异常运行原因类型的贡献权重。

第六方面，本说明书实施例提供了一种异常运行原因确定装置，包括：

模型获取单元，用于获取如上述第五方面所述的装置所训练的所述目标应用程序的异常运行原因确定模型，以及，获取所述目标应用程序的待分析异常运行数据；

数据确定单元，用于确定所述待分析异常运行数据在所述运行数据指标项下的待分析数据指标值；

原因分析单元，用于通过所述异常运行原因确定模型对所述待分析数据指标值进行处理，根据处理结果，确定所述目标应用程序的异常运行原因类型。

第七方面，本说明书实施例提供了一种电子设备，包括：处理器；以及，被配置为存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器实现上述第一方面所述的方法的步骤，或者，实现上述第二方面所述的方法的步骤，或者，实现上述第三方面所述的方法的步骤。

第八方面，本说明书实施例提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时实现上述第一方面所述的方法的步骤，或者，实现上述第二方面所述的方法的步骤，或者，实现上述第三方面所述的方法的步骤。

通过本说明书一个或多个实施例，将应用程序的异常运行原因类型和应用程序的异常运行数据在预先确定的运行数据指标项下的数据指标值，作为模型训练样本数据，该异常运行原因类型和该数据指标值之间具有对应关系，通过该模型训练样本数据训练应用程序的异常运行原因确定模型，通过该异常运行原因确定模型确定应用程序的异常运行原因。由于利用生成的模型训练样本数据训练模型并通过模型分析应用程序的异常运行原因时，充分考虑到了应用程序的异常运行数据的数据指标值与应用程序的异常运行原因类型之间的关联关系，因此针对偶发的应用程序异常，不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因，提高了确定应用程序的异常运行原因的准确率。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图；

图1为本说明书一实施例提供的样本数据生成方法的流程示意图；

图2为本说明书一实施例提供的模型训练方法的流程示意图；

图3为本说明书一实施例提供的异常运行原因确定方法的流程示意图；

图4为本说明书一实施例提供的样本数据生成装置的结构示意图；

图5为本说明书一实施例提供的模型训练装置的结构示意图；

图6为本说明书一实施例提供的异常运行原因确定装置的结构示意图；

图7为本说明书一实施例提供的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案，下面将结合本说明书一个或多个实施例中的附图，对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书一个或多个实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本文件的保护范围。

图1为本说明书一实施例提供的样本数据生成方法的流程示意图，如图1所示，该方法包括以下步骤：

步骤S102，通过目标应用程序对应的自动化归因模型，确定目标应用程序的至少一个异常运行原因，对至少一个异常运行原因进行分类，得到异常运行原因类型；

步骤S104，从目标应用程序的历史异常运行数据中，获取异常运行原因类型对应的异常运行数据，并确定异常运行数据在预设的运行数据指标项下的数据指标值；

步骤S106，确定异常运行原因类型和数据指标值之间的对应关系，根据该对应关系，将异常运行原因类型和数据指标值作为模型训练样本数据。

本实施例中，将应用程序的异常运行原因类型和应用程序的异常运行数据在预先确定的运行数据指标项下的数据指标值，作为模型训练样本数据，该异常运行原因类型和该数据指标值之间具有对应关系，因此利用生成的模型训练样本数据训练模型并通过模型分析应用程序的异常运行原因时，充分考虑到了应用程序的异常运行数据的数据指标值与应用程序的异常运行原因类型之间的关联关系，因此针对偶发的应用程序异常，不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因，提高了确定应用程序的异常运行原因的准确率。

本实施例中的方法能够应用在后台服务器上，由后台服务器执行，该后台服务器可以为专门用来生成模型训练样本数据的服务器。

本实施例中，目标应用程序可以是任意类型的应用程序，这里不做限定。上述步骤S102中，通过目标应用程序对应的自动化归因模型，确定目标应用程序的异常运行原因，对异常运行原因进行分类，得到异常运行原因类型，以及，获取预先为目标应用程序配置的运行数据指标项。针对目标应用程序而言，异常运行原因的数量可以为多个，异常运行原因类型的数量可以为一个或多个，运行数据指标项的数量也可以为一个或多个。

在一个实施例中，通过目标应用程序对应的自动化归因模型，确定目标应用程序的异常运行原因，具体为：

(1)通过自动化归因模型中的各个归因节点对目标应用程序进行异常运行归因，得到目标应用程序的异常运行原因；

其中，每个归因节点对应一预定异常运行原因；目标应用程序的异常运行原因包括预定异常运行原因。

具体而言，目标应用程序对应的自动化归因模型用于对目标应用程序进行异常定位。该自动化归因模型中包括多个子模型，每个子模型包括一个归因节点，因此该自动化归因模型包括多个归因节点。每个归因节点对应一个预先人工设置的预定异常运行原因。可以将目标应用程序的异常运行数据输入至该自动化归因模型，归因节点可以判断该异常运行数据对应的异常运行原因是否为自身节点对应的预定异常运行原因，从而对目标应用程序进行异常运行归因。本实施例中，获取目标应用程序一段时间内如1个月内的异常运行数据，将异常运行数据输入至自动化归因模型，通过自动化归因模型中的各个归因节点对目标应用程序进行异常运行归因，得到目标应用程序的各个异常运行原因。由于每个归因节点对应一预定异常运行原因，因此目标应用程序的异常运行原因应该位于各个预定异常运行原因中，也即，目标应用程序的异常运行原因包括预定异常运行原因。

在一个实施例中，目标应用程序对应的自动化归因模型中原定设置有多个归因节点，每个归因节点对应一个预先人工设置的目标应用程序的预定异常运行原因。通过自动化归因模型对一段时间内的目标应用程序的异常运行数据进行分析，可以确定目标应用程序的异常原因定位在各个归因节点中的多个特定归因节点处，而各个归因节点中除特定归因节点以外的节点，不是目标应用程序的异常原因，则本实施例中，也可以获取自动化归因模型中的各个特定归因节点所对应的预定异常运行原因，作为目标应用程序的异常运行原因。

本实施例中，目标应用程序的异常运行原因可以为多个。上述步骤S102中，还对各个异常运行原因进行分类，得到至少一种异常运行原因类型。每种异常运行原因类型包含至少一个异常运行原因。

具体而言，对目标应用程序的各个异常运行原因进行分类统计，得到至少一种异常运行原因类型，其中，每种异常运行原因类型包含至少一个异常运行原因。可以将目标应用程序的各个异常运行原因输出给开发人员，由开发人员对目标应用程序的各个异常运行原因进行分类统计，获取开发人员统计得到的至少一种异常运行原因类型。当然，也可以通过自动化的方式对各个异常运行原因进行分类统计，得到至少一种异常运行原因类型，比如，将包含相同关键字的异常运行原因归为一种异常运行原因类型，如，将异常运行原因“内存不足”和“内存读取异常”都归为内存类的异常运行原因类型。

在一个实施例中，异常运行原因类型包括以下类型中的至少一种：目标应用程序所在的用户终端的运行内存小于预设最小值；目标应用程序的文件描述符超出预设最大值；目标应用程序的线程数量多于预设最大数量；目标应用程序存在空指针异常；目标应用程序存在野指针引起内存异常访问；目标应用程序存在重复释放引起内存异常访问；目标应用程序存在内存越界引起内存异常访问。通过这七种异常运行原因类型可以涵盖目标应用程序的各种异常运行原因，从而达到对目标应用程序的各种异常运行原因进行概括总结的效果。

在一个实施例中，本实施例中的方法，在获取预先为目标应用程序配置的运行数据指标项之前，还包括以下动作以确定目标应用程序的运行数据指标项：

(1)获取目标应用程序的标识、目标应用程序的版本号、目标应用程序所适配的操作系统的标识、目标应用程序所适配的操作系统的版本号中的至少一项；

(2)根据获取的信息，为目标应用程序配置运行数据指标项。

首先，动作(1)中，获取目标应用程序的标识、目标应用程序的版本号、目标应用程序所适配的操作系统的标识、目标应用程序所适配的操作系统的版本号中的至少一项。目标应用程序的标识可以为目标应用程序的名称，目标应用程序所适配的操作系统的标识可以为操作系统的名称，比如安卓或IOS。

考虑到不同应用程序在不同操作系统下所出现的运行异常存在不同，因此不同应用程序在不同操作系统下所需要重点关注的运行数据指标项也不同，动作(2)中，根据获取的信息，为目标应用程序配置运行数据指标项。一个情况下，将获取的信息输出给开发人员，由开发人员根据获取的信息，为目标应用程序配置运行数据指标项，该运行数据指标项为目标应用程序在当前版本下，运行在所适配的操作系统中，在该操作系统的版本下，所需要重点关注的运行数据指标项。

另一个情况下，开发人员预先建立有项目库，该库中记录了应用程序的标识、应用程序的版本号、应用程序所适配的操作系统的标识、应用程序所适配的操作系统的版本号这四项与应用程序对应的运行数据指标项之间的对应关系，比如记录了：应用程序A——应用版本1.0——安卓系统——安卓2.0——指标项1、指标项2、指标项3。从而，在获取到上述信息中的至少一项后，可以根据获取的信息查找该项目库，得到目标应用程序对应的各个运行数据指标项。其中，若动作(1)中获取的信息少于四项，则在根据获取的信息查找该项目库时，若某条记录中包括获取的全部信息，则确定该条记录中的各个指标项为目标应用程序对应的各个运行数据指标项。

本实施例中，考虑到了不同应用程序在不同操作系统下所出现的运行异常存在不同，因此不同应用程序在不同操作系统下所需要重点关注的运行数据指标项也不同，基于此，获取目标应用程序的标识、目标应用程序的版本号、目标应用程序所适配的操作系统的标识、目标应用程序所适配的操作系统的版本号中的至少一项，根据获取的信息，为目标应用程序配置运行数据指标项，可以使得配置得到的运行数据指标项与目标应用程序及其操作系统相匹配。

在通过以上过程确定目标应用程序的运行数据指标项之后，可以获取预先为目标应用程序配置的运行数据指标项，接着，执行步骤S104，从目标应用程序的历史异常运行数据中，获取异常运行原因类型对应的异常运行数据，并确定异常运行数据在运行数据指标项下的数据指标值。

首先，获取目标应用程序的历史异常运行数据，该历史异常运行数据可以是历史一段时间如1个月内，用户侧上报的目标应用程序的异常运行数据，目标应用程序在用户侧发生异常时，可以表现为程序闪退或者程序卡顿等多种情况。接着，从目标应用程序的历史异常运行数据中，获取异常运行原因类型对应的异常运行数据。若异常运行原因类型有多个，则分别获取每个异常运行原因类型对应的异常运行数据。

在一个实施例中，从目标应用程序的历史异常运行数据中，获取异常运行原因类型对应的异常运行数据，具体为：

(1)通过自动化归因模型中的各个归因节点对历史异常运行数据进行异常运行归因，以在历史异常运行数据中确定与每个归因节点所对应的预定异常运行原因相对应的数据；其中，每个归因节点对应一预定异常运行原因；

(2)根据每个归因节点所对应的预定异常运行原因，在各个归因节点中确定对应于异常运行原因类型的目标归因节点，将历史异常运行数据中与目标归因节点所对应的预定异常运行原因相对应的数据，作为异常运行原因类型对应的异常运行数据。

根据前面描述可知，目标应用程序对应的自动化归因模型中包括多个归因节点，每个归因节点对应一个预先人工设置的预定异常运行原因。可以将目标应用程序的异常运行数据输入至该自动化归因模型，归因节点可以判断该异常运行数据对应的异常运行原因是否为自身节点对应的预定异常运行原因，从而对目标应用程序进行异常运行归因。基于此种原理，本实施例中，获取目标应用程序的历史异常运行数据，该历史异常运行数据由用户多次上报的异常数据组成，因此该历史异常运行数据包括多批子数据，每批子数据是用户一次上报的异常数据。将该历史异常运行数据输入至自动化归因模型中，自动化归因模型中的每个归因节点分别判断每批子数据的异常原因，是否为自身节点对应的预定异常运行原因，因此，每个归因节点都可以在历史异常运行数据中分析得到与自身节点对应的预定异常运行原因相对应的数据，从而，在历史异常运行数据中确定与每个归因节点所对应的预定异常运行原因相对应的数据。

比如：历史异常运行数据包括9批子数据，共有三个归因节点，通过分析发现，1-3批子数据的异常原因为第一个归因节点所对应的预定异常运行原因，因此与第一个归因节点所对应的预定异常运行原因相对应的数据为1-3批子数据，类似地，4-6批子数据的异常原因为第二个归因节点所对应的预定异常运行原因，因此与第二个归因节点所对应的预定异常运行原因相对应的数据为4-6批子数据，7-9批子数据的异常原因为第三个归因节点所对应的预定异常运行原因，因此与第三个归因节点所对应的预定异常运行原因相对应的数据为7-9批子数据。

接着，根据每个归因节点所对应的预定异常运行原因，在各个归因节点中确定对应于异常运行原因类型的目标归因节点。根据前面描述可知，异常运行原因类型至少包括一个目标应用程序的异常运行原因，且，目标应用程序的异常运行原因位于各个预定异常运行原因中，因此这里可以确定对应于异常运行原因类型的异常运行原因，在各个预定异常运行原因中查找该异常运行原因，将查找到的异常运行原因对应的归因节点确定为目标归因节点。

最后，将历史异常运行数据中与目标归因节点所对应的预定异常运行原因相对应的数据，作为异常运行原因类型对应的异常运行数据。比如，目标归因节点为上述的第三个归因节点，则异常运行原因类型对应的异常运行数据为上述的7-9批子数据。

若异常运行原因类型有多个，则分别通过以上的方法，获取每个异常运行原因类型对应的异常运行数据。在获取到每个异常运行原因类型对应的异常运行数据之后，确定该异常运行数据在上述运行数据指标项下的数据指标值。

在一个实施例中，运行数据指标项包括以下项中的至少一个：目标应用程序所在的用户终端的虚拟内存级别；目标应用程序所在的用户终端的操作系统版本信息；目标应用程序的运行数据中按照预设异常信号生成规则生成并记录的异常信号；目标应用程序的线程数量级别；目标应用程序崩溃前出现预设异常的次数；目标应用程序的异常堆栈类型。

在一个实施例中，确定该异常运行数据在上述运行数据指标项下的数据指标值，具体为：通过自动化脚本的方式，自动确定该异常运行数据在上述运行数据指标项下的数据指标值。能够理解，若异常运行原因类型有多个，则需要确定每个异常运行原因类型对应的异常运行数据，在上述运行数据指标项下的数据指标值。

在一个实施例中，通过自动化脚本的方式，自动确定异常运行数据在运行数据指标项下的数据指标值，包括以下方式中的至少一种：

(1)从异常运行数据中提取用户终端的虚拟内存大小，根据虚拟内存大小，确定所述虚拟内存级别；

(2)从异常运行数据中提取操作系统版本信息；

(3)从异常运行数据中提取异常信号；

(4)从异常运行数据中提取目标应用程序的线程数量，根据线程数量，确定线程数量级别；

(5)根据异常运行数据中记录的目标应用程序的异常运行日志，确定目标应用程序崩溃前出现预设异常的次数；

(6)从异常运行数据中提取目标应用程序的异常堆栈关键字，根据异常堆栈关键字，确定异常堆栈类型。

方式(1)中，通过脚本自动从异常运行数据中提取目标应用程序所在的用户终端的虚拟内存大小，根据虚拟内存大小和预先建立的虚拟内存大小与虚拟内存级别之间的映射关系，确定虚拟内存级别。方式(2)中，异常运行数据中记录有目标应用程序所在的用户终端的操作系统版本信息，则通过脚本直接提取该操作系统版本信息，比如版本号信息。方式(3)中，目标应用程序的异常运行数据中，会按照预设异常信号生成规则生成并记录异常信号，比如，根据LUNIX系统的规则，生成并记录内容为自然数1-12的异常信号，则通过自动化脚本的方式，直接从异常运行数据中提取该异常信号。

方式(4)中，通过脚本从异常运行数据中提取目标应用程序的线程数量，根据线程数量和预先建立线程数量与线程数量级别之间的映射关系，确定线程数量级别。方式(5)中，目标应用程序运行过程中，会生成运行日志，运行日志是运行数据的一部分，若应用程序运行异常，则会生成异常运行日志，异常运行日志中会记录出现的异常，每次出现异常时都会记录一次，比如记录出现了“文件打开错误”这一异常，并且记录了三次。该方式中，通过自动化脚本的方式，从异常运行数据获取异常运行日志，基于异常运行日志中记录的目标应用程序崩溃前每次出现的预设异常，确定目标应用程序崩溃前出现预设异常的次数。预设异常可以是开发人员设定的各种异常。方式(6)中，从异常运行数据中提取目标应用程序的异常堆栈关键字，根据异常堆栈关键字和预先定义的异常堆栈关键字与异常堆栈类型之间的匹配规则，确定异常堆栈类型。

可见，通过本实施例，能够自动化的确定异常运行数据在目标应用程序的运行数据指标项下的数据指标值，提高样本数据的生成效率。并且，若异常运行原因类型有多个，则可以确定每个异常运行原因类型对应的异常运行数据，在上述运行数据指标项下的数据指标值。

接着，上述步骤S106中，确定异常运行原因类型和数据指标值之间的对应关系，根据该对应关系，将异常运行原因类型和数据指标值作为模型训练样本数据。其中，确定异常运行原因类型和数据指标值之间的对应关系，具体为：

(1)获取异常运行原因类型与异常运行数据之间的对应关系，和，异常运行数据与数据指标值之间的从属关系；

(2)根据异常运行原因类型与异常运行数据之间的对应关系，和，异常运行数据与数据指标值之间的从属关系，确定异常运行原因类型与数据指标值之间的对应关系。

具体而言，当异常运行原因类型有多个时，每个类型都具有对应的异常运行数据，每个类型的异常运行数据都在目标应用程序的运行数据指标项下具有数据指标值，因此，每个类型的异常运行数据都有相互从属的数据指标值。因此动作(1)中，获取每个异常运行原因类型与每个类型的异常运行数据之间的对应关系，和，每个类型的异常运行数据与每个类型的异常运行数据的数据指标值之间的从属关系。动作(2)中，根据获取的对应关系和从属关系，可以确定，异常运行原因类型与该类型的异常运行数据的数据指标值之间相互对应，从而在异常运行原因类型有多个时，确定异常运行原因类型与数据指标值之间的对应关系，得到相互对应的异常运行原因类型与数据指标值。

在确定相互对应的异常运行原因类型与数据指标值之后，将相互对应的异常运行原因类型和数据指标值作为模型训练样本数据。具体而言，对于一个异常运行原因类型，若其对应的异常运行数据来自于多个用户，则每个用户的异常运行数据都会对应一组数据指标值，则该异常运行原因类型可以对应多组数据指标值，一组数据指标值包括上述通过自动化脚本获取的多个运行数据指标项的数指标值。一个异常原因类型和其对应的一组或多组数据指标值，构成一个训练样本。

综上，通过本实施例中的方法，将应用程序的异常运行原因类型和应用程序的异常运行数据在预先确定的运行数据指标项下的数据指标值，作为模型训练样本数据，该异常运行原因类型和该数据指标值之间具有对应关系，因此利用生成的模型训练样本数据训练模型并通过模型分析应用程序的异常运行原因时，充分考虑到了应用程序的异常运行数据的数据指标值与应用程序的异常运行原因类型之间的关联关系，因此针对偶发的应用程序异常，不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因，提高了确定应用程序的异常运行原因的准确率。

进一步地，本说明书一实施例还提供了一种模型训练方法，图2为本说明书一实施例提供的模型训练方法的流程示意图，如图2所示，该流程包括：

步骤S202，获取上述图1中的方法生成的模型训练样本数据；

步骤S204，利用模型训练样本数据，训练预先搭建的神经网络结构直至收敛，将训练收敛的神经网络结构，作为目标应用程序的异常运行原因确定模型；

其中，神经网络结构中的参数用于表示同一异常运行原因类型对应的各个数据指标值分别对该同一异常运行原因类型的贡献权重。

本实施例中，利用上述生成的模型训练样本数据训练模型并通过模型分析应用程序的异常运行原因时，充分考虑到了应用程序的异常运行数据的数据指标值与应用程序的异常运行原因类型之间的关联关系，因此针对偶发的应用程序异常，不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因，提高了确定应用程序的异常运行原因的准确率。

上述步骤S202中，获取上述图1中的方法生成的模型训练样本数据，该数据包括相互对应的异常运行原因类型和数据指标值。

上述步骤S204中，利用模型训练样本数据，训练预先搭建的神经网络结构直至收敛，将训练收敛的神经网络结构，作为目标应用程序的异常运行原因确定模型。该神经网络结构可以为CNN单层网络结构。

在一个实施例中，利用模型训练样本数据，训练预先搭建的神经网络结构直至收敛，具体为：将各个异常运行原因类型和每个异常运行原因类型对应的各个数据指标值，相对应地输入至神经网络结构进行训练，直至神经网络结构收敛。

如前所述，对于一个异常运行原因类型，若其对应的异常运行数据来自于多个用户，则每个用户的异常运行数据都会对应一组数据指标值，则该异常运行原因类型可以对应多组数据指标值，一组数据指标值包括上述通过自动化脚本获取的多个运行数据指标项的数指标值。一个异常原因类型和其对应的一组或多组数据指标值，构成一个训练样本。通过多个训练样本，对CNN神经网络结构进行训练，神经网络结构中的参数用于表示，同一异常运行原因类型对应的各个数据指标值分别对该同一异常运行原因类型的贡献权重。

比如，异常运行原因类型有3种，运行数据指标项有6项，则对于一个异常运行原因类型而言，若其具有来自2个用户的异常运行数据，则其对应有2组数据指标值，每组数据指标值都有6个值，分别对应每个运行数据指标项。神经网络结构中的参数，用于表示每个运行数据指标项下的数据指标值，对该异常运行原因类型的贡献权重。训练收敛的神经网络结构，即为目标应用程序的异常运行原因确定模型。

进一步地，本说明书一实施例还提供了异常运行原因确定方法，图3为本说明书一实施例提供的异常运行原因确定方法的流程示意图，如图3所示，该流程包括：

步骤S302，获取如图2中的方法所训练的目标应用程序的异常运行原因确定模型，以及，获取目标应用程序的待分析异常运行数据；

步骤S304，确定待分析异常运行数据在运行数据指标项下的待分析数据指标值；

步骤S306，通过异常运行原因确定模型对待分析数据指标值进行处理，根据处理结果，确定目标应用程序的异常运行原因类型。

本实施例中，利用上述生成的模型分析应用程序的异常运行原因时，充分考虑到了应用程序的异常运行数据的数据指标值与应用程序的异常运行原因类型之间的关联关系，因此针对偶发的应用程序异常，不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因，提高了确定应用程序的异常运行原因的准确率。

上述步骤S302中，获取前述方法训练生成的模型，并获取目标应用程序的待分析异常运行数据，该待分析异常运行数据可以为本次用户上报的异常运行数据。

上述步骤S304中，通过前面介绍过的方式，确定待分析异常运行数据在运行数据指标项下的待分析数据指标值，具体过程参考前面的描述，这里不再重复。

上述步骤S306中，将待分析异常运行数据在运行数据指标项下的待分析数据指标值输入至异常运行原因确定模型，异常运行原因确定模型对待分析数据指标值进行处理，输出处理结果，处理结果可以为待分析异常运行数据对应的异常运行原因类型的代码，根据代码，查找代码与异常运行原因类型之间的映射关系，确定目标应用程序的异常运行原因类型。

其中，当待分析异常运行数据来自一个用户时，则对应存在一组待分析数据指标值。当待分析异常运行数据来自多个用户时，每个用户对应一组待分析数据指标值，共有多组待分析数据指标值。可以将一组或多组待分析数据指标值输入至异常运行原因确定模型进行处理。

进一步地，图3中的流程还可以包括：在待分析异常运行数据中，获取与待分析数据指标值相关联的异常运行数据，输出相关联的异常运行数据和目标应用程序的异常运行原因类型。

具体而言，待分析数据指标值是一些简单的数值，比如内存级别、异常堆栈类型等，在待分析异常运行数据中，获取与待分析数据指标值相关联的异常运行数据，该相关联的异常运行数据为生成待分析数据指标值的数据，或者叫做待分析数据指标值的原始数据，比如具体的内存大小、异常堆栈关键字等。将该相关联的异常运行数据和目标应用程序的异常运行原因类型输出给研发人员，供研发人员分析以进一步优化目标应用程序。

通过以上的样本数据生成方法、模型训练和异常运行原因确定方法，针对偶发的应用程序异常，不需要依赖于海量同类异常的数据即可确定应用程序的异常运行原因，提高了确定应用程序的异常运行原因的准确率。

本说明书一实施例还提供了一种样本数据生成装置，图4为本说明书一实施例提供的样本数据生成装置的结构示意图，如图4所示，该装置包括：

原因分类单元41，用于通过目标应用程序对应的自动化归因模型，确定所述目标应用程序的至少一个异常运行原因，对至少一个所述异常运行原因进行分类，得到异常运行原因类型；

指标确定单元42，用于从所述目标应用程序的历史异常运行数据中，获取所述异常运行原因类型对应的异常运行数据，并确定所述异常运行数据在预设的运行数据指标项下的数据指标值；

样本生成单元43，用于确定所述异常运行原因类型和所述数据指标值之间的对应关系，根据所述对应关系，将所述异常运行原因类型和所述数据指标值作为模型训练样本数据。

可选地，原因分类单元41具体用于：通过所述自动化归因模型中的各个归因节点对所述目标应用程序进行异常运行归因，得到所述目标应用程序的异常运行原因；其中，每个所述归因节点对应一预定异常运行原因；所述目标应用程序的异常运行原因包括所述预定异常运行原因。

可选地，还包括指标项配置单元，用于：获取所述目标应用程序的标识、所述目标应用程序的版本号、所述目标应用程序所适配的操作系统的标识、所述目标应用程序所适配的操作系统的版本号中的至少一项；根据获取的信息，为所述目标应用程序配置所述运行数据指标项。

可选地，指标确定单元42具体用于：通过所述自动化归因模型中的各个归因节点对所述历史异常运行数据进行异常运行归因，以在所述历史异常运行数据中确定与每个所述归因节点所对应的预定异常运行原因相对应的数据；其中，每个所述归因节点对应一预定异常运行原因；根据每个所述归因节点所对应的预定异常运行原因，在各个所述归因节点中确定对应于所述异常运行原因类型的目标归因节点，将所述历史异常运行数据中与所述目标归因节点所对应的预定异常运行原因相对应的数据，作为所述异常运行原因类型对应的异常运行数据。

可选地，所述运行数据指标项包括以下项中的至少一个：所述目标应用程序所在的用户终端的虚拟内存级别；所述目标应用程序所在的用户终端的操作系统版本信息；所述目标应用程序的运行数据中按照预设异常信号生成规则生成并记录的异常信号；所述目标应用程序的线程数量级别；所述目标应用程序崩溃前出现预设异常的次数；所述目标应用程序的异常堆栈类型。

可选地，指标确定单元42具体用于：通过自动化脚本的方式，自动确定所述异常运行数据在所述运行数据指标项下的数据指标值。

可选地，指标确定单元42还具体用于以下方式中的至少一种：从所述异常运行数据中提取所述用户终端的虚拟内存大小，根据所述虚拟内存大小，确定所述虚拟内存级别；从所述异常运行数据中提取所述操作系统版本信息；从所述异常运行数据中提取所述异常信号；从所述异常运行数据中提取所述目标应用程序的线程数量，根据所述线程数量，确定所述线程数量级别；根据所述异常运行数据中记录的所述目标应用程序的异常运行日志，确定所述目标应用程序崩溃前出现预设异常的次数；从所述异常运行数据中提取所述目标应用程序的异常堆栈关键字，根据所述异常堆栈关键字，确定所述异常堆栈类型。

可选地，样本生成单元43具体用于：获取所述异常运行原因类型与所述异常运行数据之间的对应关系，和，所述异常运行数据与所述数据指标值之间的从属关系；根据所述异常运行原因类型与所述异常运行数据之间的对应关系，和，所述异常运行数据与所述数据指标值之间的从属关系，确定所述异常运行原因类型与所述数据指标值之间的对应关系。

可选地，所述异常运行原因类型包括以下类型中的至少一种：所述目标应用程序所在的用户终端的运行内存小于预设最小值；所述目标应用程序的文件描述符超出预设最大值；所述目标应用程序的线程数量多于预设最大数量；所述目标应用程序存在空指针异常；所述目标应用程序存在野指针引起内存异常访问；所述目标应用程序存在重复释放引起内存异常访问；所述目标应用程序存在内存越界引起内存异常访问。

本实施例中的样本数据生成装置能够实现前述的样本数据生成方法的各个过程，并达到相同的效果和功能，这里不再重复。

本说明书一实施例还提供了一种模型训练装置，图5为本说明书一实施例提供的模型训练装置的结构示意图，如图5所示，该装置包括：

样本获取单元51，用于获取如权利要求14所述的装置生成的模型训练样本数据；

模型训练单元52，用于利用所述模型训练样本数据，训练预先搭建的神经网络结构直至收敛，将训练收敛的所述神经网络结构，作为所述目标应用程序的异常运行原因确定模型；

其中，所述神经网络结构中的参数用于表示同一所述异常运行原因类型对应的各个所述数据指标值分别对该同一所述异常运行原因类型的贡献权重。

可选地，模型训练单元52具体用于：将各个所述异常运行原因类型和每个所述异常运行原因类型对应的各个所述数据指标值，相对应地输入至所述神经网络结构进行训练，直至所述神经网络结构收敛。

本实施例中的模型训练装置能够实现前述的模型训练方法的各个过程，并达到相同的效果和功能，这里不再重复。

本说明书一实施例还提供了一种异常运行原因确定装置，图6为本说明书一实施例提供的异常运行原因确定装置的结构示意图，如图6所示，该装置包括：

模型获取单元61，用于获取如权利要求15所述的装置所训练的所述目标应用程序的异常运行原因确定模型，以及，获取所述目标应用程序的待分析异常运行数据；

数据确定单元62，用于确定所述待分析异常运行数据在所述运行数据指标项下的待分析数据指标值；

原因分析单元63，用于通过所述异常运行原因确定模型对所述待分析数据指标值进行处理，根据处理结果，确定所述目标应用程序的异常运行原因类型。

可选地，还包括输出单元，用于：在所述待分析异常运行数据中，获取与所述待分析数据指标值相关联的异常运行数据；输出所述相关联的异常运行数据和所述目标应用程序的异常运行原因类型。

本实施例中的异常运行原因确定装置能够实现前述的异常运行原因确定方法的各个过程，并达到相同的效果和功能，这里不再重复。

本说明书一实施例还提供了一种电子设备，图7为本说明书一实施例提供的电子设备的结构示意图，如图7所示，电子设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器801和存储器802，存储器802中可以存储有一个或一个以上应用程序或数据。其中，存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括电子设备中的一系列计算机可执行指令。更进一步地，处理器801可以设置为与存储器802通信，在电子设备上执行存储器802中的一系列计算机可执行指令。电子设备还可以包括一个或一个以上电源803，一个或一个以上有线或无线网络接口804，一个或一个以上输入或输出接口805，一个或一个以上键盘806等。

在一个具体的实施例中，电子设备为样本数据生成设备，具体为后台服务器，包括有处理器；以及，被配置为存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器实现以下流程：

本说明书实施例中的样本数据生成设备能够实现前述的样本数据生成方法的各个过程，并达到相同的效果和功能，这里不再重复。

在另一个具体的实施例中，电子设备为模型训练设备，具体为后台服务器，包括有处理器；以及，被配置为存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器实现以下流程：

获取前述的样本数据生成方法生成的模型训练样本数据；

其中，所述神经网络结构中的参数用于表示同一所述异常运行原因类型对应的各个所述数据指标值分别对该同一所述异常运行原因类型的贡献权重。

本说明书实施例中的模型训练设备能够实现前述的模型训练方法的各个过程，并达到相同的效果和功能，这里不再重复。

在又一个具体的实施例中，电子设备为异常运行原因确定设备，具体为后台服务器，包括有处理器；以及，被配置为存储计算机可执行指令的存储器，所述计算机可执行指令在被执行时使所述处理器实现以下流程：

获取如上述的模型训练方法所训练的所述目标应用程序的异常运行原因确定模型，以及，获取所述目标应用程序的待分析异常运行数据；

确定所述待分析异常运行数据在所述运行数据指标项下的待分析数据指标值；

通过所述异常运行原因确定模型对所述待分析数据指标值进行处理，根据处理结果，确定所述目标应用程序的异常运行原因类型。

本说明书实施例中的异常运行原因确定设备能够实现前述的异常运行原因确定方法的各个过程，并达到相同的效果和功能，这里不再重复。

本说明书另一实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机可执行指令，所述计算机可执行指令在被处理器执行时实现以下流程：

本说明书实施例中的存储介质能够实现前述的样本数据生成方法的各个过程，并达到相同的效果和功能，这里不再重复。

获取前述的样本数据生成方法生成的模型训练样本数据；

其中，所述神经网络结构中的参数用于表示同一所述异常运行原因类型对应的各个所述数据指标值分别对该同一所述异常运行原因类型的贡献权重。

本说明书实施例中的存储介质能够实现前述的模型训练方法的各个过程，并达到相同的效果和功能，这里不再重复。

获取如上述的模型训练方法所训练的所述目标应用程序的异常运行原因确定模型，以及，获取所述目标应用程序的待分析异常运行数据；

确定所述待分析异常运行数据在所述运行数据指标项下的待分析数据指标值；

通过所述异常运行原因确定模型对所述待分析数据指标值进行处理，根据处理结果，确定所述目标应用程序的异常运行原因类型。

本说明书实施例中的存储介质能够实现前述的异常运行原因确定方法的各个过程，并达到相同的效果和功能，这里不再重复。

本说明书各个实施例中，所述的计算机可读存储介质包括只读存储器(Read-OnlyMemory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本文件的实施例而已，并不用于限制本文件。对于本领域技术人员来说，本文件可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本文件的权利要求范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：北京字跳网络技术有限公司;

上一篇：一种新型分子筛纯化方法、系统及其设备
下一篇：一种调度方法、装置及存储介质