掌桥专利:专业的专利平台
掌桥专利
首页

问题解决人推荐方法及装置

文献发布时间:2023-06-19 11:35:49


问题解决人推荐方法及装置

技术领域

本发明涉及人工智能技术领域,尤其涉及问题解决人推荐方法及装置。

背景技术

本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

一个复杂软件系统的开发往往涉及到多个部门的分工协作。在系统更新迭代和用户使用过程中,往往难以避免地会出现一些技术性bug或未按操作规范导致的问题。传统的问题解决途径,一般是分两步:第一、先在FAQ系统检索相同或类似问题的解决方法;第二、当未查询到相同或类似的问题时,则依赖人工经验,根据报错信息,将问题单流转到枢纽节点,再由枢纽节点转到相关开发团队解决。

现有的依赖人工经验的问题单流转过程如下:

1)当报错信息提示了相关开发团队信息时,直接找到相应的开发团队;

2)当报错信息描述不明确时,根据出错所在系统模块信息,将问题单流转到该模块界面开发团队;再由该开发团队负责人结合用户提交的信息,定位出错日志,最终找到并流转到正确的解决团队。

现有的问题单流转系统,一方面依赖于报错提示信息,只有当报错信息中明确提及相关团队时,才能直接找到相应的开发团队;当报错信息未提及相关团队,且报错信息描述语义较为模糊时,则依赖于处理人的经验,难以实现问题单的及时正确流转,有时甚至会空转,无人认领,拉长解决问题的时间,导致不好的用户体验。

发明内容

本发明实施例提供一种问题解决人推荐方法,用以解决人工处理难以实现问题单的及时正确流转,拉长解决问题的时间,导致不好的用户体验的问题,该方法包括:

获取历史问题单信息以及对应的问题单解决人信息;

根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型;

获取当前问题单信息,其中,问题单信息包括问题详细描述信息和报错页面截图;

分别计算当前问题单同历史问题单详细描述信息的相似度和报错页面截图的相似度,利用问题详细描述信息的相似度和报错页面截图的相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

在一个实施例中,还包括:

对问题详细描述信息进行短文本数据挖掘处理;

对报错页面截图进行图片挖掘处理。

在一个实施例中,对问题详细描述信息进行短文本数据挖掘处理,包括:

对问题详细描述信息进行数据清洗和预处理;

对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在一个实施例中,对问题详细描述信息进行数据清洗和预处理,包括:

对问题详细描述信息进行分词、去标点符号和去停用词处理;

对数据清洗和预处理后的问题详细描述信息进行向量化表示,包括:

采用TFIDF模型,对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在一个实施例中,对报错页面截图进行图片挖掘处理,包括:

对报错页面截图进行图片扩增处理;

对图片扩增处理的报错页面截图进行图片特征提取。

在一个实施例中,对报错页面截图进行图片扩增处理,包括:

将报错页面截图进行多次随机角度的旋转,获得多张旋转后的报错页面截图;

对报错页面截图和多张旋转后的报错页面截图进行多次下采样,获得多张下采样的报错页面截图;

对多张下采样的报错页面截图以预设大小截取左上角、右上角、左下角、右下角和中间位置,获得多张不同位置的图片;

对多张下采样的报错页面截图以预设大小进行缩放,获得多张缩放的报错页面截图;

将多张不同位置的图片和多张缩放的报错页面截图作为最终图片。

在一个实施例中,对图片扩增处理的报错页面截图进行图片特征提取,包括:

采用已训练好的VGG16卷积神经网络对最终图片进行图片特征提取。

在一个实施例中,还包括:

将历史问题单信息以及对应的问题单解决人信息分成训练样本集和验证样本集;

根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型,包括:

采用KNN算法,根据训练样本集训练得到问题解决人推荐模型;

利用验证样本集对训练得到的问题解决人推荐模型进行验证,获得最优问题解决人推荐模型。

在一个实施例中,分别计算当前问题单同历史问题单详细描述信息的相似度和报错页面截图的相似度,利用问题详细描述信息的相似度和报错页面截图的相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息,包括:

采用余弦相似度度量方式,对向量化表示的问题详细描述信息与历史问题单中的所有向量化表示的问题详细描述信息进行相似度计算,获得短文本相似度;

采用余弦相似度度量方式,对进行图片特征提取的报错页面截图与历史问题单中的所有进行图片特征提取的报错页面截图进行相似度计算,获得图片相似度;

基于短文本相似度和图片相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

本发明实施例还提供一种问题解决人推荐装置,用以解决人工处理难以实现问题单的及时正确流转,拉长解决问题的时间,导致不好的用户体验的问题,该装置包括:

信息获取模块,用于获取历史问题单信息以及对应的问题单解决人信息;

模型训练模块,用于根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型;

信息获取模块还用于:获取当前问题单信息,其中,问题单信息包括问题详细描述信息和报错页面截图;

预测推荐模块,用于基于问题解决人推荐模型,计算问题详细描述信息的相似度和报错页面截图的相似度,基于问题详细描述信息的相似度和报错页面截图的相似度获得推荐的问题单解决人信息。

在一个实施例中,还包括:短文本数据挖掘处理模块,用于对问题详细描述信息进行短文本数据挖掘处理;

图片挖掘处理模块,用于对报错页面截图进行图片挖掘处理。

在一个实施例中,短文本数据挖掘处理模块具体用于:

对问题详细描述信息进行数据清洗和预处理;

对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在一个实施例中,短文本数据挖掘处理模块具体用于:

对问题详细描述信息进行分词、去标点符号和去停用词处理;

采用TFIDF模型,对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在一个实施例中,图片挖掘处理模块具体用于:

对报错页面截图进行图片扩增处理;

对图片扩增处理的报错页面截图进行图片特征提取。

在一个实施例中,图片挖掘处理模块具体用于:

将报错页面截图进行多次随机角度的旋转,获得多张旋转后的报错页面截图;

对报错页面截图和多张旋转后的报错页面截图进行多次下采样,获得多张下采样的报错页面截图;

对多张下采样的报错页面截图以预设大小截取左上角、右上角、左下角、右下角和中间位置,获得多张不同位置的图片;

对多张下采样的报错页面截图以预设大小进行缩放,获得多张缩放的报错页面截图;

将多张不同位置的图片和多张缩放的报错页面截图作为最终图片。

在一个实施例中,图片挖掘处理模块具体用于:

采用已训练好的VGG16卷积神经网络对最终图片进行图片特征提取。

在一个实施例中,还包括:

样本集区分模块,用于将历史问题单信息以及对应的问题单解决人信息分成训练样本集和验证样本集;

模型训练模块具体用于:

采用KNN算法,根据训练样本集训练得到问题解决人推荐模型;

利用验证样本集对训练得到的问题解决人推荐模型进行验证,获得最优问题解决人推荐模型。

在一个实施例中,预测推荐模块具体用于:

采用余弦相似度度量方式,对向量化表示的问题详细描述信息与历史问题单中的所有向量化表示的问题详细描述信息进行相似度计算,获得短文本相似度;

采用余弦相似度度量方式,对进行图片特征提取的报错页面截图与历史问题单中的所有进行图片特征提取的报错页面截图进行相似度计算,获得图片相似度;

基于短文本相似度和图片相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述问题解决人推荐方法。

本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所述问题解决人推荐方法的步骤。

本发明实施例中,与现有技术中当报错信息未提及相关团队,且报错信息描述语义较为模糊时,则依赖于处理人的经验,难以实现问题单的及时正确流转,有时甚至会空转,无人认领,拉长解决问题的时间,导致不好的用户体验的技术方案相比,通过获取历史问题单信息以及对应的问题单解决人信息,所述历史问题单信息包括问题详细描述信息和报错页面截图;根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型;获取当前问题单信息;基于问题解决人推荐模型,根据当前问题单信息进行预测,获得推荐的问题单解决人信息,可以实现在问题单流转环节,为流转枢纽节点的处理人提供相同或类似问题的处理经验、推荐当前问题的处理团队,辅助问题单的正确流转,从而高效地为用户解决问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本发明实施例中问题解决人推荐方法流程图(一);

图2为本发明实施例中历史问题单信息预处理流程图;

图3为本发明实施例中短文本数据挖掘处理流程图(一);

图4为本发明实施例中短文本数据挖掘处理流程图(二);

图5为本发明实施例中图片挖掘处理流程图;

图6为本发明实施例中图片扩增处理流程图;

图7为本发明实施例中问题解决人推荐方法流程图(二);

图8为本发明实施例中推荐的问题单解决人信息获取流程图;

图9为本发明实施例中问题单相关的几个概念间的关系示意图;

图10为本发明实施例中问题解决人推荐装置结构框图(一);

图11为本发明实施例中问题解决人推荐装置结构框图(二);

图12为本发明实施例中问题解决人推荐装置结构框图(三);

图13为本发明实施例中计算机设备600的系统构成的示意框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。

现有的问题单流转系统,一方面依赖于报错提示信息,只有当报错信息中明确提及相关团队时,才能直接找到相应的开发团队;当报错信息未提及相关团队,且报错信息描述语义较为模糊时,则依赖于处理人的经验,难以实现问题单的及时正确流转,有时甚至会空转,无人认领。基于上述存在的问题,本发明提出一种问题解决人推荐方法,利用用户提交的截图和问题描述信息,基于图片和短文本相似度比对的方法,在问题单流转环节,为流转枢纽节点的处理人提供相同或类似问题的处理经验、推荐当前问题的处理团队,辅助问题单的正确流转,从而高效地为用户解决问题。

实施例1

图1为本发明实施例中问题解决人推荐方法流程图,如图1所示,该方法包括:

步骤102:获取历史问题单信息以及对应的问题单解决人信息;

步骤104:根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型;

步骤106:获取当前问题单信息(即实时的问题单信息),其中,问题单信息包括问题详细描述信息和报错页面截图;

步骤108:分别计算当前问题单同历史问题单详细描述信息的相似度和报错页面截图的相似度,利用问题详细描述信息的相似度和报错页面截图的相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

在本发明实施例中,现有问题单流转系统中,每个待解决的问题单一般包含有:问题详细描述和报错页面截图,以及问题单流转过程中相关团队的解答记录。所有问题单的详细描述,构成了本文的短文本研究对象;类似的,所有问题单的报错页面截图,则构成了本文的图片研究对象。此外,每个问题单流转记录中,最后的处理团队,是该问题单的实际解决人。

问题单相关的几个概念间的关系。一个复杂软件系统包括多个模块的功能,每个功能模块可由多个开发团队协作完成。针对该系统使用过程中出现的问题,业务人员可在问题单流转系统建立相应的问题单,提供包括:问题的详细描述(文本)和报错截图(图片)。各功能模块的多团队协作开发,使得问题单归属的责任团队难以区分,往往需依赖人工经验和多次流转才能使问题得以流转到正确的团队,进而被解决,如图9所示。

在本发明实施例中,本发明所用数据均来自问题单流转系统中数据库存储的问题单信息。对于每个问题单,从问题详细描述字段提取相应的文本;从附件字段获得图片数据;从流转历史记录中,提取最后的处理团队作为该问题单的正确解决团队。

对于上述获取到的历史问题单信息和当前问题单信息均需要进行预处理。如图2所示,该方法还可以包括:

步骤201:对问题详细描述信息进行短文本数据挖掘处理;

步骤202:对报错页面截图进行图片挖掘处理。

步骤201和步骤202没有先后顺序,先执行哪一步都可以。

在本发明实施例中,如图3所示,步骤201对问题详细描述信息进行短文本数据挖掘处理,包括:

步骤2011:对问题详细描述信息进行数据清洗和预处理;

步骤2012:对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在本发明实施例中,如图4所示,步骤2011对问题详细描述信息进行数据清洗和预处理,包括:

对问题详细描述信息进行分词、去标点符号和去停用词处理;

步骤2012对数据清洗和预处理后的问题详细描述信息进行向量化表示,包括:

采用TFIDF模型,对数据清洗和预处理后的问题详细描述信息进行向量化表示。

其中,TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。

TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。

在本发明实施例中,如图5所示,步骤202对报错页面截图进行图片挖掘处理,包括:

步骤2021:对报错页面截图进行图片扩增处理;

步骤2022:对图片扩增处理的报错页面截图进行图片特征提取。

在本发明实施例中,如图6所示,步骤2021对报错页面截图进行图片扩增处理,包括:

步骤20211:将报错页面截图进行多次随机角度的旋转,获得多张旋转后的报错页面截图;

步骤20212:对报错页面截图和多张旋转后的报错页面截图进行多次下采样,获得多张下采样的报错页面截图;

步骤20213:对多张下采样的报错页面截图以预设大小截取左上角、右上角、左下角、右下角和中间位置,获得多张不同位置的图片;

步骤20214:对多张下采样的报错页面截图以预设大小进行缩放,获得多张缩放的报错页面截图;

步骤20215:将多张不同位置的图片和多张缩放的报错页面截图作为最终图片。

具体的,对图片进行了如下扩增:

A:对报错截图随机旋转0-10度(随机角度,任选一个角度),模拟手机拍摄屏幕提供报错截图时可能产生的倾斜,进行2次,获得2张旋转后的报错截图;

B:采用高斯金字塔方法对图像(即2张旋转后的报错截图和1张原始的报错截图)进行下采样,进行2次,以模拟不同分辨率下的截图效果,获得6张采样报错截图;

C:对上述两步产生的9幅图片(即2张旋转后的报错截图和1张原始的报错截图、6张采样报错截图)进行截取,以224×224的大小(预设大小)截取图片的左上角、右上角、左下角、右下角和中间位置,得到5×9=45张截取图。

D:加上将9幅图片(即2张旋转后的报错截图和1张原始的报错截图、6张采样报错截图)缩放到224×224,这样,每幅原图片可得到54幅图像。

其中,随机角度和预设大小也可以选择其他的数据。

另外,测试集可以不这么做,因为测试集可能出现的情况已经包含在如此处理的训练集中;当然,也可以这么做,就是增加了处理步骤,对于一个待预测的案例,最后的结果综合考虑了对它进行如此处理的所有图片,也有可能提高准确性。

在本发明实施例中,步骤2022对图片扩增处理的报错页面截图进行图片特征提取,包括:

采用已训练好的VGG16卷积神经网络对最终图片(可以是上述的54幅图像)进行图片特征提取。

VGG16网络为13层卷积层+3层全连接层而组成。

在本发明实施例中,如图7所示,还包括:

步骤701:将历史问题单信息以及对应的问题单解决人信息分成训练样本集和验证样本集;

步骤104根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型,包括:

步骤1041:采用KNN算法,根据训练样本集训练得到问题解决人推荐模型;

步骤1042:利用验证样本集对训练得到的问题解决人推荐模型进行验证,获得最优问题解决人推荐模型。

具体的,对于已解决的历史问题单,可以按4:1的比例将其划分为训练样本集和验证样本集;而测试样本集则是用每日新增问题单。

具体的,本发明选择的模型是KNN算法,即K最近邻算法。对每个待预测的问题单,从候选集中选取最相似的K个问题单,其中的K值、以及下面将提到的,结合文本、图片相似性特征的α值选取,通过验证样本集的预测效果考察得到。得到训练好的模型后,对于测试样本集,通过将其预测结果同实际结果进行比较,观察一段时间,考察模型实际运行效果。

其中,KNN(K-Nearest Neighbor)算法是机器学习领域中的一种经典算法。其工作原理是利用训练数据对特征向量空间进行划分,并将划分结果作为最终算法模型。对于训练样本集,其中的每个样本都存在标签,即知道样本集中每一样本与其所属分类的对应关系。输入没有标签的数据后,将这个没有标签的数据的每个特征与样本集中的样本对应的特征进行比较,然后提取所有特征最相近的样本(最近邻)的分类标签。

一般地,只选择样本集中前k个最相似的样本(这就是KNN算法中K的由来,通常k是不大于20的整数),将这k个最相似样本中出现次数最多的类别,作为新数据的分类。

在本发明实施例中,如图8所示,步骤108基于问题解决人推荐模型,计算问题详细描述信息的相似度和报错页面截图的相似度,基于问题详细描述信息的相似度和报错页面截图的相似度获得推荐的问题单解决人信息,包括:

步骤1081:采用余弦相似度度量方式,对向量化表示的问题详细描述信息与历史问题单中的所有向量化表示的问题详细描述信息进行相似度计算,获得短文本相似度;

步骤1082:采用余弦相似度度量方式,对进行图片特征提取的报错页面截图与历史问题单中的所有进行图片特征提取的报错页面截图进行相似度计算,获得图片相似度;

步骤1083:基于短文本相似度和图片相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

具体的,对于待预测问题单,分别得到其与候选集问题单(即所有历史问题单)的图片相似度S

本发明实施例中还提供了一种问题解决人推荐装置,如下面的实施例所述。由于该问题解决人推荐装置解决问题的原理与问题解决人推荐方法相似,因此该问题解决人推荐装置的实施可以参见问题解决人推荐方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

实施例2

图10为本发明实施例中问题解决人推荐装置结构框图,如图10所示,该问题解决人推荐装置包括:

信息获取模块02,用于获取历史问题单信息以及对应的问题单解决人信息,所述历史问题单信息包括问题详细描述信息和报错页面截图;

模型训练模块04,用于根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型;

信息获取模块02还用于:获取当前问题单信息,其中,问题单信息包括问题详细描述信息和报错页面截图;

预测推荐模块06,用于分别计算当前问题单同历史问题单详细描述信息的相似度和报错页面截图的相似度,利用问题详细描述信息的相似度和报错页面截图的相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

在本发明实施例中,如图11所示,还包括:短文本数据挖掘处理模块08,用于对问题详细描述信息进行短文本数据挖掘处理;

图片挖掘处理模块10,用于对报错页面截图进行图片挖掘处理。

在本发明实施例中,短文本数据挖掘处理模块08具体用于:

对问题详细描述信息进行数据清洗和预处理;

对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在本发明实施例中,短文本数据挖掘处理模块08具体用于:

对问题详细描述信息进行分词、去标点符号和去停用词处理;

采用TFIDF模型,对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在本发明实施例中,图片挖掘处理模块10具体用于:

对报错页面截图进行图片扩增处理;

对图片扩增处理的报错页面截图进行图片特征提取。

在本发明实施例中,图片挖掘处理模块10具体用于:

将报错页面截图进行多次随机角度的旋转,获得多张旋转后的报错页面截图;

对报错页面截图和多张旋转后的报错页面截图进行多次下采样,获得多张下采样的报错页面截图;

对多张下采样的报错页面截图以预设大小截取左上角、右上角、左下角、右下角和中间位置,获得多张不同位置的图片;

对多张下采样的报错页面截图以预设大小进行缩放,获得多张缩放的报错页面截图;

将多张不同位置的图片和多张缩放的报错页面截图作为最终图片。

在本发明实施例中,图片挖掘处理模块10具体用于:

采用已训练好的VGG16卷积神经网络对最终图片进行图片特征提取。

在本发明实施例中,如图12所示,还包括:

样本集区分模块12,用于将历史问题单信息以及对应的问题单解决人信息分成训练样本集和验证样本集;

模型训练模块04具体用于:

采用KNN算法,根据训练样本集训练得到问题解决人推荐模型;

利用验证样本集对训练得到的问题解决人推荐模型进行验证,获得最优问题解决人推荐模型。

在本发明实施例中,预测推荐模块06具体用于:

采用余弦相似度度量方式,对向量化表示的问题详细描述信息与历史问题单中的所有向量化表示的问题详细描述信息进行相似度计算,获得短文本相似度;

采用余弦相似度度量方式,对进行图片特征提取的报错页面截图与历史问题单中的所有进行图片特征提取的报错页面截图进行相似度计算,获得图片相似度;

基于短文本相似度和图片相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述问题解决人推荐方法。

实施例3

本实施例3提供一种计算机设备,该计算机设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该计算机设备可以参照实施例1的方法的实施及实施例2所述的装置,其内容被合并于此,重复之处不再赘述。

图13为本发明实施例的计算机设备600的系统构成的示意框图。如图13所示,该计算机设备600可以包括中央处理器100和存储器140;存储器140耦合到中央处理器100。值得注意的是,该图是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。

一实施例中,问题解决人推荐功能可以被集成到中央处理器100中。其中,中央处理器100可以被配置为进行如下控制:

获取历史问题单信息以及对应的问题单解决人信息;

根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型;

获取当前问题单信息,其中,问题单信息包括问题详细描述信息和报错页面截图;

分别计算当前问题单同历史问题单详细描述信息的相似度和报错页面截图的相似度,利用问题详细描述信息的相似度和报错页面截图的相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

在一个实施例中,还包括:

对问题详细描述信息进行短文本数据挖掘处理;

对报错页面截图进行图片挖掘处理。

在一个实施例中,对问题详细描述信息进行短文本数据挖掘处理,包括:

对问题详细描述信息进行数据清洗和预处理;

对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在一个实施例中,对问题详细描述信息进行数据清洗和预处理,包括:

对问题详细描述信息进行分词、去标点符号和去停用词处理;

对数据清洗和预处理后的问题详细描述信息进行向量化表示,包括:

采用TFIDF模型,对数据清洗和预处理后的问题详细描述信息进行向量化表示。

在一个实施例中,对报错页面截图进行图片挖掘处理,包括:

对报错页面截图进行图片扩增处理;

对图片扩增处理的报错页面截图进行图片特征提取。

在一个实施例中,对报错页面截图进行图片扩增处理,包括:

将报错页面截图进行多次随机角度的旋转,获得多张旋转后的报错页面截图;

对报错页面截图和多张旋转后的报错页面截图进行多次下采样,获得多张下采样的报错页面截图;

对多张下采样的报错页面截图以预设大小截取左上角、右上角、左下角、右下角和中间位置,获得多张不同位置的图片;

对多张下采样的报错页面截图以预设大小进行缩放,获得多张缩放的报错页面截图;

将多张不同位置的图片和多张缩放的报错页面截图作为最终图片。

在一个实施例中,对图片扩增处理的报错页面截图进行图片特征提取,包括:

采用已训练好的VGG16卷积神经网络对最终图片进行图片特征提取。

在一个实施例中,还包括:

将历史问题单信息以及对应的问题单解决人信息分成训练样本集和验证样本集;

根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型,包括:

采用KNN算法,根据训练样本集训练得到问题解决人推荐模型;

利用验证样本集对训练得到的问题解决人推荐模型进行验证,获得最优问题解决人推荐模型。

在一个实施例中,分别计算当前问题单同历史问题单详细描述信息的相似度和报错页面截图的相似度,利用问题详细描述信息的相似度和报错页面截图的相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息,包括:

采用余弦相似度度量方式,对向量化表示的问题详细描述信息与历史问题单中的所有向量化表示的问题详细描述信息进行相似度计算,获得短文本相似度;

采用余弦相似度度量方式,对进行图片特征提取的报错页面截图与历史问题单中的所有进行图片特征提取的报错页面截图进行相似度计算,获得图片相似度;

基于短文本相似度和图片相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息。

在另一个实施方式中,问题解决人推荐装置可以与中央处理器100分开配置,例如可以将问题解决人推荐装置配置为与中央处理器100连接的芯片,通过中央处理器的控制来实现问题解决人推荐功能。

如图13所示,该计算机设备600还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,计算机设备600也并不是必须要包括图13中所示的所有部件;此外,计算机设备600还可以包括图13中没有示出的部件,可以参考现有技术。

如图13所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制计算机设备600的各个部件的操作。

其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。

输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向计算机设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。

该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行计算机设备600的操作的流程。

存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由计算机设备使用的数据。存储器140的驱动程序存储部144可以包括计算机设备的用于通信功能和/或用于执行计算机设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。

通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。

基于不同的通信技术,在同一计算机设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。

本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所述问题解决人推荐方法的步骤。

本发明实施例中,与现有技术中当报错信息未提及相关团队,且报错信息描述语义较为模糊时,则依赖于处理人的经验,难以实现问题单的及时正确流转,有时甚至会空转,无人认领,拉长解决问题的时间,导致不好的用户体验的技术方案相比,通过获取历史问题单信息以及对应的问题单解决人信息,所述历史问题单信息包括问题详细描述信息和报错页面截图;根据历史问题单信息以及对应的问题单解决人信息训练得到问题解决人推荐模型;获取当前问题单信息;分别计算当前问题单同历史问题单详细描述信息的相似度和报错页面截图的相似度,利用问题详细描述信息的相似度和报错页面截图的相似度,基于问题解决人推荐模型,获得推荐的问题单解决人信息,可以实现在问题单流转环节,为流转枢纽节点的处理人提供相同或类似问题的处理经验、推荐当前问题的处理团队,辅助问题单的正确流转,从而高效地为用户解决问题。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 问题解决人推荐方法及装置
  • 基于人工智能的对象推荐模型训练方法、推荐方法及装置
技术分类

06120112984817