基于机器学习的问题推荐方法及装置

文献发布时间：2023-06-19 11:11:32

技术领域

本发明涉及人工智能技术领域，具体地，涉及一种基于机器学习的问题推荐方法及装置。

背景技术

随着银行业务向线上迁移，手机银行客服的使用频率在不断提高，目前手机银行客服的服务模式以文字为主，因此手机银行即时通讯系统的易用性直接影响了用户的使用体验。手机银行文字客服目前存在输入耗时长、沟通效率低的缺陷，尤其是对不熟悉智能手机的老人很不友好。

发明内容

本发明实施例的主要目的在于提供一种基于机器学习的问题推荐方法及装置，以实时为用户精准推荐问题，大大减少用户的编辑操作，提升手机银行服务效率，优化用户使用体验。

为了实现上述目的，本发明实施例提供一种基于机器学习的问题推荐方法，包括：

获取文本问题，根据文本问题生成当前词向量；

将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率；

根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。

本发明实施例还提供一种基于机器学习的问题推荐装置，包括：

词向量生成模块，用于获取文本问题，根据文本问题生成当前词向量；

推荐单词概率模块，用于将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率；

问题推荐文本模块，用于根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。

本发明实施例还提供一种计算机设备，包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序，处理器执行计算机程序时实现所述的基于机器学习的问题推荐方法的步骤。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现所述的基于机器学习的问题推荐方法的步骤。

本发明实施例的基于机器学习的问题推荐方法及装置先根据文本问题生成当前词向量，再将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本，可以实时为用户精准推荐问题，大大减少用户的编辑操作，提升手机银行服务效率，优化用户使用体验。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例中基于机器学习的问题推荐方法的流程图；

图2是本发明实施例中S103的流程图；

图3是本发明实施例中创建问题推荐模型的流程图；

图4是本发明另一实施例中创建问题推荐模型的流程图；

图5是本发明实施例中S301的流程图；

图6是本发明实施例中词向量和特征的示意图；

图7是待推荐文本及推荐概率的示意图；

图8是本发明实施例中根据预设语法结构将推荐单词组成问题推荐文本的示例图；

图9是本发明第一实施例中手机银行的银行推荐功能页面示例图；

图10是本发明第二实施例中手机银行的银行推荐功能页面示例图；

图11是本发明实施例中基于机器学习的问题推荐装置的结构框图；

图12是本发明实施例中计算机设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本领域技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

鉴于现有技术存在输入耗时长、沟通效率低的缺陷，对不熟悉智能手机的老人很不友好，本发明实施例提供一种基于机器学习的问题推荐方法，在手机银行即时通讯系统对话框嵌入快捷语推荐功能，可以在用户使用文字咨询客服的过程中实时为用户推荐可能想提问的问题，用户直接点击对应问题即可发送，大大减少用户编辑操作，对提升手机银行服务水平、优化用户使用体验有着重要意义。

本发明为使用手机银行进行文字咨询的用户提供快捷语推荐功能，用户在使用文字向客服咨询的过程中，可直接点击推荐的问题一键发送。由于问题推荐需要满足相关性、个性化等需求，因此需要在服务端建立快捷语推荐语料库，在语料库中存储推荐的文本以及文本特征。为了丰富推荐语内容，该语料库以词语的方式对文本进行存储，并根据语料库训练推荐模型，以词语拼接的模式为用户提供精准的问题文本推荐。该语料库及模型也可以用于其他文字沟通渠道，例如网上银行客服、官方公众号、小程序以及常见问题推荐页面等。以下结合附图对本发明进行详细说明。

本发明主要涵盖以下流程：收集用户咨询过程中的文本数据和相关业务数据，将文本数据进行分词处理、梳理、特征提取和存储，构成快捷语推荐语料库，并使用该语料库作为训练数据集，运用机器学习算法生成问题推荐模型以确定问题推荐文本，在用户咨询的过程中实时为其推荐可能需要咨询的问题。

图1是本发明实施例中基于机器学习的问题推荐方法的流程图。如图1所示，基于机器学习的问题推荐方法包括：

S101：获取文本问题，根据文本问题生成当前词向量。

S102：将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率。

S103：根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。

图2是本发明实施例中S103的流程图。图7是待推荐文本及推荐概率的示意图。如图2和图7所示，S103包括：

S201：根据预设语法结构和各推荐单词合成待推荐文本。

具体实施时，可以根据预设语法结构和各推荐单词合成最可能被提问的多个待推荐文本。

S202：根据各推荐单词的推荐概率确定待推荐文本的推荐概率。

S203：根据待推荐文本的推荐概率从待推荐文本中选择问题推荐文本。

具体实施时，可以对推荐概率按照从大到小的顺序进行排序，确定排序在预设阈值之前的待推荐文本为问题推荐文本。

图8是本发明实施例中根据预设语法结构将推荐单词组成问题推荐文本的示例图。如图8所示，用户的上一个问题“如何办理信用卡”中的“信用卡”可以关联到和信用卡相关的下一问题，此时通过本发明可以将推荐单词“信用卡”、“种类”和“有哪些”组成“信用卡种类有哪些？”的问题推荐文本，将推荐单词“信用卡”、“年费”和“是多少”组成“信用卡年费是多少？”的问题推荐文本，将推荐单词“信用卡”、“额度”和“是多少”组成“信用卡|额度|是多少？”的问题推荐文本并展示给用户。当用户选择“信用卡年费是多少？”时，“信用卡年费是多少？”中的“年费”可以关联到和年费相关的下一问题，此时通过本发明可以将推荐单词“年费”、“怎样”和“缴纳”组成“年费怎样缴纳？”的问题推荐文本，将推荐单词“年费”、“有什么”和“优惠”组成“年费有什么优惠？”的问题推荐文本并展示给用户。

图1所示的基于机器学习的问题推荐方法的执行主体可以为计算机。由图1所示的流程可知，本发明实施例的基于机器学习的问题推荐方法先根据文本问题生成当前词向量，再将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本，可以实时为用户精准推荐问题，大大减少用户的编辑操作，提升手机银行服务效率，优化用户使用体验。

图3是本发明实施例中创建问题推荐模型的流程图。图4是本发明另一实施例中创建问题推荐模型的流程图。如图3-图4所示，基于历史词向量创建问题推荐模型包括：

S301：确定历史问题中历史词向量的各特征。

在执行S301之前，还包括：收集咨询过程中用户发送过的历史问题作为初始数据，对其进行分词、去重等操作，生成词库，并将词库中的词转换为历史词向量，得到训练集。

图6是本发明实施例中词向量和特征的示意图，如图6所示，特征包括：训练集概率特征、用户咨询概率特征、业务咨询概率特征、业务阶段概率特征和关联特征。

图5是本发明实施例中S301的流程图。如图5所示，S301包括：

S401：确定各历史词向量在训练集的出现概率为各历史词向量的训练集概率特征。

S402：确定各历史词向量在各用户咨询历史的出现概率为各历史词向量的用户咨询概率特征。

表1是用户咨询概率特征表。如表1所示，具体实施时，可以根据各历史词向量在各用户咨询历史的出现概率生成“用户数×训练集大小”维度的向量。

表1

S403：确定各历史词向量在各业务咨询历史的出现概率为各历史词向量的业务咨询概率特征。

表2是业务咨询概率特征表。如表2所示，具体实施时，可以根据各历史词向量在各业务咨询历史的出现概率生成“业务数×训练集大小”维度的向量。

表2

S404：确定各历史词向量在各业务阶段的出现概率为各历史词向量的业务阶段概率特征。

表3是业务阶段概率特征表。如表3所示，业务阶段概率特征用于标记该历史词向量属于业务办理过程中的哪个阶段，例如：业务前咨询、审批中和审批完成等。具体实施时，可以根据各历史词向量在各业务阶段的出现概率生成“流程数×训练集大小”维度的向量。

表3

S405：根据各历史词向量之间的共现概率和顺序标记确定各历史词向量的关联特征。

表4是词向量1的关联特征表。关联特征用于基于用户已发送的文本做出后续推荐判断。如表4所示，词向量1与词向量3之间的共现概率为0.5，代表词向量1与词向量3出现在同一历史问题的概率为0.5；词向量1与词向量3之间的顺序标记为1，代表词向量3出现在词向量1之前；词向量1与词向量4之间的顺序标记为-1，代表词向量3出现在词向量1之后；词向量1与词向量2之间的顺序标记为0，代表词向量2与词向量1不在同一历史问题中出现。

表4

执行如下迭代处理：

S302：根据历史问题中历史词向量的各特征和各特征的特征权重确定训练集中各历史词向量的推荐概率。

S303：根据训练集中各历史词向量的推荐概率与对应的各实际词向量确定损失函数。

S304：判断损失函数是否小于或等于预设损失函数阈值。

S305：当损失函数小于或等于预设损失函数阈值时，根据各特征的特征权重创建问题推荐模型。

S306：当损失函数大于预设损失函数阈值时，根据损失函数更新各特征的特征权重，继续执行迭代处理。

本发明实施例的具体流程如下：

1、确定各历史词向量在训练集的出现概率为各历史词向量的训练集概率特征，确定各历史词向量在各用户咨询历史的出现概率为各历史词向量的用户咨询概率特征，确定各历史词向量在各业务咨询历史的出现概率为各历史词向量的业务咨询概率特征，确定各历史词向量在各业务阶段的出现概率为各历史词向量的业务阶段概率特征，根据各历史词向量之间的共现概率和顺序标记确定各历史词向量的关联特征。

2、根据历史问题中历史词向量的各特征和各特征的特征权重确定训练集中各历史词向量的推荐概率。

3、根据训练集中各历史词向量的推荐概率与对应的各实际词向量确定损失函数。当损失函数小于或等于预设损失函数阈值时，根据各特征的特征权重创建问题推荐模型，否则根据损失函数更新各特征的特征权重，返回步骤2。

4、获取文本问题，根据文本问题生成当前词向量。

5、将当前词向量输入问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率。

6、根据预设语法结构和各推荐单词合成待推荐文本，根据各推荐单词的推荐概率确定待推荐文本的推荐概率。

7、根据待推荐文本的推荐概率从待推荐文本中选择问题推荐文本。

图9是本发明第一实施例中手机银行的银行推荐功能页面示例图。图10是本发明第二实施例中手机银行的银行推荐功能页面示例图。如图9-图10所示，首先为用户推荐几个最常被咨询的问题，例如：如何办理信用卡、如何办理存款等。用户开始咨询后，本发明根据用户提出的问题推荐下一个问题(问题推荐文本)。例如用户首先咨询如何办理信用卡，本发明将该文本问题输入问题推荐模型，为用户推荐信用卡相关的问题，例如：信用卡额度有多少、怎样使用信用卡分期等。

综上，本发明实施例的基于机器学习的问题推荐方法先根据文本问题生成当前词向量，再将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本，可以实时为用户精准推荐问题，大大减少用户的编辑操作，提升用户在使用手机银行时的输入体验和手机银行服务效率，优化用户使用体验。

基于同一发明构思，本发明实施例还提供了一种基于机器学习的问题推荐装置，由于该装置解决问题的原理与基于机器学习的问题推荐方法相似，因此该装置的实施可以参见方法的实施，重复之处不再赘述。

图11是本发明实施例中基于机器学习的问题推荐装置的结构框图。如图11所示，基于机器学习的问题推荐装置包括：

词向量生成模块，用于获取文本问题，根据文本问题生成当前词向量；

推荐单词概率模块，用于将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率；

问题推荐文本模块，用于根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。

在其中一种实施例中，问题推荐文本模块包括：

待推荐文本合成单元，用于根据预设语法结构和各推荐单词合成待推荐文本；

文本推荐概率单元，用于根据各推荐单词的推荐概率确定待推荐文本的推荐概率；

问题推荐文本单元，用于根据待推荐文本的推荐概率从待推荐文本中选择问题推荐文本。

在其中一种实施例中，还包括：

特征确定模块，用于确定历史问题中历史词向量的各特征；

问题推荐模型创建模块，用于执行如下迭代处理：

根据历史问题中历史词向量的各特征和各特征的特征权重确定训练集中各历史词向量的推荐概率；

根据训练集中各历史词向量的推荐概率与对应的各实际词向量确定损失函数；

当损失函数小于或等于预设损失函数阈值时，根据各特征的特征权重创建问题推荐模型，否则根据损失函数更新各特征的特征权重，继续执行迭代处理。

在其中一种实施例中，特征包括：训练集概率特征、用户咨询概率特征、业务咨询概率特征、业务阶段概率特征和关联特征；

特征确定模块包括：

训练集概率特征单元，用于确定各历史词向量在所述训练集的出现概率为各历史词向量的训练集概率特征；

用户咨询概率特征单元，用于确定各历史词向量在各用户咨询历史的出现概率为各历史词向量的用户咨询概率特征；

业务咨询概率特征单元，用于确定各历史词向量在各业务咨询历史的出现概率为各历史词向量的业务咨询概率特征；

业务阶段概率特征单元，用于确定各历史词向量在各业务阶段的出现概率为各历史词向量的业务阶段概率特征；

关联特征单元，用于根据各历史词向量之间的共现概率和顺序标记确定各历史词向量的关联特征。

综上，本发明实施例的基于机器学习的问题推荐装置先根据文本问题生成当前词向量，再将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本，可以实时为用户精准推荐问题，大大减少用户的编辑操作，提升用户在使用手机银行时的输入体验和手机银行服务效率，优化用户使用体验。

本发明实施例还提供能够实现上述实施例中的基于机器学习的问题推荐方法中全部步骤的一种计算机设备的具体实施方式。图12是本发明实施例中计算机设备的结构框图，参见图12，所述计算机设备具体包括如下内容：

处理器(processor)1201和存储器(memory)1202。

所述处理器1201用于调用所述存储器1202中的计算机程序，所述处理器执行所述计算机程序时实现上述实施例中的基于机器学习的问题推荐方法中的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

获取文本问题，根据文本问题生成当前词向量；

将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率；

根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。

综上，本发明实施例的计算机设备先根据文本问题生成当前词向量，再将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本，可以实时为用户精准推荐问题，大大减少用户的编辑操作，提升用户在使用手机银行时的输入体验和手机银行服务效率，优化用户使用体验。

本发明实施例还提供能够实现上述实施例中的基于机器学习的问题推荐方法中全部步骤的一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中的基于机器学习的问题推荐方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

获取文本问题，根据文本问题生成当前词向量；

将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率；

根据预设语法结构、各推荐单词和各推荐单词的推荐概率确定问题推荐文本。

综上，本发明实施例的计算机可读存储介质先根据文本问题生成当前词向量，再将当前词向量输入基于历史词向量创建的问题推荐模型中，得到各推荐单词和各推荐单词的推荐概率以确定问题推荐文本，可以实时为用户精准推荐问题，大大减少用户的编辑操作，提升用户在使用手机银行时的输入体验和手机银行服务效率，优化用户使用体验。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block)，单元，和步骤可以通过电子硬件、电脑软件，或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability)，上述的各种说明性部件(illustrative components)，单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用，可以使用各种方法实现所述的功能，但这种实现不应被理解为超出本发明实施例保护的范围。

本发明实施例中所描述的各种说明性的逻辑块，或单元，或装置都可以通过通用处理器，数字信号处理器，专用集成电路(ASIC)，现场可编程门阵列或其它可编程逻辑装置，离散门或晶体管逻辑，离散硬件部件，或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器，可选地，该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现，例如数字信号处理器和微处理器，多个微处理器，一个或多个微处理器联合一个数字信号处理器核，或任何其它类似的配置来实现。

本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地，存储媒介可以与处理器连接，以使得处理器可以从存储媒介中读取信息，并可以向存储媒介存写信息。可选地，存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中，ASIC可以设置于用户终端中。可选地，处理器和存储媒介也可以设置于用户终端中的不同的部件中。

在一个或多个示例性的设计中，本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现，这些功能可以存储与电脑可读的媒介上，或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如，这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置，或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外，任何连接都可以被适当地定义为电脑可读媒介，例如，如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘，磁盘通常以磁性复制数据，而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：刘唱;刘金山;梁侃;杨洁琼;
专利申请人：中国工商银行股份有限公司;

上一篇：自动还款场景下的转账交易报文生成方法及装置
下一篇：双端数据传输电路和存储器