导航：首页> 铁的冶金>信息推送的方法和装置

信息推送的方法和装置

文献发布时间：2023-06-19 09:55:50

技术领域

本公开的实施例涉及计算机技术领域，具体涉及机器学习领域，尤其涉及一种信息推送的方法和装置。

背景技术

目前，query(查询，通常指用户在搜索引擎或对话系统中输入的完整文本)自动补全常用于现代搜索引擎中，目的是辅助用户输入query，提升用户体验，避免输入拼写错误或表述模糊的query。随着商业对话系统(例如购物网站中用户与客服的对话系统)的兴起，query自动补全算法被引入到了商业对话系统中。

相关技术中，query补全算法通常是在用户输入query过程中，基于用户输入的prefix(前缀，指用户尚未输入完成、处于中间状态的文本，通常为query的一部分)预测完整的query，然后按照相关性排序后推荐给用户。

发明内容

本公开的实施例提出了信息推送的方法和装置。

第一方面，本公开的实施例提供了一种信息推送的方法，该方法包括：响应于接收到文本输入指令，获取输入的文本；将文本输入预先训练的意图识别模型，预测出文本的意图标签；基于文本和文本的意图标签，从预先构建的语料库中检索出预设数量的候选语料，语料库中预存有标记了意图标签的语料，候选语料的意图标签与文本的意图标签匹配，且候选语料的文本特征与文本的文本特征相似；基于预设策略，对各候选语料排序，生成推荐语料列表；推送推荐语料列表。

在一些实施例中，将文本输入预先训练的意图识别模型，预测出文本的意图标签，包括：对文本切词，得到文本的词集合；确定词集合中的每个词与各意图标签之间的互信息，得到每个词的互信息特征向量；基于词集合中的各个词的互信息特征向量，生成文本的互信息特征矩阵；将互信息特征矩阵，输入预先构建的意图分类模型，估计出文本对应的各意图标签的置信度；将置信度大于预设置信度阈值的意图标签，确定为文本的意图标签。

在一些实施例中，将文本输入预先训练的意图识别模型，预测出文本的意图标签，还包括：响应于文本所在的当前对话记录中存在输入时间早于该文本的其他对话文本，将对话记录中输入时间最接近文本的对话文本确定为第一对话文本，并确定出第一对话文本的意图标签与各意图标签之间的转移概率；基于转移概率，生成文本的意图标签转移特征向量；以及，将互信息特征矩阵和意图标签转移特征向量，输入意图分类模型，估计出文本对应的各意图标签的置信度。

在一些实施例中，意图分类模型经由如下步骤训练得到：获取样本对话记录，样本对话记录中包括按照输入时间排序的多个样本对话文本；确定各样本对话文本的意图标签；从每个样本对话文本的起始文字向后提取出预设长度的字符串，作为样本文本；基于样本文本对应的样本对话文本的意图标签，标记样本文本；对样本文本进行切词，并确定样本文本的样本互信息特征向量；若样本文本所在的样本对话记录中存在输入时间早于该样本文本的其他样本对话文本，则确定出该样本文本的样本意图标签转移特征向量；若样本文本所在的样本对话记录中不存在输入时间早于该样本文本的其他样本对话文本，则将该样本文本的样本意图标签转移向量确定为零；将样本文本的样本互信息特征向量和样本意图标签转移特征向量输入预先构建的初始意图分类模型，将样本文本标记的意图标签作为期望输出，训练初始意图分类模型，得到训练后的意图分类模型。

在一些实施例中，语料库经由如下步骤构建：从历史日志中提取第一预设时间段内的历史对话记录，每个历史对话记录均包括多个历史对话文本；确定历史对话文本的意图标签；从历史对话文本中提取出该历史对话文本的特征信息，特征信息包括文本特征信息、输入时间信息和频次信息，频次信息包括历史对话文本被推送的次数和/或历史对话文本在第二预设时间段内被选中的次数；将历史对话文本确定为语料，并基于历史对话文本、历史对话文本的特征信息和历史对话文本的意图标签，生成元数据；将元数据存入数据库，得到语料库。

在一些实施例中，基于预设策略，对各候选语料排序，生成推荐语料列表，包括：分别确定出文本与各候选语料的文本相似度和意图标签匹配度；基于如下参数确定各候选语料的推荐指数：文本与候选语料的文本相似度、文本与候选语料的意图标签匹配度、候选语料的频次信息和候选语料的输入时间信息；按照各候选语料的推荐指数从大到小的顺序，对各候选语料排序，得到推荐语料列表。

第二方面，本公开的实施例还提供了一种信息推送的装置，该装置包括：文本获取单元，被配置成响应于接收到文本输入指令，获取输入的文本；意图预测单元，被配置成将文本输入预先训练的意图识别模型，预测出文本的意图标签；语料检索单元，被配置成基于文本和文本的意图标签，从预先构建的语料库中检索出预设数量的候选语料，语料库中预存有标记了意图标签的语料，候选语料的意图标签与文本的意图标签匹配，且候选语料的文本特征与文本的文本特征相似；列表生成单元，被配置成基于预设策略，对各候选语料排序，生成推荐语料列表；信息推送单元，被配置成推送推荐语料列表。

在一些实施例中，意图预测单元包括：切词模块，被配置成对文本切词，得到文本的词集合；互信息特征模块，被配置成确定词集合中的每个词与各意图标签之间的互信息，得到每个词的互信息特征向量；特征矩阵生成模块，被配置成基于词集合中的各个词的互信息特征向量，生成文本的互信息特征矩阵；意图分类模块，被配置成将互信息特征矩阵，输入预先构建的意图分类模型，估计出文本对应的各意图标签的置信度；标签确定模块，被配置成将置信度大于预设置信度阈值的意图标签，确定为文本的意图标签。

在一些实施例中，意图预测单元还包括：转移概率计算模块，被配置成响应于文本所在的当前对话记录中存在输入时间早于该文本的其他对话文本，将对话记录中输入时间最接近文本的对话文本确定为第一对话文本，并确定出第一对话文本的意图标签与各意图标签之间的转移概率；意图标签转移特征模块，被配置成基于转移概率，生成文本的意图标签转移特征向量；以及，意图分类模块被进一步配置成：将互信息特征矩阵和意图标签转移特征向量，输入意图分类模型，估计出文本对应的各意图标签的置信度。

在一些实施例中，装置还包括模型训练单元，被配置成：获取样本对话记录，样本对话记录中包括按照输入时间排序的多个样本对话文本；确定各样本对话文本的意图标签；从每个样本对话文本的起始文字向后提取出预设长度的字符串，作为样本文本；基于样本文本对应的样本对话文本的意图标签，标记样本文本；对样本文本进行切词，并确定样本文本的样本互信息特征向量；若样本文本所在的样本对话记录中存在输入时间早于该样本文本的其他样本对话文本，则确定出该样本文本的样本意图标签转移特征向量；若样本文本所在的样本对话记录中不存在输入时间早于该样本文本的其他样本对话文本，则将该样本文本的样本意图标签转移向量确定为零；将样本文本的样本互信息特征向量和样本意图标签转移特征向量输入预先构建的初始意图分类模型，将样本文本标记的意图标签作为期望输出，训练初始意图分类模型，得到训练后的意图分类模型。

在一些实施例中，该装置还包括语料库构建单元，被配置成：从历史日志中提取第一预设时间段内的历史对话记录，每个历史对话记录均包括多个历史对话文本；确定历史对话文本的意图标签；从历史对话文本中提取出该历史对话文本的特征信息，特征信息包括文本特征信息、输入时间信息和频次信息，频次信息包括历史对话文本在第二预设时间段内被推送的次数和/或历史对话文本被选中的次数；将历史对话文本确定为语料，并基于历史对话文本、历史对话文本的特征信息和历史对话文本的意图标签，生成元数据；将元数据存入数据库，得到语料库。

在一些实施例中，列表生成单元进一步包括：相似度确定模块，被配置成分别确定出文本与各候选语料的文本相似度和意图标签匹配度；指数确定模块，被配置成基于如下参数确定各候选语料的推荐指数：文本与候选语料的文本相似度、文本与候选语料的意图标签匹配度、候选语料的频次信息和候选语料的输入时间信息；排序模块，按照各候选语料的推荐指数从大到小的顺序，对各候选语料排序，得到推荐语料列表。

第三方面，本公开的实施例还提供了一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现上述任一的方法。

第四方面，本公开的实施例还提供了一种计算机可读介质，其上存储有计算机程序，其中，程序被处理器执行时实现上述任一的方法。

本公开的实施例提供的信息推送的方法和装置，基于用户输入的文本预测出用户的意图，然后基于用户的意图和输入的文本从语料库中确定出候选语料，可以确保候选语料与用户意图契合度更高，从而提高了推送信息的针对性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显：

图1是本公开的一些实施例可以应用于其中的示例性系统架构图；

图2是根据本公开的信息推送的方法的一个实施例的流程图；

图3是图2所示的信息推送的方法的流程的一个场景示意图；

图4是根据本公开的信息推送的方法的又一个实施例的流程图；

图5是根据本公开的信息推送的装置的一个实施例的结构示意图；

图6是适于用来实现本公开的实施例的电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

图1示出了可以应用本公开的实施例的信息推送的方法或信息推送的装置的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等，例如用户可以在终端设备上输入想要发送的消息文本，然后由终端设备将该消息文本发送至服务器，还可以接收从服务器返回的消息。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具备通信功能的电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上传的用户输入的文本进行处理的后台数据服务器。后台数据服务器可以基于用户输入的文本预测出用户的意图、在语料库中检索出候选语料并生成推荐语料列表，然后将处理结果(推荐语料列表)反馈给终端设备。

需要说明的是，本公开的实施例所提供的信息推送的方法可以由终端设备101、102、103执行，也可以由服务器105执行。相应地，信息推送的装置可以设置于终端设备101、102、103中，也可以设置于服务器105中。在此不做具体限定。

需要说明的是，服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成例如用来提供分布式服务的多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

继续参考图2，示出了根据本公开的信息推送的方法的一个实施例的流程200。该信息推送的方法，包括以下步骤：

步骤201，响应于接收到文本输入指令，获取输入的文本。

通常，用户通过终端设备(例如可以是图1中所示的终端设备)与云端(例如可以是图1中所示的服务器)进行信息交互，例如可以是通过搜索引擎获取信息，用户通过在终端设备的文本输入控件中输入文字，来表达自己的意图。当用户输入一段文字时，通常会根据自己的习惯输入其中一部分文字或词组，在用户将整段文字输入完成之前，该部分文字为中间状态的文本。

在本实施例中，文本输入指令可以是用户点击文本输入控件(例如可以是文本输入框)的指令，则文本输入控件中的文字即为执行主体所要获取的文本。

以商业对话为例，用户可以通过执行主体(例如可以是图1中的终端设备)上装载的电商应用与云端的客服人员进行信息交互，当用户点击交互页面中的输入框时，执行主体接收到文本输入指令，继而获取用户在输入框中输入的文本。

步骤202，将文本输入预先训练的意图识别模型，预测出文本的意图标签。

在本实例中，意图标签用于表征用户期望通过文字表达的自身意图，可以预先采用统计分析的方法从现有的文本记录中提炼。作为示例，可以从应用(例如可以是搜索引擎或电商应用)的系统日志中获取历史文本，然后基于历史文本的对话场景、业务类别和动作类型提炼用户的意图，并生成意图标签，例如可以从商业对话场景中提炼出如下意图标签：“修改订单”、“查询物流”、“退货”等。再例如在搜索场景中可以提炼出如下意图标签：“在哪儿”、“怎么办”、“是什么”等。进一步地，执行主体可以对提炼出的意图标签编码，以编码的形式存储各意图标签。

在本实施例中，意图识别模型用于表征文本与意图标签之间的对应关系，执行主体可以采用深度学习模型作为意图识别模型，例如可以是双向LSTM网络(Long Short TermMemory，长短期记忆)、DMN网络(Dynamic Memory Network，动态记忆网络)或其他分类模型。

在本实施例的一些可选的实现方式中，还可以通过如下步骤确定文本对应的意图标签：将文本输入预先训练的意图识别模型，预测出文本的意图标签，包括：对文本切词，得到文本的词集合；确定词集合中的每个词与各意图标签之间的互信息，得到每个词的互信息特征向量；基于词集合中的各个词的互信息特征向量，生成文本的互信息特征矩阵；将互信息特征矩阵，输入预先构建的意图分类模型，估计出文本对应的各意图标签的置信度；将置信度大于预设置信度阈值的意图标签，确定为文本的意图标签。

互信息(Mutual Information)是信息论里一种信息度量，它可以看成是一个随机变量中包含的关于另一个随机变量的信息量。

在本实现方式中，互信息用于表征词与意图标签之间的关联程度，按照预设的意图标签的排列顺序，对同一个词的多个互信息排序，即可得到该词的互信息特征向量。词的互信息特征向量可以表征该词与多个意图标签之间的关联程度。作为示例，可以预先通过统计分析的方法预先确定词与各意图标签之间的互信息，并建立词相对于各意图标签的互信息的对应关系列表，如此，执行主体检索该对应关系列表即可确定词与各意图标签之间的互信息。

在本实现方式中，文本的互信息特征矩阵用于表征文本与各意图标签之间的关联程度。作为示例，执行主体可以基于各个词在文本中的顺序，将各个词的互信息特征向量排列，组成特征向量矩阵。

作为本实现方式的一个优选的实施方式，执行主体还可以将各个词的互信息特征向量相加，所得到的向量维数保持不变，将该向量作为文本的特征矩阵，如此，可以提高计算效率。

在一个具体的示例中，假设步骤201中获取的文本为“机器学习的”，执行主体执行分词处理后，得到3个词“机器”、“学习”和“的”，然后基于预先构建的词与意图标签的对应关系列表，分别确定出这3个词的相对于各意图标签的互信息，并生成各自的互信息特征向量A

在本实现方式中，执行主体先提取出文本的互信息特征，再由机器学习模型基于互信息特征矩阵预测文本的意图标签，可以提高预测的准确度。

需要说明的是，本实现方式中关于互信息特征的提取步骤可以由执行主体采用相应的特征提取算法单独执行，也可以作为特征提取模块集成到意图分类模型中，集成了特征提取模块的意图分类模型等价于意图识别模型，本申请对此不做限制。

步骤203，基于文本和文本的意图标签，从预先构建的语料库中检索出预设数量的候选语料，语料库中预存有标记了意图标签的语料，候选语料的意图标签与文本的意图标签匹配，且候选语料的文本特征与文本的文本特征相似。

在本实施例中，语料库中的语料均预先标记有意图标签，语料库可以存于云端，也可以存于本地。执行主体可以采用文本检索工具(例如Elastic Search或Solr)，将步骤202中得到的文本的各意图标签作为检索条件，从语料库中检索出与文本相似的语料，作为候选语料。

在本实施例中，文本特征可以包括：文本长度、语料长度、文本与语料的长度比例等特征，以及，jaccard相似度(其计算方法是：文本和语料分别按词切分，计算交集词数和/或并集词数)，bigram jaccard相似度(其计算方法是：文本和语料切词后的2gramm组合，计算交集词数和/或并集词数)。

在本实施的一些可选的实现方式中，语料库可以经由如下步骤构建：从历史日志中提取第一预设时间段内的历史对话记录，每个历史对话记录均包括多个历史对话文本；确定历史对话文本的意图标签；从历史对话文本中提取出该历史对话文本的特征信息，特征信息包括文本特征信息、输入时间信息和频次信息，频次信息包括历史对话文本在第二预设时间段内被推送的次数和/或历史对话文本被选中的次数；将历史对话文本确定为语料，并基于历史对话文本、历史对话文本的特征信息和历史对话文本的意图标签，生成元数据；将元数据存入数据库，得到语料库。

在本实现方式中，历史对话文本在第二预设时间段内被推送的次数是指该历史对话文本作为语料被选中为候选语料的次数，被选中的次数则是指该历史对话文本作为候选语料推荐给用户后，被用户选中的次数。

通常，终端设备上装载的应用的历史日志中会存有用户输入过的历史对话记录，而这些历史对话记录的对话场景是相同或相似的，可以更准确地表征用户的行为偏好。因此，本实现方式中，基于历史对话文本构建语料库可以提高语料与用户行为偏好的契合程度，进而提高语料与用户意图的契合程度。

在本实现方式的一个具体的示例中，执行主体可以读取本地应用(例如电商应用)的历史日志，然后从历史日志中提取第一预设时间段内的历史对话文本，例如可以是最近一年内的历史对话文本，也可以是最近一个月的历史对话文本。之后基于历史对话文本的对话场景、业务类别和动作类型，确定历史对话文本的意图标签，并提取历史对话文本的特征信息，最后基于历史对话文本、历史对话文本的特征信息和意图标签，生成元数据，写入数据库中，即可得到本实现方式的语料库。

在本实现方式的一个优选的实施方式中，在提取历史对话文本之后，可以基于预设策略对历史对话文本进行过滤，将符合条件的历史对话文本删除，例如，可以包括但不限于以下策略：

敏感内容清洗：去除含有脏话、政治敏感词、业务敏感词等的历史对话文本；长度过滤：去除长度过短和过长的历史对话文本；隐私内容清洗：去除含有用户隐私信息如姓名、电话、地址等的历史对话文本；频次过滤：去除包含有被推荐次数或被选中次数较低的词的历史对话文本；去重：去除重复的历史对话文本。如此可以避免冗余或无效数据占用语料库的存储空间。

步骤204，基于预设策略，对各候选语料排序，生成推荐语料列表。

作为示例，执行主体可以基于如下因素对候选语料排序：候选语料与文本的文本特征相似程度、意图标签的类型、候选语料的长度等。

作为步骤203中可选的实现方式的进一步的优选方案，还以采用如下策略生成推荐语料列表：分别确定出文本与各候选语料的文本相似度和意图标签匹配度；基于如下参数确定各候选语料的推荐指数：文本与候选语料的文本相似度、文本与候选语料的意图标签匹配度、候选语料的频次信息和候选语料的输入时间信息；按照各候选语料的推荐指数从大到小的顺序，对各候选语料排序，得到推荐语料列表。

在本实现方式中，执行主体可以通过对比文本特征的相似程度确定文本与候选语料的文本相似度，可以将步骤202中预测出的文本的各个意图标签的置信度作为文本与候选语料的意图标签匹配度。然后可以将各个参数的加权和作为候选语料的推荐指数，如此，在对候选语料排序时，可以同时兼顾候选语料自身的时效性以及候选语料与用户意图的契合程度，从而提高推荐预料列表的针对性。

作为示例，执行主体经步骤202得到的文本的各意图标签的置信度分别问：标签A，置信度为90％；标签B，置信度为8％；标签C，执行度为2％。执行主体经由步骤203得到如下候选语料：候选语料1，意图标签为C；候选语料2，意图标签为A；候选语料3，意图标签为B。则执行主体可以确定候选语料1的意图标签匹配度为2％，候选语料2的意图标签匹配度为90％，候选语料3的意图标签匹配度为8％。

步骤205，推送推荐语料列表。

在本实施例中，执行主体可以在文本输入控件附近的区域呈现推荐语料列表，以供用户选取。

继续参见图3，图3是如2所示方法的流程的一个场景示意图。在图3中，执行主体301可以是智能手机，其上装载有电商应用，用户可以通过电商应用中的商业对话系统与云端的客服人员进行信息交互。如图3(a)所示，用户可以点击商业对话界面的文本输入框，并输入文本“我想修”。接着参考图3(b),智能手机检测到用户点击文本输入框的指令时，获取输入框中的文本“我想修”，并将该文本输入预先训练的意图标签识别模型中，估计出该本文的如下意图标签：“修改订单”、“修改动作”和“修理物品”，然后将以上三个意图标签分别作为检索条件，从语料库中检索出与该文本相似的候选语料：“改”、“改订单”和“车”。之后参考图3(c)，智能手机基于检索到的候选语料生成推荐语料列表，并推送该推荐语料列表，以供用户选取。最后，如图3(d)所示，用户点击推荐列表中的“改订单”这一候选语料，则智能手机将该候选语料的文字内容输入至文本输入框中，从而实现了基于用户的意图自动补全用户输入的文本内容。

进一步参考图4，其示出了信息推送的方法的又一个实施例的流程400。该信息推送的方法的流程400，包括以下步骤：

步骤401，响应于接收到文本输入指令，获取输入的文本。此步骤与前述步骤201相近，此处不再赘述。

步骤402，对文本切词，得到文本的词集合。

步骤403，确定词集合中的每个词与各意图标签之间的互信息，得到每个词的互信息特征向量。

步骤404，基于词集合中的各个词的互信息特征向量，生成文本的互信息特征矩阵。步骤402至步骤404在前述步骤202的可选的实施方式中已经有所描述，此处不再赘述。

步骤405，响应于文本所在的当前对话记录中存在输入时间早于该文本的其他对话文本，将对话记录中确定出输入时间最接近该文本的对话文本确定为第一对话文本，并确定出第一对话文本的意图标签与各意图标签之间的转移概率。

在本实施例中，第一对话文本的意图标签与各意图标签之间的转移概率用于表征对话场景中上下文与用户意图的相关性。作为示例，可以通过统计分析，预先建立意图标签与意图标签之间的转移概率的对应关系列表，如此，执行主体只需检索该对应关系列表，即可确定第一对话文本的意图标签转移概率。

步骤406，基于转移概率，生成文本的意图标签转移特征向量。

在本实施例中，基于上下文之间的连贯性，第一对话文本的意图标签通常会对应于多个意图标签，即对应有多个概率值，因而，可以将这多个概率值组成向量，即得到文本的意图标签转移特征向量，意图标签转移特征向量可以表征上下文语境与用户意图的相关性。

在一个具体的示例中，假设当前对话记录中输入时间最接近文本的第一对话文本的意图标签为D，意图标签D可以对应有3个意图标签：D、E和F，意图标签D相对于这三个意图标签的转移概率分别为：20％、50％和30％，则文本的意图标签转移特征向量为(0.2，0.5，0.3)。

步骤407，将互信息特征矩阵和意图标签转移特征向量，输入意图分类模型，估计出文本对应的各意图标签的置信度。

在本实施例中，互信息特征矩阵可以表征文本自身与意图标签之间的相关性，意图标签转移特征向量可以表征上下文语境与用户意图的相关性，因而，意图分类模型基于互信息特征矩阵和意图标签转移特征向量，估计文本的意图标签，可以拓展与用户意图相关的特征的维度，提高预测的准确度。

步骤408，将置信度大于预设置信度阈值的意图标签，确定为文本的意图标签。此步骤在前述步骤202的可选的实施方式中已经有所描述，此处不再赘述。

步骤409，基于文本和文本的意图标签，从预先构建的语料库中检索出预设数量的候选语料，此步骤与前述步骤203相对应，此处不再赘述。

步骤410，基于预设策略，对各候选语料排序，生成推荐语料列表。此步骤与前述步骤204相对应，此处不再赘述。

步骤411，推送所述推荐语料列表。此步骤与前述步骤205相对应，此处不再赘述。

从图4中可以看出，与图2所示的实施例相比，本实施例中的信息推送的方法的流程400突出了从用户输入的文本中提取互信息特征以及确定文本的意图标签转移特征向量的步骤，如此可以在预测用户意图的过程中结合文本中每个词与用户意图之间的相关性以及上下文语境与用户意图的相关性，提高了意图预测的准确性，使得推荐的语料可以更契合用户的意图。

在上述实施例的一些可选的实现方式中，意图分类模型可以经由如下步骤训练得到：获取样本对话记录，样本对话记录中包括按照输入时间排序的多个样本对话文本；确定各样本对话文本的意图标签；从每个样本对话文本的起始文字向后提取出预设长度的字符串，作为样本文本；基于样本文本对应的样本对话文本的意图标签，标记样本文本；对样本文本进行切词，并确定样本文本的样本互信息特征向量；若样本文本所在的样本对话记录中存在输入时间早于该样本文本的其他样本对话文本，则确定出该样本文本的样本意图标签转移特征向量；若样本文本所在的样本对话记录中不存在输入时间早于该样本文本的其他样本对话文本，则将该样本文本的样本意图标签转移向量确定为零；将样本文本的样本互信息特征向量和样本意图标签转移特征向量输入预先构建的初始意图分类模型，将样本文本标记的意图标签作为期望输出，训练初始意图分类模型，得到训练后的意图分类模型。

作为示例，执行主体可以从本地应用的历史日志或从网络上获取商业对话记录作为样本对话记录，每个样本对话记录例如可以是同一个用户在同一个对话场景中的对话记录。之后对样本对话记录中包含的样本对话文本标记意图标签，并从样本对话文本中截取出样本文本，例如可以截取样本对话文本中的前三个字，如此可以确保样本文本是处于中间状态的文本，与实际应用中获取的客户输入的文本的状态是一致的。之后，确定出样本文本的样本互信息特征向量和样本意图标签转移特征向量，然后将样本文本的样本互信息特征向量和样本意图标签转移特征向量输入预先构建的初始意图分类模型，基于机器学习方法，训练该初始意图分类模型，得到训练后的意图分类模型。

进一步参考图5，作为对上述各图所示方法的实现，本公开提供了一种信息推送的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图5所示，本实施例的信息推送的装置500包括：文本获取单元501，被配置成响应于接收到文本输入指令，获取输入的文本；意图预测单元502，被配置成将文本输入预先训练的意图识别模型，预测出文本的意图标签；语料检索单元503，被配置成基于文本和文本的意图标签，从预先构建的语料库中检索出预设数量的候选语料，语料库中预存有标记了意图标签的语料，候选语料的意图标签与文本的意图标签匹配，且候选语料的文本特征与文本的文本特征相似；列表生成单元504，被配置成基于预设策略，对各候选语料排序，生成推荐语料列表；信息推送单元505，被配置成推送推荐语料列表。

在本实施例中，意图预测单元包括502：切词模块，被配置成对文本切词，得到文本的词集合；互信息特征模块，被配置成确定词集合中的每个词与各意图标签之间的互信息，得到每个词的互信息特征向量；特征矩阵生成模块，被配置成基于词集合中的各个词的互信息特征向量，生成文本的互信息特征矩阵；意图分类模块，被配置成将互信息特征矩阵，输入预先构建的意图分类模型，估计出文本对应的各意图标签的置信度；标签确定模块，被配置成将置信度大于预设置信度阈值的意图标签，确定为文本的意图标签。

在本实施例中，意图预测单元502还包括：转移概率计算模块，被配置成响应于文本所在的当前对话记录中存在输入时间早于该文本的其他对话文本，将对话记录中输入时间最接近文本的对话文本确定为第一对话文本，并确定出第一对话文本的意图标签与各意图标签之间的转移概率；意图标签转移特征模块，被配置成基于转移概率，生成文本的意图标签转移特征向量；以及，意图分类模块被进一步配置成：将互信息特征矩阵和意图标签转移特征向量，输入意图分类模型，估计出文本对应的各意图标签的置信度。

在本实施例中，该装置500还包括模型训练单元，被配置成：获取样本对话记录，样本对话记录中包括按照输入时间排序的多个样本对话文本；确定各样本对话文本的意图标签；从每个样本对话文本的起始文字向后提取出预设长度的字符串，作为样本文本；基于样本文本对应的样本对话文本的意图标签，标记样本文本；对样本文本进行切词，并确定样本文本的样本互信息特征向量；若样本文本所在的样本对话记录中存在输入时间早于该样本文本的其他样本对话文本，则确定出该样本文本的样本意图标签转移特征向量；若样本文本所在的样本对话记录中不存在输入时间早于该样本文本的其他样本对话文本，则将该样本文本的样本意图标签转移向量确定为零；将样本文本的样本互信息特征向量和样本意图标签转移特征向量输入预先构建的初始意图分类模型，将样本文本标记的意图标签作为期望输出，训练初始意图分类模型，得到训练后的意图分类模型。

在本实施例中，该装置500还包括语料库构建单元，被配置成：从历史日志中提取第一预设时间段内的历史对话记录，每个历史对话记录均包括多个历史对话文本；确定历史对话文本的意图标签；从历史对话文本中提取出该历史对话文本的特征信息，特征信息包括文本特征信息、输入时间信息和频次信息，频次信息包括历史对话文本被推送的次数和/或历史对话文本被选中的次数；将历史对话文本确定为语料，并基于历史对话文本、历史对话文本的特征信息和历史对话文本的意图标签，生成元数据；将元数据存入数据库，得到语料库。

在本实施例中，列表生成单元504进一步包括：相似度确定模块，被配置成分别确定出文本与各候选语料的文本相似度和意图标签匹配度；指数确定模块，被配置成基于如下参数确定各候选语料的推荐指数：文本与候选语料的文本相似度、文本与候选语料的意图标签匹配度、候选语料的频次信息和候选语料的输入时间信息；排序模块，按照各候选语料的推荐指数从大到小的顺序，对各候选语料排序，得到推荐语料列表。

下面参考图6，其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器或终端设备)600的结构示意图。本公开的实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的终端设备仅仅是一个示例，不应对本公开的实施例的功能和使用范围带来任何限制。

如图6所示，电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

通常，以下装置可以连接至I/O接口605：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607；包括例如磁带、硬盘等的存储装置608；以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置，也可以根据需要代表多个装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置609从网络上被下载和安装，或者从存储装置608被安装，或者从ROM 602被安装。在该计算机程序被处理装置601执行时，执行本公开的实施例的方法中限定的上述功能。需要说明的是，本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：响应于接收到文本输入指令，获取输入的文本；将文本输入预先训练的意图识别模型，预测出文本的意图标签；基于文本和文本的意图标签，从预先构建的语料库中检索出预设数量的候选语料，语料库中预存有标记了意图标签的语料，候选语料的意图标签与文本的意图标签匹配，且候选语料的文本特征与文本的文本特征相似；基于预设策略，对各候选语料排序，生成推荐语料列表；推送推荐语料列表。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括文本获取单元、意图预测单元、语料检索单元、列表生成单元和信息推送单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，文本获取单元还可以被描述为“响应于接收到文本输入指令，获取输入的文本的单元”。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开的实施例中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：刘丹;蒋思宏;邱立坤;邹波;
专利申请人：北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司;

上一篇：稀疏表示域中基于深度特征学习的人脸识别方法及系统
下一篇：一种用于转炉出钢末期的炉渣改质方法