掌桥专利:专业的专利平台
掌桥专利
首页

用户日志的处理装置及方法

文献发布时间:2023-06-19 09:24:30


用户日志的处理装置及方法

技术领域

本申请涉及计算机技术领域,尤其涉及一种用户日志的处理装置及方法。

背景技术

自然语言处理技术被广泛应用于智能家居。具体的,用户可通过语音实现对智能家居的控制。例如,用户可在智能电视上通过语音查询点播内容;对应地,智能电视对该语音进行识别,生成对应的文本内容(即查询语句),发送给服务器,服务器部署的语义引擎对查询语句进行文本解析,并定位到相应的业务,从而为用户反馈对应的查询结果。

但是,在实际应用中,容易出现语义引擎对用户的查询语句未能解析或不支持,或者反馈结果不满足用户需求等情况,从而不能准确为用户提供服务,导致用户体验较差。

发明内容

本申请提供一种用户日志的处理装置及方法,以解决相关技术容易出现语义引擎对用户的查询语句未能解析或不支持,或者反馈结果不满足用户需求等情况,从而不能准确为用户提供服务,导致用户体验较差等缺陷。

本申请第一个方面提供一种用户日志的处理装置,包括:处理器;

所述处理器,被配置为:

获取用户日志,并确定所述用户日志中的第一查询语句,所述第一查询语句为通过语义引擎解析用户查询语句的整个生命周期确定异常的查询语句,和/或所述语义引擎反馈结果异常的查询语句;

基于所述第一查询语句,确定新需求;

基于所述新需求,对当前语义引擎进行优化,以使所述语义引擎支持所述新需求的业务定位以及对所述新需求的业务处理。

本申请中一些实施例中,所述处理器还被配置为:

确定各第一查询语句对应的出现次数;

所述处理器具体被配置为:

对所述第一查询语句进行聚类,获得各聚簇包括的第一查询语句;

针对每个聚簇,根据该聚簇内各第一查询语句及各第一查询语句对应的出现次数,确定该聚簇对应的需求名称;

基于各聚簇对应的需求名称,确定新需求。

本申请中一些实施例中,所述处理器具体被配置为:

获取用户日志中的目标查询语句;

对所述目标查询语句进行预处理,获得第一查询语句及各第一查询语句对应的出现次数,各第一查询语句之间不重复。

本申请中一些实施例中,所述处理器具体被配置为:

根据预设提取规则,从所述用户日志中提取语义引擎未能解析或不支持的第二查询语句和/或语义引擎反馈结果不满足用户需求的第三查询语句;

将所述第二查询语句和/或所述第三查询语句作为所述目标查询语句。

本申请中一些实施例中,所述处理器具体被配置为:

对所述目标查询语句进行统计,获得相同的目标查询语句出现次数;

对所述目标查询语句进行去重,获得不重复的目标查询语句作为所述第一查询语句。

本申请中一些实施例中,所述处理器具体被配置为:

根据预设生成规则,生成各第一查询语句对应的句子向量;

基于预设聚类算法及各第一查询语句对应的句子向量,对所述第一查询语句进行聚类,获得各聚簇包括的第一查询语句。

本申请中一些实施例中,所述处理器还被配置为:根据各聚簇包括的第一查询语句,确定各聚簇对应的第一关键词;

所述处理器具体被配置为:针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句及所述聚簇对应的第一关键词,确定所述聚簇对应的需求名称。

本申请中一些实施例中,所述处理器具体被配置为:

针对每个聚簇,对所述聚簇所包括的各所述第一查询语句进行分词,并根据预设筛选规则进行筛选处理,获得所述聚簇对应的一组词;

根据所述聚簇对应的一组词,采用第一关键词提取算法提取所述聚簇对应的第一关键词。

本申请中一些实施例中,所述处理器还被配置为:采用第二关键词提取算法,确定所述聚簇对应的一组词中的第二关键词;基于各第二关键词及所述聚簇对应的第一关键词,确定所述聚簇对应的主题词;

所述处理器具体被配置为:针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句及所述聚簇对应的主题词,确定所述聚簇对应的需求名称。

本申请中一些实施例中,所述处理器还被配置为:获取各所述聚簇的簇中心的第一查询语句;

所述处理器具体被配置为:针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句、所述聚簇对应的主题词,以及所述聚簇的簇中心的第一查询语句,确定所述聚簇对应的需求名称。

本申请中一些实施例中,所述处理器具体被配置为:

针对每个聚簇,将所述聚簇出现次数最多的第一查询语句、所述聚簇对应的主题词及所述聚簇的簇中心的第一查询语句中重复次数最多的词,作为所述聚簇对应的需求名称。

本申请中一些实施例中,所述处理器具体被配置为:

从所述用户日志获取各需求名称对应的当前得分;

基于各需求名称对应的当前得分,确定各需求名称是否为新需求。

本申请中一些实施例中,所述处理器具体被配置为:

根据所述新需求,对已有需求进行扩充;

对于每个新需求,根据该新需求的类型,对当前语义引擎进行与该新需求类型对应的优化,以使所述语义引擎支持所述新需求的业务定位以及对所述新需求的业务处理。

本申请中一些实施例中,所述处理器具体被配置为:

针对每个新需求,若所述新需求为新领域,则扩充新的领域;

若所述新需求为已有领域下的新意图,则在该已有领域下扩充新的意图;

若所述新需求为已有意图下的新说法,则在该已有意图下扩充新的说法。

本申请中一些实施例中,所述装置应用于服务器中。

本申请中一些实施例中,所述装置应用于显示设备中,所述显示设备还包括:

显示器,用于呈现确定的新需求。

本申请中一些实施例中,所述显示器,还用于呈现各聚簇的相关信息。

本申请第二个方面提供一种用户日志的处理方法,包括:

获取用户日志,并确定所述用户日志中的第一查询语句,所述第一查询语句为通过语义引擎解析用户查询语句的整个生命周期确定异常的查询语句,和/或所述语义引擎反馈结果异常的查询语句;

基于所述第一查询语句,确定新需求;

基于所述新需求,对当前语义引擎进行优化,以使所述语义引擎支持所述新需求的业务定位以及对所述新需求的业务处理。

本申请中一些实施例中,所述方法还包括:

确定各第一查询语句对应的出现次数;

所述基于所述第一查询语句,确定新需求,包括:

对所述第一查询语句进行聚类,获得各聚簇包括的第一查询语句;

针对每个聚簇,根据该聚簇内各第一查询语句及各第一查询语句对应的出现次数,确定该聚簇对应的需求名称;

基于各聚簇对应的需求名称,确定新需求。

本申请中一些实施例中,确定所述用户日志中的第一查询语句及确定各第一查询语句对应的出现次数,包括:

获取用户日志中的目标查询语句;

对所述目标查询语句进行预处理,获得第一查询语句及各第一查询语句对应的出现次数,各第一查询语句之间不重复。

本申请中一些实施例中,所述获取用户日志中的目标查询语句,包括:

根据预设提取规则,从所述用户日志中提取语义引擎未能解析或不支持的第二查询语句和/或语义引擎反馈结果不满足用户需求的第三查询语句;

将所述第二查询语句和/或所述第三查询语句作为所述目标查询语句。

本申请中一些实施例中,对所述目标查询语句进行预处理,获得第一查询语句及各第一查询语句对应的出现次数,包括:

对所述目标查询语句进行统计,获得相同的目标查询语句出现次数;

对所述目标查询语句进行去重,获得不重复的目标查询语句作为所述第一查询语句。

本申请中一些实施例中,对所述第一查询语句进行聚类,获得各聚簇包括的第一查询语句,包括:

根据预设生成规则,生成各第一查询语句对应的句子向量;

基于预设聚类算法及各第一查询语句对应的句子向量,对所述第一查询语句进行聚类,获得各聚簇包括的第一查询语句。

本申请中一些实施例中,所述方法还包括:

根据各聚簇包括的第一查询语句,确定各聚簇对应的第一关键词;

所述针对每个聚簇,根据该聚簇内各第一查询语句及各第一查询语句对应的出现次数,确定该聚簇对应的需求名称,包括:

针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句及所述聚簇对应的第一关键词,确定所述聚簇对应的需求名称。

本申请中一些实施例中,所述根据各聚簇包括的第一查询语句,确定各聚簇对应的第一关键词,包括:

针对每个聚簇,对所述聚簇所包括的各所述第一查询语句进行分词,并根据预设筛选规则进行筛选处理,获得所述聚簇对应的一组词;

根据所述聚簇对应的一组词,采用第一关键词提取算法提取所述聚簇对应的第一关键词。

本申请中一些实施例中,针对每个聚簇,对所述聚簇所包括的各所述第一查询语句进行分词,并根据预设筛选规则进行筛选处理,获得所述聚簇对应的一组词之后,所述方法还包括:

采用第二关键词提取算法,确定所述聚簇对应的一组词中的第二关键词;

基于各第二关键词及所述聚簇对应的第一关键词,确定所述聚簇对应的主题词;

所述针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句及所述聚簇对应的关键词,确定所述聚簇对应的需求名称,包括:

针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句及所述聚簇对应的主题词,确定所述聚簇对应的需求名称。

本申请中一些实施例中,针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句及所述聚簇对应的主题词,确定所述聚簇对应的需求名称之前,所述方法还包括:

获取各所述聚簇的簇中心的第一查询语句;

所述针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句及所述聚簇对应的主题词,确定所述聚簇对应的需求名称,包括:

针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句、所述聚簇对应的主题词,以及所述聚簇的簇中心的第一查询语句,确定所述聚簇对应的需求名称。

本申请中一些实施例中,所述针对每个聚簇,根据所述聚簇出现次数最多的第一查询语句、所述聚簇对应的主题词,以及所述聚簇的簇中心的第一查询语句,确定所述聚簇对应的需求名称,包括:

针对每个聚簇,将所述聚簇出现次数最多的第一查询语句、所述聚簇对应的主题词及所述聚簇的簇中心的第一查询语句中重复次数最多的词,作为所述聚簇对应的需求名称。

本申请中一些实施例中,基于各聚簇对应的需求名称,确定新需求,包括:

从所述用户日志获取各需求名称对应的当前得分;

基于各需求名称对应的当前得分,确定各需求名称是否为新需求。

本申请中一些实施例中,基于所述新需求,对当前语义引擎进行优化,以使所述语义引擎支持所述新需求的业务定位以及对所述新需求的业务处理,包括:

根据所述新需求,对已有需求进行扩充;

对于每个新需求,根据该新需求的类型,对当前语义引擎进行与该新需求类型对应的优化,以使所述语义引擎支持所述新需求的业务定位以及对所述新需求的业务处理。

本申请中一些实施例中,根据所述新需求,对已有需求进行扩充,包括:

针对每个新需求,若所述新需求为新领域,则扩充新的领域;

若所述新需求为已有领域下的新意图,则在该已有领域下扩充新的意图;

若所述新需求为已有意图下的新说法,则在该已有意图下扩充新的说法。

本申请第三个方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第二个方面以及第二个方面各种可能的设计所述的方法。

本申请提供的用户日志的处理装置及方法,通过基于用户日志中异常的查询语句确定新需求,并基于新需求对语义引擎进行优化,使得语义引擎能够支持新需求的业务定位以及能够支持对新需求进行相应的业务处理,提高语义引擎的业务能力,从而准确地为用户反馈结果,解决相关技术容易出现语义引擎对用户的查询语句未能解析或不支持,或者反馈结果不满足用户需求等情况,从而不能准确为用户提供服务,导致用户体验较差的问题。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例基于的处理系统的架构示意图;

图2为本申请一实施例提供的一种用户日志的处理装置的结构示意图;

图3为本申请一实施例提供的另一种用户日志的处理装置的结构示意图;

图4为本申请一实施例提供的一种用户日志的处理装置的示例性框图;

图5为本申请一实施例提供的显示设备200的硬件配置框图;

图6为本申请一实施例提供的基于第一查询语句确定新需求的流程示意图;

图7为本申请一实施例提供的聚类的流程示意图;

图8为本申请一实施例提供的确定聚簇对应的需求名称的流程示意图。

通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

为使本申请的目的、实施方式和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。

基于本申请描述的示例性实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请所附权利要求保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。

需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本申请的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明(Unless otherwise indicated)。应该理解这样使用的用语在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。

此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

本申请中使用的术语“模块”,是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。

为了清楚理解本申请的技术方案,首先对相关技术的方案进行详细介绍。相关技术在用户通过语音控制智能家居时,智能家居对用户语音进行识别,生成对应的查询语句发送给服务器,但是由于不同的用户需求不同,比如对同一事物的说法不同,服务器部署的语义引擎可能不能满足用户的所有需求,容易出现对用户查询语句未能解析或不支持的情况,导致不能为用户提供准确的反馈结果,或者语义引擎虽然解析了查询语句,但是对该查询语句没有对应的业务支持,因此不能为用户提供准确的反馈结果。

针对相关技术存在的上述问题,发明人进行了创造性的研究,在研究中发现,对于语义引擎未能解析或不支持的查询语句,以及语义引擎反馈结果不满足用户需求的查询语句,均被记录在用户日志中,可以称为异常的查询语句,基于此,发明人进一步研究发现,这些异常的查询语句中,往往隐含有用户的新需求,可能涉及新的领域、新的意图、新的说法等,比如特定人群的需求、新潮的东西、事物的一些新说法等,正是由于这些新的需求,语义引擎不能解析或不支持,或者不能很好地反馈。发明人创造性地想到,可以对用户日志中这些异常的查询语句进行深入挖掘,从而能挖掘出大量新需求,基于新需求对语义引擎进行优化,使得语义引擎支持新需求的业务定位以及对新需求能够具有相应的业务支持能力,准确地为用户反馈结果。因此,本申请实施例提供了一种用户日志的处理方法,基于用户日志中异常的查询语句挖掘新需求,对语义引擎进行优化,提高语义引擎响应用户的准确性。

如图1所示,为本申请实施例基于的处理系统的架构示意图。该处理系统可以包括服务器和至少一个智能终端。该智能终端可以是智能家居设备,比如显示设备、智能电视、智能音箱等等,也可以是任意的其他用户终端,比如移动终端、平板电脑、计算机、笔记本电脑等。用户通过智能终端向服务器发送服务请求,该服务请求包括用户的查询语句,在实际应用中,智能终端可以是将用户语音转换成文本格式的查询语句发送给服务器,也可以是直接将用户语音发送给服务器,由服务器进行语音识别,获得用户的查询语句,具体可以根据实际需求设置,语义引擎在根据该查询语句进行业务处理过程中会生成相应的用户日志,记录用户的行为数据以及响应情况。比如通过槽位字段记录用户的查询语句,通过反馈结果字段记录对用户查询语句的反馈结果,等等。服务器则可以基于用户日志解析出异常的查询语句,用于新需求的挖掘,从而基于新需求优化语义引擎,使得语义引擎支持更多新需求的业务定位以及使得语义引擎具备对这些新需求的业务服务能力,从而更加准确地为用户提供业务服务。

在一些实施例中,基于异常的查询语句进行新需求挖掘的具体操作可以是在显示设备中执行,显示设备可以从存储用户日志的服务器获取用户日志,基于用户日志中的异常的查询语句确定新需求,基于确定的新需求对显示设备的当前语义引擎进行优化,以使语义引擎支持新需求的业务定位以及支持对新需求的业务处理,执行操作的具体方式与上相同或相似,在此不再赘述。

在一些实施例中,显示设备还与服务器通过多种通信方式进行数据通信,可允许智能终端通过局域网(LAN)、无线局域网(WLAN)和其他网络进行通信连接。服务器可以向智能终端提供各种内容和互动。示例的,智能终端通过发送和接收信息,以及电子节目指南(EPG)互动,接收软件程序更新,或访问远程储存的数字媒体库。

显示设备可以是液晶显示器、OLED显示器、投影显示设备。具体显示设备类型,尺寸大小和分辨率等不作限定,本领技术人员可以理解的是,显示设备可以根据需要做性能和配置上一些改变。

显示设备除了提供广播接收电视功能之外,还可以附加提供计算机支持功能的智能网络电视功能,包括但不限于,网络电视、智能电视、互联网协议电视(IPTV)等。

在一些实施例中,服务器可以是一个服务器也可以是一个服务器集群,还可以是多个服务器集群,可以包括一类或多类服务器。比如用户日志存储在服务器集群中的第一服务器中,响应用户服务请求的是第二服务器,对用户日志进行处理的是第三服务器。

在一些实施例中,可以定时对最新产生的用户日志进行如上挖掘及优化,不断提高语义引擎的业务服务能力,改善或解决相关技术容易出现语义引擎对用户的查询语句未能解析或不支持,或者反馈结果不满足用户需求等情况,从而不能准确为用户提供服务,导致用户体验较差的问题。

下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。

本申请一实施例提供一种用户日志的处理装置,用于对用户日志进行处理。

如图2所示,为本实施例提供的一种用户日志的处理装置的结构示意图。该用户日志的处理装置包括:处理器11。

该处理器11被配置为:

获取用户日志,并确定所述用户日志中的第一查询语句,所述第一查询语句为通过语义引擎解析用户查询语句的整个生命周期确定异常的查询语句,和/或所述语义引擎反馈结果异常的查询语句;基于所述第一查询语句,确定新需求;基于所述新需求,对当前语义引擎进行优化,以使所述语义引擎支持所述新需求的业务定位以及对所述新需求的业务处理。

用户日志的处理装置可以是应用于服务器中,也可以是应用于显示设备中。用户日志可以是从存储用户日志的存储区域获取。在一些实施例中,服务器可以是分布式服务器集群。比如用户日志存储在服务器集群中的第一服务器中,响应用户服务请求的是服务器集群中的第二服务器。用户日志的处理装置从存储用户日志的第一服务器获取用户日志。

在获取到用户日志后,可以确定用户日志中的第一查询语句,第一查询语句为通过语义引擎解析用户查询语句的整个生命周期确定异常的查询语句,和/或所述语义引擎反馈结果异常的查询语句。

在一些实施例中,可以对用户日志进行解析提取其中的异常的查询语句,为了区分可以称为目标查询语句,比如可以通过领域、意图、垂域解析槽位字段获得用户日志中的语义引擎未能解析或不支持的查询语句(可以称为第二查询语句)作为目标查询语句;比如可以通过语义引擎最终反馈结果字段获得用户日志中反馈结果不满足用户需求的查询语句(可以称为第三查询语句)作为目标查询语句。还可以是获得第二查询语句和第三查询语句作为目标查询语句,具体可以根据实际需求设置。

在获得目标查询语句后,目标查询语句往往存在重复的查询语句,需要对目标查询语句进行去重,获得不重复的查询语句,作为第一查询语句。

在一些实施例中,在对目标查询语句进行去重前,还需要对目标查询语句中重复的查询语句进行统计,确定相同的查询语句的出现次数。

示例性的,目标查询语句包括10条查询语句,其中有3条查询语句A, 4条查询语句B和3条查询语句C,则去重后剩余3条查询语句:查询语句A,查询语句B和查询语句C。即去重后获得3条第一查询语句,其中,查询语句A对应的出现次数为3,查询语句B对应的出现次数为4,查询语句C对应的出现次数为3。

在获得第一查询语句后,则可以基于第一查询语句,确定新需求。

在一些实施例中,可以通过对第一查询语句进行聚类,基于聚类结果来确定新需求。

在一些实施例中,还可以基于聚类结果结合各第一查询语句的出现次数来确定新需求。

在一些实施例中,还可以基于聚类结果结合对各聚类的关键词提取来确定新需求。

在挖掘出新需求后,则可以基于新需求,对当前语义引擎进行优化,以使语义引擎支持新需求的业务定位以及对新需求的业务处理。

示例性的,新需求为已有意图A下的新说法“B市预报”,已有说法是“B市天气预报”,那么可以将该新说法增加至该已有意图A下的说法中,并对基于该新说法对语义引擎进行优化,使得语义引擎再解析到该新说法时,能够理解用户的需求,给用户准确的反馈结果。比如用户查询语句为,我想知道B市预报,语义引擎可以理解用户需求是要知道B市的天气预报,则可以搜索B市的天气预报反馈给用户进行收听。

在一些实施例中,对于语义引擎的优化,可以是根据新需求的具体类型来进行,比如新需求为新领域,语义引擎的现有领域不支持,因此,需要对语义引擎增加对新领域的相关说法的业务支持,还可以增加该新领域下的不同意图的业务支持。比如新需求只是已有领域的一种新意图,则需要对语义引擎增加对该新意图相关说法的业务支持。比如新领域只是一种新说法(即已有领域下的已有意图下的一种新说法),只是当前语义引擎现有业务不支持该新说法,则需要对语义引擎添加对该新说法的业务支持,等等。具体优化方式可以根据实际需求设置,本实施例不做限定。

如图3所示,为本实施例提供的另一种用户日志的处理装置的结构示意图。

在一些实施例中,用户日志的处理装置还可以包括存储器12。存储器12 存储计算机执行指令,处理器11读取存储器存储的计算机执行指令,执行本申请各实施例中相应的操作。

本实施例提供的用户日志的处理装置,通过基于用户日志中异常的查询语句确定新需求,并基于新需求对语义引擎进行优化,使得语义引擎能够支持新需求的业务定位以及能够支持对新需求进行相应的业务处理,提高语义引擎的业务能力,从而准确地为用户反馈结果,解决相关技术容易出现语义引擎对用户的查询语句未能解析或不支持,或者反馈结果不满足用户需求等情况,从而不能准确为用户提供服务,导致用户体验较差的问题。

在一些实施例中,处理器还被配置为:确定各第一查询语句对应的出现次数;相应地,处理器具体被配置为:对所述第一查询语句进行聚类,获得各聚簇包括的第一查询语句;针对每个聚簇,根据该聚簇内各第一查询语句及各第一查询语句对应的出现次数,确定该聚簇对应的需求名称;基于各聚簇对应的需求名称,确定新需求。

各第一查询语句对应的出现次数可以是在对目标查询语句进行去重前,对目标查询语句中重复的查询语句进行统计获得的。比如,目标查询语句包括10条查询语句,其中有3条查询语句A,4条查询语句B和3条查询语句C,则去重后剩余3条查询语句:查询语句A,查询语句B和查询语句 C。即去重后获得3条第一查询语句,其中,查询语句A对应的出现次数为3,查询语句B对应的出现次数为4,查询语句C对应的出现次数为3。

在获得第一查询语句后,可以采用预设的聚类算法对第一查询语句进行聚类,获得至少一个聚簇,并可以获得每个聚簇包括的第一查询语句。

预设的聚类算法可以采用任意可实施的聚类算法,比如Mean Shift算法、 K-Means算法等,具体可以根据实际需求设置。

在聚类后,可以针对每个聚簇,根据该聚簇包括的各第一查询语句以及各第一查询语句对应的出现次数来确定该聚簇对应的需求名称。

在一些实施例中,可以基于各第一查询语句对应的出现次数对各第一查询语句进行排序,获得出现次数最多的第一查询语句,将该出现次数最多的第一查询语句作为该聚簇对应的需求名称,或者从该出现次数最多的第一查询语句中提取关键词作为该聚簇对应的需求名称。

在一些实施例中,还可以获得出现次数排名靠前的预设数量的第一查询语句,对这些第一查询语句进行分词、筛选,提取关键词,来确定该聚簇对应的需求名称。具体可以根据实际需求设置。

在一些实施例中,还可以是将各第一查询语句的出现次数与其他因素结合来确定聚簇的需求名称。比如,基于该聚簇中的各第一查询语句提取该聚簇对应的一个或多个关键词,结合该聚簇中出现次数最多的第一查询语句以及该聚簇对应的一个或多个关键词共同来确定该聚簇对应的需求名称。还可以结合聚簇中心的第一查询语句来确定该聚簇的需求名称。具体可以根据实际需求设置。

在获得各聚簇对应的需求名称后,则可以基于各聚簇的需求名称,挖掘新需求,比如可以基于需求名称与已有需求进行匹配,根据匹配结果来判断该需求名称是否为新需求。

对于每个新需求,该新需求可以对应为新领域、新意图或新说法。

可选地,还可以是结合人工来确定新需求。

在确定新需求后,可以基于新需求对当前的语义引擎进行优化,以使语义引擎支持新需求的业务定位以及能够准确对新需求进行相应的业务处理。

本实施例提供的用户日志的处理装置,通过对用户日志中异常的查询语句进行聚类,并基于聚类获得的各聚簇内的查询语句及对应的出现次数来确定聚类对应的需求名称,基于各聚簇的需求名称确定新需求,并基于新需求对语义引擎进行优化,使得语义引擎能够支持新需求的业务定位以及能够对新需求进行相应的业务处理,提高语义引擎的业务能力,从而准确地为用户反馈结果,解决相关技术容易出现语义引擎对用户的查询语句未能解析或不支持,或者反馈结果不满足用户需求等情况,从而不能准确为用户提供服务,导致用户体验较差的问题。

在一些实施例中,处理器具体被配置为:

获取用户日志中的目标查询语句;对目标查询语句进行预处理,获得第一查询语句及各第一查询语句对应的出现次数,各第一查询语句之间不重复。

具体的,可以对用户日志进行解析提取其中的异常的查询语句,作为目标查询语句,比如可以通过领域、意图、垂域解析槽位字段获得用户日志中的语义引擎未能解析或不支持的查询语句(可以称为第二查询语句)作为目标查询语句;比如可以通过语义引擎最终反馈结果字段获得用户日志中反馈结果不满足用户需求的查询语句(可以称为第三查询语句)作为目标查询语句。还可以是获得第二查询语句和第三查询语句作为目标查询语句,具体可以根据实际需求设置。

在获得目标查询语句后,可以对目标查询语句进行预处理,获得第一查询语句及各第一查询语句对应的出现次数。预处理具体包括相同的查询语句的出现次数统计以及去重处理。最终获得的各第一查询语句相互之间不重复。

在一些实施例中,处理器具体被配置为:

根据预设提取规则,从用户日志中提取语义引擎未能解析或不支持的第二查询语句和/或语义引擎反馈结果不满足用户需求的第三查询语句;将第二查询语句和/或第三查询语句作为目标查询语句。

具体的,可以通过领域、意图、垂域解析槽位字段获得用户日志中的语义引擎未能解析或不支持的查询语句作为第二查询语句;可以通过语义引擎最终反馈结果字段获得用户日志中反馈结果不满足用户需求的查询语句作为第三查询语句。比如反馈结果为“对不起,我没有理解您的话”。

在一些实施例中,处理器具体被配置为:

对目标查询语句进行统计,获得相同的目标查询语句出现次数;对目标查询语句进行去重,获得不重复的目标查询语句作为第一查询语句。

在一些实施例中,处理器具体被配置为:

根据预设生成规则,生成各第一查询语句对应的句子向量;基于预设聚类算法及各第一查询语句对应的句子向量,对第一查询语句进行聚类,获得各聚簇包括的第一查询语句。

在一些实施例中,预设生成规则可以是BERT模型,具体可以是通过 bert-as-service使用BERT模型,也可以是其他可以实施的方式,本实施例不做限定。bert-as-service是开源的BERT服务,它让用户可以以调用服务的方式使用BERT模型而不需要关注BERT的实现细节。bert-as-service分为客户端和服务端,用户可以从python代码中调用服务,也可以通过http 的方式访问。

在生成各第一查询语句对应的句子向量后,则基于预设聚类算法及各第一查询语句对应的句子向量,对第一查询语句进行聚类,获得各聚簇包括的第一查询语句。具体来说基于各句子向量在空间中的距离对第一查询语句进行聚类。

在一些实施例中,预设聚类算法可以是相关技术中任意可实施的聚类算法,比如Mean Shift算法、K-Means算法等。

在一些实施例中,处理器还被配置为:根据各聚簇包括的第一查询语句,确定各聚簇对应的第一关键词;

处理器具体被配置为:针对每个聚簇,根据聚簇出现次数最多的第一查询语句及聚簇对应的第一关键词,确定聚簇对应的需求名称。

具体来说,对于每个聚簇对应的需求名称可以结合该聚簇中出现次数最多的第一查询语句以及为该聚簇提取的关键词(为了区分称为第一关键词) 两种因素来确定。第一关键词可以是一个或多个。具体来说可以是将出现次数最多的第一查询语句和第一关键词中重复次数最多的词作为该聚簇对应的需求名称。比如出现次数最多的第一查询语句为“我想看张三的电影”,为聚簇提取的关键词包括“电影”,则该聚簇对应的需求名称可以为“电影”。

在一些实施例中,处理器具体被配置为:

针对每个聚簇,对聚簇所包括的各第一查询语句进行分词,并根据预设筛选规则进行筛选处理,获得聚簇对应的一组词;根据聚簇对应的一组词,采用第一关键词提取算法提取聚簇对应的第一关键词。

在一些实施例中,分词可以采用任意可实施的分词算法,比如结巴(j ieba) 分词,在进行分词时会获得每个词的词性,可以预先设置筛选规则,对分词获得的结果进行筛选,筛选规则可以包括词性筛选规则、停用词筛选规则、去语义化规则等,词性筛选比如筛掉形容词、副词、特定名词等,停用词筛选可以基于通用的停用词库、不同领域的专属停用词库、以及自定义的停用词。比如“啊”、“哦”、“嗯”等。去语义化可以是基于已有的标签系统,将某些词替换为相应标签,比如某动画片A,其标签是动画片,则可以将其替换为“动画片”,具体筛选规则可以根据实际需求设置。

在一些实施例中,第一关键词提取算法可以是TF-IDF算法,TF-IDF(TermFrequency–Inverse Document Frequency)是一种用于信息检索与数据挖掘的加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse DocumentFrequency)。TF表示某个词在文章中的出现频率,本申请中表示某个词在分词结果所得的所有词中出现的频率。

示例性的,某聚簇对应的一组词包括的总词数为100,其中,词A出现了5词,则词A的词频TF

词A的IDF

采用第一关键词提取算法提取的第一关键词,可以是根据获得的各关键词的权重及第一权重阈值,选择权重大于第一权重阈值的关键词作为第一关键词。

在一些实施例中,处理器还被配置为:采用第二关键词提取算法,确定聚簇对应的一组词中的第二关键词;基于各第二关键词及聚簇对应的第一关键词,确定聚簇对应的主题词;处理器具体被配置为:针对每个聚簇,根据聚簇出现次数最多的第一查询语句及聚簇对应的主题词,确定聚簇对应的需求名称。

具体的,针对每个聚簇,还可以采用第二关键词提取算法,确定该聚簇对应的一组词中的第二关键词,结合第一关键词和第二关键词来确定该聚簇对应的主题词,具体来说,采用第二关键词提取算法可以获得一批关键词及其对应的权重,可以根据各关键词的权重,从中选择权重大于第二权重阈值的关键词作为第二关键词。将第一关键词和第二关键词中重复的关键词作为该聚簇对应的主题词。从而可以结合出现次数最多的第一查询语句与主题词来确定该聚簇的需求名称,提高确定的需求名称的准确性。

在一些实施例中,第二关键词提取算法可以为TextRank算法,也可以是任意其他可以获得权重的算法。TextRank算法是可以脱离语料库的背景,仅对单篇文档进行分析就可以提取该文档的关键词的算法。其具体原理为现有技术,在此不再赘述。

在一些实施例中,处理器还被配置为:获取各聚簇的簇中心的第一查询语句;

处理器具体被配置为:针对每个聚簇,根据聚簇出现次数最多的第一查询语句、聚簇对应的主题词,以及聚簇的簇中心的第一查询语句,确定聚簇对应的需求名称。

具体的,对于每个聚簇,还可以结合簇中心的第一查询语句、出现次数最多的第一查询语句以及该聚簇对应的主题词共同确定该聚簇对应的需求名称,进一步提高确定的需求名称的准确性。

在进行聚类时可以获得聚簇中心的第一查询语句,即可以基于各第一查询语句对应的句子向量与聚簇中心的距离来确定。距离可以是欧式距离或其他用于表示句子向量之间距离的方式,具体可以根据实际聚类算法的需求设置。

在一些实施例中,处理器具体被配置为:

针对每个聚簇,将该聚簇出现次数最多的第一查询语句、该聚簇对应的主题词及该聚簇的簇中心的第一查询语句中重复次数最多的词,作为该聚簇对应的需求名称。

示例性的,某聚簇出现最多的第一查询语句为“明天天气怎么样”、簇中心的第一查询语句为“我想知道明天的天气”,该聚簇对应的主题词为“天气”、“明天”。则可以确定“天气”为该聚簇对应的需求名称。

在一些实施例中,处理器具体被配置为:

从用户日志获取各需求名称对应的当前得分;基于各需求名称对应的当前得分,确定各需求名称是否为新需求。

具体的,语义引擎在业务定位过程中,都会对查询语句进行打分,即当前属于某个领域某个意图的概率,在确定各聚簇对应的需求名称后,可以基于需求名称所涉及的第一查询语句对应的当前得分来确定该需求名称对应的当前得分。若该需求名称的当前得分低于阈值,则可以认为当前对该需求的业务定位是错误的,确定该需求为新需求。

在一些实施例中,在确定了各新需求后,还可以将各新需求输出到相应负责人员的终端,展示给该负责人员,以使该负责人员进一步确认是否确实为新需求。若确实为新需求,该负责人员则可以自己或通知其他相关人员基于该新需求对当前语义引擎进行优化。

在一些实施例中,处理器具体被配置为:

根据新需求,对已有需求进行扩充;对于每个新需求,根据该新需求的类型,对当前语义引擎进行与该新需求类型对应的优化,以使语义引擎支持新需求的业务定位以及对新需求的业务处理。

在一些实施例中,处理器具体被配置为:

针对每个新需求,若新需求为新领域,则扩充新的领域;若新需求为已有领域下的新意图,则在该已有领域下扩充新的意图;若新需求为已有意图下的新说法,则在该已有意图下扩充新的说法。

具体的,对于语义引擎的优化,可以是根据新需求的具体类型来进行,比如新需求为新领域,语义引擎的现有领域不支持,因此,需要扩充新领域,并对语义引擎增加对该新领域的业务支持。比如新需求只是已有领域的一种新意图,则需要在该已有领域扩充该新意图,并对语义引擎增加对该新意图相关的业务支持。比如新领域只是已有意图下的一种新说法,只是当前语义引擎现有业务不支持,则需要对该已有意图扩充该新说法,并对语义引擎添加对该新说法的业务支持。

在一些实施例中,该用户日志的处理装置应用于服务器中。

在一些实施例中,该用户日志的处理装置应用于显示设备中,该显示设备还可以包括显示器,显示器可以用于呈现确定的新需求。

在一些实施例中,显示器还可以用于呈现各聚簇的相关信息,比如聚簇标识、聚簇名、聚簇大小、聚簇内出现次数排名的查询语句及其查询次数,等等。

在一示例性的实施例中,如图4所示,为本实施例提供的一种用户日志的处理装置的示例性框图,该用户日志的处理装置20可以应用于服务器,也可以应用于显示设备。

用户日志的处理装置20可以包括以下一个或多个组件:处理组件21,存储器22,电源组件23,通信组件24,等等。

处理组件21通常控制用户日志的处理装置20的整体操作。处理组件21 可以包括一个或多个处理器25来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件21可以包括一个或多个模块,便于处理组件21和其他组件之间的交互。

存储器22被配置为存储各种类型的数据以支持在用户日志的处理装置 20的操作。这些数据的示例包括用于在用户日志的处理装置20上操作的任何应用程序或方法的指令。存储器22可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件23为用户日志的处理装置20的各种组件提供电力。电源组件 23可以包括电源管理系统,一个或多个电源,及其他与为用户日志的处理装置20生成、管理和分配电力相关联的组件。

通信组件24被配置为便于用户日志的处理装置20和其他设备之间有线或无线方式的通信。

在示例性实施例中,用户日志的处理装置20可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器22,上述指令可由用户日志的处理装置20的处理器25执行以完成上述方法。例如,非临时性计算机可读存储介质可以是 ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

如图5所示,为本实施例提供的显示设备200的硬件配置框图。

在一些实施例中,显示设备200中包括控制器250、调谐解调器210、通信器220、检测器230、输入/输出接口255、显示器275,音频输出接口 285、存储器260、供电电源290、用户接口265、外部装置接口240中的至少一种。

在一些实施例中,显示器275,用于接收源自第一处理器输出的图像信号,进行显示视频内容和图像以及菜单操控界面的组件。

在一些实施例中,显示器275,包括用于呈现画面的显示屏组件,以及驱动图像显示的驱动组件。

在一些实施例中,显示视频内容,可以来自广播电视内容,也可以是说,可通过有线或无线通信协议接收的各种广播信号。或者,可显示来自网络通信协议接收来自网络服务器端发送的各种图像内容。

在一些实施例中,显示器275用于呈现显示设备200中产生且用于控制显示设备200的用户操控UI界面。

在一些实施例中,根据显示器275类型不同,还包括用于驱动显示的驱动组件。

在一些实施例中,显示器275为一种投影显示器,还可以包括一种投影装置和投影屏幕。

在一些实施例中,通信器220是用于根据各种通信协议类型与外部设备或外部服务器进行通信的组件。例如:通信器可以包括Wifi芯片,蓝牙通信协议芯片,有线以太网通信协议芯片等其他网络通信协议芯片或近场通信协议芯片,以及红外接收器中的至少一种。

在一些实施例中,显示设备200可以通过通信器220与外部控制设备1001 或内容提供设备之间建立控制信号和数据信号发送和接收。

在一些实施例中,用户接口265,可用于接收控制装置1001(如:红外遥控器等)红外控制信号。

在一些实施例中,检测器230是显示设备200用于采集外部环境或与外部交互的信号。

在一些实施例中,检测器230包括光接收器,用于采集环境光线强度的传感器,可以通过采集环境光可以自适应性显示参数变化等。

在一些实施例中,检测器230中的图像采集器232,如相机、摄像头等,可以用于采集外部环境场景,以及用于采集用户的属性或与用户交互手势,可以自适应变化显示参数,也可以识别用户手势,以实现与用户之间互动的功能。

在一些实施例中,检测器230还可以包括温度传感器等,如通过感测环境温度。

在一些实施例中,显示设备200可自适应调整图像的显示色温。如当温度偏高的环境时,可调整显示设备200显示图像色温偏冷色调,或当温度偏低的环境时,可以调整显示设备200显示图像偏暖色调。

在一些实施例中,检测器230还可以包括声音采集器231等,如麦克风,可以用于采集语音数据,当用户通过语音方式说出指令时,麦克风能够采集到包括用户说出的指令的语音数据。示例性的,声音采集器231可以采集包括用户控制显示设备200的控制指令的语音信号,或采集环境声音,用于识别环境场景类型,使得显示设备200可以自适应适应环境噪声。

在一些实施例中,如图5所示,输入/输出接口255被配置为,可进行控制器250与外部其他设备或其他控制器250之间的数据传输。如接收外部设备的视频信号数据和音频信号数据、或命令指令数据等。

在一些实施例中,外部装置接口240可以包括,但不限于如下:可以高清多媒体接口HDMI接口、模拟或数据高清分量输入接口、复合视频输入接口、 USB输入接口、RGB端口等任一个或多个接口。也可以是上述多个接口形成复合性的输入/输出接口。

在一些实施例中,如图5所示,调谐解调器210被配置为,通过有线或无线接收方式接收广播电视信号,可以进行放大、混频和谐振等调制解调处理,从多多个无线或有线广播电视信号中解调出音视频信号,该音视频信号可以包括用户所选择电视频道频率中所携带的电视音视频信号,以及EPG数据信号。

在一些实施例中,调谐解调器210解调的频点受到控制器250的控制,控制器250可根据用户选择发出控制信号,以使的调制解调器响应用户选择的电视信号频率以及调制解调该频率所携带的电视信号。

在一些实施例中,广播电视信号可根据电视信号广播制式不同区分为地面广播信号、有线广播信号、卫星广播信号或互联网广播信号等。或者根据调制类型不同可以区分为数字调制信号,模拟调制信号等。或者根据信号种类不同区分为数字信号、模拟信号等。

在一些实施例中,控制器250和调谐解调器210可以位于不同的分体设备中,即调谐解调器210也可在控制器250所在的主体设备的外置设备中,如外置机顶盒等。这样,机顶盒将接收到的广播电视信号调制解调后的电视音视频信号输出给主体设备,主体设备经过第一输入/输出接口接收音视频信号。

在一些实施例中,控制器250,通过存储在存储器上中各种软件控制程序,来控制显示设备的工作和响应用户的操作。控制器250可以控制显示设备200的整体操作。例如:响应于接收到用于选择在显示器275上显示UI 对象的用户命令,控制器250便可以执行与由用户命令选择的对象有关的操作。

在一些实施例中,所述对象可以是可选对象中的任何一个,例如超链接或图标。与所选择的对象有关操作,例如:显示连接到超链接页面、文档、图像等操作,或者执行与所述图标相对应程序的操作。用于选择UI对象用户命令,可以是通过连接到显示设备200的各种输入装置(例如,鼠标、键盘、触摸板等)输入命令或者与由用户说出语音相对应的语音命令。

如图5所示,控制器250包括随机存取存储器251(Random Access Memory, RAM)、只读存储器252(Read-Only Memory,ROM)、视频处理器270、音频处理器280、其他处理器253(例如:图形处理器(Graphics Processing Unit, GPU)、中央处理器254(CentralProcessing Unit,CPU)、通信接口 (Communication Interface),以及通信总线256(Bus)中的至少一种。其中,通信总线连接各个部件。

在一些实施例中,RAM 251用于存储操作系统或其他正在运行中的程序的临时数据

在一些实施例中,ROM 252用于存储各种系统启动的指令。

在一些实施例中,ROM 252用于存储一个基本输入输出系统,称为基本输入输出系统(Basic Input Output System,BIOS)。用于完成对系统的加电自检、系统中各功能模块的初始化、系统的基本输入/输出的驱动程序及引导操作系统。

在一些实施例中,在收到开机信号时,显示设备200电源开始启动,CPU 运行ROM252中系统启动指令,将存储在存储器的操作系统的临时数据拷贝至RAM 251中,以便于启动或运行操作系统。当操作系统启动完成后,CPU 再将存储器中各种应用程序的临时数据拷贝至RAM 251中,然后,以便于启动或运行各种应用程序。

在一些实施例中,CPU处理器254,用于执行存储在存储器中操作系统和应用程序指令。以及根据接收外部输入的各种交互指令,来执行各种应用程序、数据和内容,以便最终显示和播放各种音视频内容。

在一些示例性实施例中,CPU处理器254,可以包括多个处理器。多个处理器可包括一个主处理器以及一个或多个子处理器。主处理器,用于在预加电模式中执行显示设备200一些操作,和/或在正常模式下显示画面的操作。一个或多个子处理器,用于在待机模式等状态下一种操作。

在一些实施例中,图形处理器253,用于产生各种图形对象,如:图标、操作菜单、以及用户输入指令显示图形等。包括运算器,通过接收用户输入各种交互指令进行运算,根据显示属性显示各种对象。以及包括渲染器,对基于运算器得到的各种对象,进行渲染,上述渲染后的对象用于显示在显示器上。

在一些实施例中,视频处理器270被配置为将接收外部视频信号,根据输入信号的标准编解码协议,进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等等视频处理,可得到直接可显示设备200上显示或播放的信号。

在一些实施例中,视频处理器270,包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等。

其中,解复用模块,用于对输入音视频数据流进行解复用处理,如输入 MPEG-2,则解复用模块进行解复用成视频信号和音频信号等。

视频解码模块,则用于对解复用后的视频信号进行处理,包括解码和缩放处理等。

图像合成模块,如图像合成器,其用于将图形生成器根据用户输入或自身生成的GUI信号,与缩放处理后视频图像进行叠加混合处理,以生成可供显示的图像信号。

帧率转换模块,用于对转换输入视频帧率,如将60Hz帧率转换为120Hz 帧率或240Hz帧率,通常的格式采用如插帧方式实现。

显示格式化模块,则用于将接收帧率转换后视频输出信号,改变信号以符合显示格式的信号,如输出RGB数据信号。

在一些实施例中,图形处理器253可以和视频处理器可以集成设置,也可以分开设置,集成设置的时候可以执行输出给显示器的图形信号的处理,分离设置的时候可以分别执行不同的功能,例如GPU+FRC(Frame Rate Conversion))架构。

在一些实施例中,音频处理器280,用于接收外部的音频信号,根据输入信号的标准编解码协议,进行解压缩和解码,以及降噪、数模转换、和放大处理等处理,得到可以在扬声器中播放的声音信号。

在一些实施例中,视频处理器270可以包括一颗或多颗芯片组成。音频处理器,也可以包括一颗或多颗芯片组成。

在一些实施例中,视频处理器270和音频处理器280,可以单独的芯片,也可以于控制器一起集成在一颗或多颗芯片中。

在一些实施例中,音频输出,在控制器250的控制下接收音频处理器280 输出的声音信号,如:扬声器286,以及除了显示设备200自身携带的扬声器之外,可以输出至外接设备的发生装置的外接音响输出端子,如:外接音响接口或耳机接口等,还可以包括通信接口中的近距离通信模块,例如:用于进行蓝牙扬声器声音输出的蓝牙模块。

供电电源290,在控制器250控制下,将外部电源输入的电力为显示设备200提供电源供电支持。供电电源290可以包括安装显示设备200内部的内置电源电路,也可以是安装在显示设备200外部电源,在显示设备200中提供外接电源的电源接口。

用户接口265,用于接收用户的输入信号,然后,将接收用户输入信号发送给控制器250。用户输入信号可以是通过红外接收器接收的遥控器信号,可以通过网络通信模块接收各种用户控制信号。

在一些实施例中,用户通过控制装置1001或移动终端输入用户命令,用户输入接口则根据用户的输入,显示设备200则通过控制器250响应用户的输入。

在一些实施例中,用户可在显示器275上显示的图形用户界面(GUI)输入用户命令,则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者,用户可通过输入特定的声音或手势进行输入用户命令,则用户输入接口通过传感器识别出声音或手势,来接收用户输入命令。

在一些实施例中,“用户界面”,是应用程序或操作系统与用户之间进行交互和信息交换的介质接口,它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface,GUI),是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素,其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。

存储器260,包括存储用于驱动显示设备200的各种软件模块。如:第一存储器中存储的各种软件模块,包括:基础模块、检测模块、通信模块、显示控制模块、浏览器模块、和各种服务模块等中的至少一种。

基础模块用于显示设备200中各个硬件之间信号通信、并向上层模块发送处理和控制信号的底层软件模块。检测模块用于从各种传感器或用户输入接口中收集各种信息,并进行数模转换以及分析管理的管理模块。

例如,语音识别模块中包括语音解析模块和语音指令数据库模块。显示控制模块用于控制显示器进行显示图像内容的模块,可以用于播放多媒体图像内容和UI界面等信息。通信模块,用于与外部设备之间进行控制和数据通信的模块。浏览器模块,用于执行浏览服务器之间数据通信的模块。服务模块,用于提供各种服务以及各类应用程序在内的模块。同时,存储器260还用存储接收外部数据和用户数据、各种用户界面中各个项目的图像以及焦点对象的视觉效果图等。

需要说明的是,上述各实施例可以单独实施,也可在不冲突的情况下以任意组合方式结合实施,本申请不做限定。

本申请另一实施例提供一种用户日志的处理方法,用于对用户日志进行处理。本实施例的执行主体为用户日志的处理装置,该用户日志的处理装置可以设置在服务器中,也可以设置在显示设备中。该方法具体包括:

获取用户日志,并确定所述用户日志中的第一查询语句,所述第一查询语句为通过语义引擎解析用户查询语句的整个生命周期确定异常的查询语句,和/或所述语义引擎反馈结果异常的查询语句;基于所述第一查询语句,确定新需求;基于所述新需求,对当前语义引擎进行优化,以使所述语义引擎支持所述新需求的业务定位以及对所述新需求的业务处理。

在此需要说明的是,本申请实施例提供的上述方法,能够实现上述装置实施例所实现的所有操作,且能够达到相同的技术效果,在此不再对本实施例中与装置实施例相同的部分及有益效果进行具体赘述。

在一示例性实施例中,如图6所示,为本实施例提供的基于第一查询语句确定新需求的流程示意图。

在获取用户日志后,该方法还包括确定各第一查询语句对应的出现次数。

相应地,基于第一查询语句确定新需求,具体可以包括:

步骤101,对第一查询语句进行聚类,获得各聚簇包括的第一查询语句。

步骤102,针对每个聚簇,根据该聚簇内各第一查询语句及各第一查询语句对应的出现次数,确定该聚簇对应的需求名称。

步骤103,基于各聚簇对应的需求名称,确定新需求。

在此需要说明的是,本申请实施例提供的上述方法,能够实现上述装置实施例所实现的所有操作,且能够达到相同的技术效果,在此不再对本实施例中与装置实施例相同的部分及有益效果进行具体赘述。

在一示例性实施例中,确定用户日志中的第一查询语句及出现次数,具体包括:

获取用户日志中的目标查询语句;对目标查询语句进行预处理,获得第一查询语句及各第一查询语句对应的出现次数。

其中,各第一查询语句之间不重复。

在一些实施例中,获取用户日志中的目标查询语句,包括:

根据预设提取规则,从用户日志中提取语义引擎未能解析或不支持的第二查询语句和/或语义引擎反馈结果不满足用户需求的第三查询语句;将第二查询语句和/或第三查询语句作为目标查询语句。

在一些实施例中,对目标查询语句进行预处理,获得第一查询语句及各第一查询语句对应的出现次数,包括:

对目标查询语句进行统计,获得相同的目标查询语句出现次数;对目标查询语句进行去重,获得不重复的目标查询语句作为第一查询语句。

在一些实施例中,还可以对目标查询语句进行去除停用词处理,去除目标查询语句中的停用词,比如“哦”、“啊”、“嗯”及其他停用词。

在一些实施例中,如图7所示,为本实施例提供的聚类的流程示意图。即对第一查询语句进行聚类,获得各聚簇包括的第一查询语句,具体包括:

步骤1011,根据预设生成规则,生成各第一查询语句对应的句子向量。

步骤1012,基于预设聚类算法及各第一查询语句对应的句子向量,对第一查询语句进行聚类,获得各聚簇包括的第一查询语句。

在一示例性实施例中,如图8所示,为本实施例提供确定聚簇对应的需求名称的流程示意图。即在获得了个聚簇包括的第一查询语句之后,该方法还包括:

步骤2011,根据各聚簇包括的第一查询语句,确定各聚簇对应的第一关键词。

相应地,针对每个聚簇,根据该聚簇内各第一查询语句及各第一查询语句对应的出现次数,确定该聚簇对应的需求名称,包括:

步骤1021,针对每个聚簇,根据聚簇出现次数最多的第一查询语句及聚簇对应的第一关键词,确定聚簇对应的需求名称。

在一些实施例中,根据各聚簇包括的第一查询语句,确定各聚簇对应的第一关键词,包括:

针对每个聚簇,对聚簇所包括的各第一查询语句进行分词,并根据预设筛选规则进行筛选处理,获得聚簇对应的一组词;根据聚簇对应的一组词,采用第一关键词提取算法提取聚簇对应的第一关键词。

在一些实施例中,针对每个聚簇,对聚簇所包括的各第一查询语句进行分词,并根据预设筛选规则进行筛选处理,获得聚簇对应的一组词之后,该方法还包括:

采用第二关键词提取算法,确定聚簇对应的一组词中的第二关键词;基于各第二关键词及聚簇对应的第一关键词,确定聚簇对应的主题词。

相应地,针对每个聚簇,根据聚簇出现次数最多的第一查询语句及聚簇对应的关键词,确定聚簇对应的需求名称,包括:

针对每个聚簇,根据聚簇出现次数最多的第一查询语句及聚簇对应的主题词,确定聚簇对应的需求名称。

在一些实施例中,针对每个聚簇,根据聚簇出现次数最多的第一查询语句及聚簇对应的主题词,确定聚簇对应的需求名称之前,该方法还包括:获取各聚簇的簇中心的第一查询语句。

相应地,针对每个聚簇,根据聚簇出现次数最多的第一查询语句及聚簇对应的主题词,确定聚簇对应的需求名称,包括:

针对每个聚簇,根据聚簇出现次数最多的第一查询语句、聚簇对应的主题词,以及聚簇的簇中心的第一查询语句,确定聚簇对应的需求名称。

在一些实施例中,针对每个聚簇,根据聚簇出现次数最多的第一查询语句、聚簇对应的主题词,以及聚簇的簇中心的第一查询语句,确定聚簇对应的需求名称,包括:

针对每个聚簇,将该聚簇出现次数最多的第一查询语句、该聚簇对应的主题词及该聚簇的簇中心的第一查询语句中重复次数最多的词,作为该聚簇对应的需求名称。

在一些实施例中,基于各聚簇对应的需求名称,确定新需求,包括:

从用户日志获取各需求名称对应的当前得分;基于各需求名称对应的当前得分,确定各需求名称是否为新需求。

在一些实施例中,在确定了各新需求后,还可以将各新需求输出到相应负责人员的终端,展示给该负责人员,以使该负责人员进一步确认是否确实为新需求。若确实为新需求,该负责人员则可以自己或通知其他相关人员基于该新需求对当前语义引擎进行优化。

在一些实施例中,基于新需求,对当前语义引擎进行优化,以使语义引擎支持新需求的业务定位以及对新需求的业务处理,包括:

根据新需求,对已有需求进行扩充;对于每个新需求,根据该新需求的类型,对当前语义引擎进行与该新需求类型对应的优化,以使语义引擎支持新需求的业务定位以及对新需求的业务处理。

在一些实施例中,根据新需求,对已有需求进行扩充,包括:

针对每个新需求,若新需求新领域,则扩充新的领域;若新需求为已有领域下的新意图,则在该已有领域下扩充新的意图;若新需求为已有意图下的新说法,则在该已有意图下扩充新的说法。

在一些实施例中,还可以输出聚类结果,比如输出聚簇中各第一查询语句及对应的出现次数。

示例性的,聚类的输出结果如下:

cluster_top_texts[('成语',210),('猜成语',14),('成语大全', 11),('四字成语',10),('成语斯',7),('我想听成语',7),('讲成语', 6),('有如的四字成语',6),('中国成语',5),('中华成语',5),('播放成语',5),('打开成语',4),('我想看成语',4),('成语花型',4),(' 有什么成语',4),('成语是',3),('来一首成语',3)]。

cluster_top_texts[('棋牌',45),('棋圣',6),('下下棋',6),(' 学象棋',6),('我要下棋',5),('象棋讲座',5),('下棋高手',4),(' 国际象棋是什么',4),('象棋的布局技巧',3),('象棋规则',3),('我要看象棋比赛',3),('看象棋比赛',3),('飞行棋怎么下',3),('上学象棋 ',3),('怎么下军棋',3),('象棋怎么',3),('到象棋',3),('怎样玩象棋',3)]。

在一些实施例中,还可以输出各聚簇对应的第一关键词或者主题词,还可以输出聚簇中出现次数最多的查询语句。具体可以根据实际需求设置。

示例性的,一种输出结果为:

cluster_top_texts[('手工折纸',186),('中国画',98),('架子手工',86),('折纸手工',50),('方块熊简笔画',46),('手工diy',31), ('手工课',26),('母亲节手抄报',23),('橡皮泥手工',20),('做起泡胶的方法',18),('自制起泡胶',17),('手工橡皮泥',16),('折纸王子 ',16),('学折纸',16),('艺术画',15),('怎样做起泡胶',14),('橡皮泥制作',14),('折纸青蛙',14),('做橡皮泥的',12),('彩泥手工', 11)]

"id":"手工",[cluster_tfidf_key,cluster_top1_texts]['折纸',' 手工','手工折纸']

cluster_top_texts[('打折',74),('优惠',58),('低价',38),(' 套餐',30),('促销',25),('价钱',20),('特价',20),('报价',15), ('查价',14),('实惠',12),('售价',10),('原价',9),('更多优惠', 8),('特卖',8),('现千元',5),('折扣',5),('单价',4)]

"id":"优惠",[cluster_tfidf_key,cluster_top1_texts]['优惠',' 降价','打折']

cluster_top_texts[('罚球',16),('罚球声',5),('跳投',5),(' 扣篮',4),('上篮',3),('五罚球',3)]

"id":"罚球",[cluster_tfidf_key,cluster_top1_texts]['罚球',' 跳投','罚球']

cluster_top_texts[('复韵母',24),('英语音标',11),('声母和韵母',8),('23个声母',6),('24个韵母',6),('笔画按',5),('六个单韵母',5),('提手旁的字有哪些',5),('火字旁的字有哪些',4),('26 个声母',4),('八音汉',4),('声母韵母整体认读表',3),('认识偏旁部首',3),('药字的多音字是谁',3)]

"id":"韵母",[cluster_tfidf_key,cluster_top1_texts]['声母',' 韵母','复韵母']

其中,cluster_tfidf_key,表示基于TF-IDF算法提取的关键词, cluster_top1_texts表示聚簇中出现次数最多的查询语句。

在一些实施例中,还可以以表格形式输出各聚簇的相关信息,如表1所示,表1只是示例性的说明,实际应用中,可以包括更多的聚簇。

表1

基于本申请实施例提供的用户日志的处理方法,可以从用户日志中挖掘出用户新的需求(比如用户以歌词搜歌曲的需求,且把歌词说错的情况,比如让我变成行星守护你||让我变成星星守护你——我要找到你),可以发现垂域未覆盖的说法,可以发现垂域解析错误,还可以完善标签体系,还可以发现数据库标签数据的缺失,发现一些热门影视音乐名的错误说法,还可以发现一些抖音热门主播,还可以发现一些特定人群需求(比如产后修复,孕期,育婴),还可以发现用户用简单日常英语做人机交互(比如yes,thank_you),还可以发现一些新潮的东西(比如起泡胶),等等。

通过定期对用户日志进行如上的新需求挖掘,能够为语义引擎进行文本解析和业务定位提供帮助,有助于提升语义解析能力,使语义引擎不断的迭代式成长,形成良性循环,实现对用户需求的快速响应,有效减少人力投入。

需要说明的是,上述各实施例可以单独实施,也可在不冲突的情况下以任意组合方式结合实施,本申请不做限定。

在此需要说明的是,本申请实施例提供的上述方法,能够实现上述装置实施例所实现的所有操作,且能够达到相同的技术效果,在此不再对本实施例中与装置实施例相同的部分及有益效果进行具体赘述。

本申请又一实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上任一实施例提供的方法。

需要说明的是,该计算机可读存储介质具有与上述实施例相同的有益效果,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

相关技术
  • 用户日志的处理装置及方法
  • 一种基于用户日志动态更新知识图谱的方法
技术分类

06120112156538