掌桥专利:专业的专利平台
掌桥专利
首页

意图识别方法、装置、设备和可读存储介质

文献发布时间:2023-06-19 11:16:08


意图识别方法、装置、设备和可读存储介质

技术领域

本申请涉及数据处理技术,尤其涉及数据挖掘技术领域。

背景技术

目前,品牌营销的重心已由粗放式流量运营逐步转向精细化运营,而精细化运营和精准有效营销得以实现的必要条件是对用户的深入理解,对意图的真实还原。

以消费意图为例,现有的消费意图识别的方法包括以下两种。第一种方法:通过消费者调研的方式,获取用户的真实意图。第二种方法:通过获取用户在电商平台的浏览、加购等行为数据,经转化漏斗等模型定义消费者在品牌接触的关键行为,进而反映用户对品牌或产品的意图。

上述第一种方法的缺陷在于:时间消耗多,时效性差,人为干预的因素较多,有效样本获取的成本高。上述第二种方法的缺陷在于:识别出用户意图时可能已经完成购买,使得后续营销效率提升效果不明显。

发明内容

本申请实施例提供了一种意图识别方法、装置、设备和可读存储介质,以快速、精准地识别某类人群的意图。

第一方面,本申请实施例提供了一种意图识别方法,包括:

获取多个用户的意图表达行为,并提取所述意图表达行为所关联的内容;

从所述内容中识别每个用户的意图特征;

根据所述意图特征对所述多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征。

本申请实施例通过获取多个用户的意图表达行为,进而提取其关联的内容,从内容中识别每个用户的意图特征,从而基于意图表达行为智能识别用户的意图特征;通过根据所述意图特征对所述多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征,从而基于特征聚类的方式,对多个用户进行群体划分,得到每个子群体的群体意图特征。本实施例提供的方法智能化程度高,耗时短,时效性高;而且,通过多个用户的意图表达行为最终得到群体意图特征,能够在用户实际行为之前识别用户意图,能够有效提高后续营销的效率。

可选的,从所述内容中识别每个用户的意图特征,包括:

获取预设行业内感兴趣的数据维度;

根据所述数据维度,从所述内容中识别每个用户的属性信息、扩展属性信息和关注点信息。

上述申请中的一种可选实施方式,能够有效地挖掘出有价值的数据,提高意图特征识别的准确性;本实施方式中的意图特征包括属性信息、扩展属性信息和关注点信息,从这3个维度全方面深度剖析用户的意图特征,使意图特征的表达更加准确和全面。

可选的,根据所述意图特征对所述多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征,包括:

根据所述意图特征,确定聚类指标;

根据所述聚类指标和聚类模型,对所述多个用户进行聚类,得到多个子群体;

对每个子群体中各用户的意图特征进行汇总,得到每个子群体的群体意图特征。

上述申请中的一种可选实施方式,通过聚类指标和聚类模型,无监督、自动地将多个用户划分为多个子群体,以形成具备明确意图特征、彼此具备一定区分度的子群体;通过对每个子群体中各用户的意图特征进行汇总,而不仅仅是聚类指标,充分考虑到子群体中所有的意图特征,使得抽象出的群体意图特征更加准确。

可选的,所述从所述内容中识别每个用户的意图特征,包括:

采用知识图谱技术对所述内容进行知识抽取,得到每个用户的意图特征,并生成对应的知识图谱;

所述对每个子群体中各用户的意图特征进行汇总,得到每个子群体的群体意图特征,包括:

获取每个子群体中各用户对应的知识图谱;

将所述各用户对应的知识图谱中的意图特征进行汇总,得到每个子群体的群体意图特征。

上述申请中的一种可选实施方式,通过知识图谱技术识别用户的意图特征,从而在汇总各用户的意图特征时,从知识图谱中直接提取即可。通过知识图谱的构建,可以自动化、高效率地实现意图特征的识别,并从多维度、全面地理解用户的真实意图;而且通过知识图谱可将用户的意图特征进行特征化归纳,以方便后续进一步应用。

可选的,所述根据所述意图特征,确定聚类指标,包括:

对所述意图特征进行显著性和/或相关性分析;

根据满足显著性要求和/或相关性要求的意图特征,确定聚类指标。

上述申请中的一种可选实施方式,通过显著性和/或相关性分析,提取有效的意图特征,将特征转化成可参与聚类模型构建的指标,有利于提高聚类模型的准确性,提高聚类的成功率,进而提高群体意图特征的准确性。

可选的,根据所述聚类指标和聚类模型,对所述多个用户进行聚类,得到多个子群体,包括:

将所述多个用户的聚类指标数据输入至所述聚类模型,得到所述聚类模型输出的多个子群体的信息;

其中,所述聚类模型用于构建N维空间,将每个用户的聚类指标数据抽象为N维空间中的点,并将N维空间中的点划分为互相接近的多个子群体,所述N为聚类指标的数量。

上述申请中的一种可选实施方式描述了聚类模型的聚类步骤。通过将每个用户的聚类指标数据抽象为N维空间中的点,并将N维空间中的点划分为互相接近的多个子群体,从而将多个用户划分为聚类指标接近的多个子群体,得到具有相似聚类指标的多个子群体。

可选的,在所述根据所述聚类指标和聚类模型,对所述多个用户进行聚类,得到多个子群体之前,还包括:

采用不同时间段的意图特征对所述聚类模型进行稳定性验证;和/或,

采用所述预设行业内多个品牌和多个产品对应的意图特征,对所述聚类模型进行可用性验证。

上述申请中的一种可选实施方式,通过对聚类模型进行稳定性和可用性验证,保证聚类模型整体具备高稳定性和高可用性。

可选的,在所述根据所述意图特征对所述多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征之后,还包括:

根据每个子群体的群体意图特征,对每个子群体进行业务描述。

上述申请中的一种可选实施方式,通过根据群体意图特征对每个子群体进行业务描述,将群体意图特征抽象为可读性强的描述内容,生动地刻画子群体的显著特征。

可选的,在所述根据每个子群体的群体意图特征,对每个子群体进行业务描述之后,还包括:

展示子群体配置界面;

响应于用户在所述子群体配置界面上的配置操作,确定子群体的信息;

根据所述子群体的信息,将待推广信息推送至所述子群体的设备;

其中,所述配置操作包括:行业选择操作、品牌选择操作、时间段选择操作、是否扩展用户来源操作中的至少一种,以及业务描述选择操作。

上述申请中的一种可选实施方式,用户可以通过子群体配置界面配置业务描述、行业选择操作、品牌选择操作、时间段选择操作、是否扩展用户来源等,从而个根据用户的配置操作得到合适的子群体,进而将待推广信息推送至所述子群体的设备,实现子群体的精准有效触达。

第二方面,本申请实施例还提供了一种意图识别装置,包括:

获取模块,用于获取多个用户的意图表达行为,并提取所述意图表达行为所关联的内容;

识别模块,用于从所述内容中识别每个用户的意图特征;

聚类模块,用于根据所述意图特征对所述多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征。

第三方面,本申请实施例还提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面实施例所提供的一种意图识别方法。

第四方面,本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面实施例所提供的一种意图识别方法。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案,不构成对本申请的限定。其中:

图1是本申请实施例一中的一种意图识别方法的流程图;

图2a是本申请实施例二中的一种意图识别方法的流程图;

图2b是本申请实施例二中的知识图谱的示意图;

图3a是本申请实施例三中的一种意图识别方法的流程图;

图3b是本申请实施例三中的子群体和业务描述内容的示意图;

图3c是本申请实施例三中的子群体配置界面的示意图;

图4是本申请实施例四中的一种意图识别装置的结构图;

图5是用来实现本申请实施例的意图识别方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

实施例一

图1是本申请实施例一中的一种意图识别方法的流程图,本申请实施例适用于在多个用户实际行为之前,将多个用户划分为具备意图区分度的多个子群体,并识别出各子群体的意图的情况,该方法通过意图识别装置执行,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图1所示的一种意图识别方法,包括:

S101、获取多个用户的意图表达行为,并提取意图表达行为所关联的内容。

用户的意图表达行为指用户实际行为之前,主动的、能够表明明确意图的行为,比如搜索、网站浏览、文章阅读、视频观看等。

然后,提取意图表达行为所关联的内容,比如,提取搜索的内容、文章主题、视频简介等内容,作为用户的意图表达内容。

可以理解的是,本实施例中的意图可以是消费意图、旅行意图、出行意图等等。

S102、从内容中识别每个用户的意图特征。

针对每个用户的意图表达行为,提取所关联的内容,进而从每个用户关联的内容中识别对应的意图特征。

可选地,获取预设行业内感兴趣的数据维度;根据数据维度,从内容中识别每个用户的属性信息、扩展属性信息和关注点信息。

具体地,调研预设行业内的相关从业人员在营销过程中感兴趣的数据维度,并基于从业者感兴趣的数据维度进行数据调研,梳理出数据可支持的数据维度,以此从内容中识别意图特征。

本实施方式中,意图特征包括属性信息、扩展属性信息和关注点信息。在一示例中,用户在百度搜索引擎中,搜索“宝马X5在SUV中算费油的么?”,从中识别出属性信息:行业-汽车,品牌-宝马,车系-宝马X5,车型-SUV;扩展属性信息:价格-58万,座位数-5个;关注点信息:油耗。

通过上述描述,对于用户的单一行为,可以实现多维度的深度剖析,以进一步理解和挖掘用户行为的真实意图。同理,基于某个用户的多个行为,可将每个行为对应的意图特征进行融合,得到该用户的全面、综合的意图特征。

S103、根据意图特征对多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征。

具体地,根据用户之间意图特征的相近程度对多个用户进行聚类,以形成具备明确意图特征、彼此具备一定区分度的意图人群。

其中,每个子群体的意图特征可以对子群体内各用户的意图特征进行汇总得到。汇总方式包括但不限于求和、求平均和取最大值。

本申请实施例通过获取多个用户的意图表达行为,进而提取其关联的内容,从内容中识别每个用户的意图特征,从而基于意图表达行为智能识别用户的意图特征;通过根据意图特征对多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征,从而基于特征聚类的方式,对多个用户进行群体划分,得到每个子群体的群体意图特征。本实施例提供的方法智能化程度高,耗时短,时效性高;而且,通过多个用户的意图表达行为最终得到群体意图特征,能够在用户实际行为之前识别用户意图,能够有效提高后续营销的效率。

进一步地,通过根据数据维度,从内容中识别每个用户的属性信息、扩展属性信息和关注点信息,能够有效地挖掘出有价值的数据,提高意图特征识别的准确性;本实施方式中的意图特征包括属性信息、扩展属性信息和关注点信息,从这3个维度全方面深度剖析用户的意图特征,使意图特征的表达更加准确和全面。

本实施例还达到了以下技术效果:智能化实现从内容提取到意图识别,全过程只需要3-5天,时效性高,无需人工干预,系统自动完成数据更新。

实施例二

图2a是本申请实施例二中的一种意图识别方法的流程图,本申请实施例在上述各实施例的技术方案的基础上进行了优化改进。

进一步的,将“根据意图特征对多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征”细化为“根据意图特征,确定聚类指标;根据聚类指标和聚类模型,对多个用户进行聚类,得到多个子群体;对每个子群体中各用户的意图特征进行汇总,得到每个子群体的群体意图特征”。通过聚类指标和聚类模型,无监督、自动地将多个用户划分为多个子群体,以形成具备明确意图特征、彼此具备一定区分度的子群体;通过对每个子群体中各用户的意图特征进行汇总,而不仅仅是聚类指标,充分考虑到子群体中所有的意图特征,使得抽象出的群体意图特征更加准确。

进一步地,将“从内容中识别每个用户的意图特征”细化为“采用知识图谱技术对内容进行知识抽取,得到每个用户的意图特征,并生成对应的知识图谱”;相应地,将“对每个子群体中各用户的意图特征进行汇总,得到每个子群体的群体意图特征”细化为“将各用户对应的知识图谱中的意图特征进行汇总,得到每个子群体的群体意图特征”,从而通过知识图谱的构建,可以自动化、高效率地实现意图特征的识别和汇总。

如图2a所示的一种意图识别方法,包括:

S201、获取多个用户的意图表达行为,并提取意图表达行为所关联的内容。

本实施例聚焦某个行业内多个用户的划分和群体意图的识别。基于此,获取与预设行业内的品牌和产品互动的多个用户的意图表达行为,并提取意图表达行为所关联的内容。

S202、采用知识图谱技术对内容进行知识抽取,得到每个用户的意图特征,并生成对应的知识图谱。

具体地,将用户的属性信息、扩展属性信息和关注点信息作为知识图谱的结构。结合上述示例,采用知识图谱技术对“宝马X5在SUV中算费油的么?”进行知识抽取,得到上述意图特征。

可选地,将该用户在预设行业内的全部意图特征生成预设行业下的知识图谱,如图2b所示。在技术实现上,调用知识图谱的应用程序接口(Application ProgrammingInterface,API),通过自然语义识别技术对内容进行知识抽取,并根据预设行业的特性有针对地完成数据清洗、消歧及映射等策略工作,通过准确率和/或召回率评估模型的好坏,并建立定期图谱管理、数据更新、策略优化等知识管理流程。通过分行业、有针对地构建知识图谱,以实现对不同行业及行业下的品牌及产品的深度理解。

S203、根据意图特征,确定聚类指标。

可选地,将全部意图特征或者部分意图特征直接作为聚类指标,或者对意图特征进行处理后,得到聚类指标。

具体地,对意图特征进行显著性和/或相关性分析;根据满足显著性要求和/或相关性要求的意图特征,确定聚类指标。其中,满足显著性要求指意图特征具有代表性和区分度,满足相关性要求指相似的意图特征。然后,将具有代表性和区分度的意图特征作为聚类指标,和/或,将相似的意图特征归一化后得到聚类指标。

通过显著性和/或相关性分析,提取有效的意图特征,将特征转化成可参与聚类模型构建的指标,有利于提高聚类模型的准确性,提高聚类的成功率,进而提高群体意图特征的准确性。

值得说明的是,基于行业的不同,知识图谱构建具备行业差异,原因在于数据维度不同。同理,聚类指标也具备行业差异的特征。但知识图谱和聚类指标均适用于行业下的所有品牌和产品。

S204、根据聚类指标和聚类模型,对多个用户进行聚类,得到多个子群体。

聚类模型用于按照聚类指标的接近程度,对多个用户进行聚类,得到多个子群体。

具体地,将多个用户的聚类指标数据输入至聚类模型,得到聚类模型输出的多个子群体的信息。其中,聚类指标数据为聚类指标对应的数据,例如,聚类指标包括关注的品牌数量、价格步长、活跃状况、车系步长和车型步长。品牌数量对应的数据包括不关注任何品牌、关注1-5个品牌和关注5-10个品牌等。车型步长对应的数据包括:微型汽车、紧凑型汽车、运动型实用汽车(sport utility vehicle,SUV)和多用途汽车(multi-PurposeVehicles,MPV)。

假设聚类指标的数量为N,聚类模型用于构建N维空间,将每个用户的聚类指标数据抽象为N维空间中的点,并将N维空间中的点划分为互相接近的多个子群体。

在将N维空间中的点划分为互相接近的多个子群体时,聚类模型根据聚类指标,自动为每一个聚类预设一个中心;计算每一个点距离各中心点的欧式距离,根据就近原则,将点归属于就近的中心点;接着,基于已有的点重新计算中心点,并返回执行欧式距离的计算操作,直至中心点位置变化很小,迭代结束。至此,大多数的点被划分到不同的聚类当中。点与点之前具备一定的相似度,类与类之间具备一定的差异性,进而实现相似用户聚合成一类子群体,不同子群体具备不同的群体意图特征。

本实施例通过将每个用户的聚类指标数据抽象为N维空间中的点,并将N维空间中的点划分为互相接近的多个子群体,从而将多个用户划分为聚类指标接近的多个子群体,得到具有相似聚类指标的多个子群体。

上述聚类方法实质是k-均值(means)方法,但不限于此。任何能够按照聚类指标对多个用户进行聚类的方法均可应用于本申请,例如均值漂移聚类方法和基于密度的聚类方法等。

值得说明的是,基于不同行业的特性,聚类模型会做适当地调整与优化,以在保留行业特点的情况下,用类似方法完成群体划分和群体意图识别。具体通过以下方面进行调整与优化。

第一方面,由于行业不同,从业者关系的数据维度就不同,导致意图特征会不同,进而根据意图特征确定的聚类指标也就不同了。因此,需要根据行业特性调整聚类指标。第二方面,在构建知识图谱时,由于过滤的数据不同,导致知识图谱反映的意图特征不同,聚类指标不同,则需要根据行业特性有针对性地对数据进行过滤。第三方面,不同行业的聚类策略不同,有些行业需要多次聚类才能达到好的效果,有些行业仅需要一次聚类就能达到好的效果。

本实施例中的聚类模型可复用性高,一次研究,可实现对行业内品牌和产品的全覆盖;同时,技术与模型均具备较高成熟度,后续维护更新便捷,持续投入的成本较低。

S205、获取每个子群体中各用户对应的知识图谱。

S206、将各用户对应的知识图谱中的意图特征进行汇总,得到每个子群体的群体意图特征。

可选地,汇总方式包括但不限于求和、求平均和取最大值。

可选地,在S204之前还包括:采用不同时间段的意图特征对聚类模型进行稳定性验证;和/或,采用预设行业内多个品牌和多个产品对应的意图特征,对聚类模型进行可用性验证。

其中,知识图谱中的节点代表意图特征,节点的属性包括意图特征所来自的内容的生成时间,那么可以从知识图谱中提取不同时间属性的意图特征对聚类模型进行稳定性验证。类似地,从知识图谱中提取预设行业内多个品牌和多个产品对应的意图特征,对聚类模型进行可用性验证。通过对聚类模型进行稳定性和可用性验证,保证聚类模型整体具备高稳定性和高可用性。

本实施例中,通过知识图谱技术识别用户的意图特征,从而在汇总各用户的意图特征时,从知识图谱中直接提取即可。通过知识图谱的构建,可以自动化、高效率地实现意图特征的识别,并从多维度、全面地理解用户的真实意图;而且通过知识图谱可将用户的意图特征进行特征化归纳,以方便后续进一步应用。

实施例三

图3a是本申请实施例三中的一种意图识别方法的流程图,本申请实施例在上述各实施例的技术方案的基础上,进行了优化改进。

进一步的,在操作“在根据意图特征对多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征”之后,追加“根据每个子群体的群体意图特征,对每个子群体进行业务描述”;进一步地,在操作“根据每个子群体的群体意图特征,对每个子群体进行业务描述”之后,追加“展示子群体配置界面;响应于用户在子群体配置界面上的配置操作,确定子群体的信息;根据子群体的信息,将待推广信息推送至子群体的设备”。

如图3a所示的一种意图识别方法,包括:

S301、获取多个用户的意图表达行为,并提取意图表达行为所关联的内容。

S302、从内容中识别每个用户的意图特征。

S303、根据意图特征对多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征。

S301至S303详见上述实施例的相关描述,此处不再赘述。

S304、根据每个子群体的群体意图特征,对每个子群体进行业务描述。

群体意图特征仅是一个个的词汇,不具备可读性。因此需要根据群体意图特征进行业务描述。具体地,站在业务应用的角度,从每个子群体的群体意图特征中,选取具备解释性和/或人群区分性的群体意图特征;根据选取的群体意图特征,对每个子群体进行预设行业下的业务描述。

可选地,业务描述包括子群体命名和业务解读。下面以一示例和图3b对业务描述进行详细说明。假设将某汽车品牌在一段时间内覆盖的用户自动地划分成5类子群体,并对每类子群体抽象出群体意图特征,如图3b中右侧图像所示。如图3b中左侧图像所示,结合业务场景与品牌营销的需要,对每一类子群体进行命名与业务解读如下:

KOC草根意见领袖:高活跃性,广泛关注各品牌专业内容,充分利用搜索引擎阅读最新资讯,在自己的亲朋好友圈子内是绝对意见领袖,对身边人有较高影响力,对品牌覆盖更多用户、广泛提升知名度有帮助。

品牌初选型:于消费决策的初期阶段,活跃度较高,从了解多个品牌快速定向到较为集中的阶段性品牌关注,本周看这几个下周看那几个,对比多个品牌,正在建立品牌偏好。

车系关注型:处于消费决策的中期阶段,车系偏好已经基本确定,2-3款车对比横向/详细对比过程中。

价格关注型:处于消费决策的末期阶段,比较理性,虽然对品牌有一定要求,但更看重性价比,品牌促销活动和金融计划有较大吸引力。

潜在买家:处于浅意识消费决策阶段,对汽车的了解较少,主动了解信息的情况较少,属于信息被动接受类型。

本实施例通过根据群体意图特征对每个子群体进行业务描述,将群体意图特征抽象为可读性强的描述内容,生动地刻画子群体的显著特征。

S305、展示子群体配置界面。

S306、响应于用户在子群体配置界面上的配置操作,确定子群体的信息。

其中,配置操作包括:行业选择操作、品牌选择操作、时间段选择操作、是否扩展用户来源操作中的至少一种,以及业务描述选择操作。

S307、根据子群体的信息,将待推广信息推送至子群体的设备。

对于S305至S307,在用户的终端展示子群体配置界面,此处的用户可以是广告主,子群体配置界面如图3c所示。

用户可以在子群体配置界面上配置行业、品牌、时间范围、意图人群和是否扩展用户来源。其中,意图人群包括5个子群体,分别用对应的业务描述表示。是否扩展用户来源包括相似品牌人群和行业人群。

配置成功后,可将配置的内容通过营销服务台,推送到广告投放端。广告投放端根据配置的内容确定子群体的信息,例如子群体的网络地址、用户名等。进而根据子群体的信息,将待推广信息推送至子群体的设备,实现某品牌下子群体的精准有效触达。

本实施例中,用户可以通过子群体配置界面配置业务描述、行业选择操作、品牌选择操作、时间段选择操作、是否扩展用户来源等,从而个根据用户的配置操作得到合适的子群体,进而将待推广信息推送至子群体的设备,实现子群体的精准有效触达。

本实施例中,意图表达行为具备主动性,用户行为发生时大概率未完成商品购买,用户处于目标明确的阶段。此阶段的用户较易受到品牌营销影响。而实际投放证明,品牌的子群体相较于常规投放,各方面的指标均具备一定的优势。

实施例四

图4是本申请实施例四中的一种意图识别装置的结构图,本申请实施例适用于在多个用户实际行为之前,将多个用户划分为具备意图区分度的多个子群体,并识别出各子群体的意图的情况,该装置采用软件和/或硬件实现,并具体配置于具备一定数据运算能力的电子设备中。

如图4所示的一种意图识别装置400,包括:获取模块401,识别模块402和聚类模块403;其中,

获取模块401,用于获取多个用户的意图表达行为,并提取意图表达行为所关联的内容;

识别模块402,用于从内容中识别每个用户的意图特征;

聚类模块403,用于根据意图特征对多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征。

本申请实施例通过获取多个用户的意图表达行为,进而提取其关联的内容,从内容中识别每个用户的意图特征,从而基于意图表达行为智能识别用户的意图特征;通过根据意图特征对多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征,从而基于特征聚类的方式,对多个用户进行群体划分,得到每个子群体的群体意图特征。本实施例提供的方法智能化程度高,耗时短,时效性高;而且,通过多个用户的意图表达行为最终得到群体意图特征,能够在用户实际行为之前识别用户意图,能够有效提高后续营销的效率。

进一步地,识别模块402具体用于:获取预设行业内感兴趣的数据维度;根据数据维度,从内容中识别每个用户的属性信息、扩展属性信息和关注点信息。

进一步地,聚类模块403包括确定单元、聚类单元和汇总单元。

其中,确定单元用于:根据意图特征,确定聚类指标;聚类单元用于:根据聚类指标和聚类模型,对多个用户进行聚类,得到多个子群体;汇总单元用于:对每个子群体中各用户的意图特征进行汇总,得到每个子群体的群体意图特征。

进一步地,识别模块402具体用于:采用知识图谱技术对内容进行知识抽取,得到每个用户的意图特征,并生成对应的知识图谱。相应地,汇总单元具体用于:获取每个子群体中各用户对应的知识图谱;将各用户对应的知识图谱中的意图特征进行汇总,得到每个子群体的群体意图特征。

进一步地,确定单元具体用于:对意图特征进行显著性和/或相关性分析;根据满足显著性要求和/或相关性要求的意图特征,确定聚类指标。

进一步地,聚类单元具体用于:将多个用户的聚类指标数据输入至聚类模型,得到聚类模型输出的多个子群体的信息;其中,聚类模型用于构建N维空间,将每个用户的聚类指标数据抽象为N维空间中的点,并将N维空间中的点划分为互相接近的多个子群体,N为聚类指标的数量。

进一步地,意图识别装置还包括验证模块,用于在根据聚类指标和聚类模型,对多个用户进行聚类,得到多个子群体之前,采用不同时间段的意图特征对聚类模型进行稳定性验证;和/或,采用预设行业内多个品牌和多个产品对应的意图特征,对聚类模型进行可用性验证。

进一步地,意图识别装置还包括描述模块,用于在根据意图特征对多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征之后,根据每个子群体的群体意图特征,对每个子群体进行业务描述。

进一步地,意图识别装置还包括推送模块,用于在根据每个子群体的群体意图特征,对每个子群体进行业务描述之后,展示子群体配置界面;响应于用户在子群体配置界面上的配置操作,确定子群体的信息;根据子群体的信息,将待推广信息推送至子群体的设备;其中,配置操作包括:行业选择操作、品牌选择操作、时间段选择操作、是否扩展用户来源操作中的至少一种,以及业务描述选择操作。

上述意图识别装置可执行本申请任意实施例所提供的意图识别方法,具备执行意图识别方法相应的功能模块和有益效果。

实施例五

根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。

如图5所示,是实现本申请实施例的意图识别方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。

存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的意图识别方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的意图识别方法。

存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的意图识别的方法对应的程序指令/模块(例如,附图4所示的包括获取模块401,识别模块402和聚类模块403)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的意图识别的方法。

存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储实现意图识别方法的电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至执行意图识别方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

执行意图识别方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。

输入装置503可接收输入的数字或字符信息,以及产生与执行意图识别方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案,通过获取多个用户的意图表达行为,进而提取其关联的内容,从内容中识别每个用户的意图特征,从而基于意图表达行为智能识别用户的意图特征;通过根据所述意图特征对所述多个用户进行聚类,得到多个子群体以及每个子群体的群体意图特征,从而基于特征聚类的方式,对多个用户进行群体划分,得到每个子群体的群体意图特征。本实施例提供的方法智能化程度高,耗时短,时效性高;而且,通过多个用户的意图表达行为最终得到群体意图特征,能够在用户实际行为之前识别用户意图,能够有效提高后续营销的效率。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

相关技术
  • 意图识别方法、装置、电子设备及可读存储介质
  • 用户意图识别方法、装置、设备及计算机可读存储介质
技术分类

06120112859438