掌桥专利:专业的专利平台
掌桥专利
首页

数据分析方法、系统、电子设备和存储介质

文献发布时间:2023-06-19 10:16:30


数据分析方法、系统、电子设备和存储介质

技术领域

本发明实施例涉及智慧家庭技术领域,特别涉及一种数据分析方法、系统、电子设备和存储介质。

背景技术

随着智能家电、智慧安防等智慧家庭产品的日益成熟,智慧家庭的控制方法正在由技术导向转化为需求导向。以需求为导向对智慧家庭进行控制所采用的方法是:首先获取智慧家庭的数据,然后对获取的数据进行统计分析,得到用户画像和设备画像,接着根据用户画像和设备画像预测用户和设备的行为,最后根据预测结果对智慧家庭中的设备进行控制。

然而,由于统计分析得到的用户画像和设备画像比较粗略,不能对用户进行准确的行为预测,从而导致根据行为预测进行的智慧家庭控制不能准确迎合用户的需求。

发明内容

本发明实施方式的目的在于提供一种数据分析方法、系统、电子设备和存储介质,使得根据数据分析得到的用户需求和用户行为预测更加精准。

为解决上述技术问题,本发明的实施方式提供了一种数据分析方法,包括以下步骤:获取并保存设备数据和用户话单数据;对所述设备数据和所述用户话单数据进行预处理;根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系;根据所述用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型,并将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务。

本发明的实施方式还提供了一种数据分析系统,包括:存储模块,用于获取并保存设备数据和用户话单数据;预处理模块,用于对所述设备数据和所述用户话单数据进行预处理;分析模块,用于根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系;根据所述用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型;发送模块,用于将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务。

本发明的实施方式还提供了一种电子设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上所述的智慧家庭的控制方法。

本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以上所述的智慧家庭的控制方法。

本发明实施方式相对于现有技术而言,获取并保存设备数据和用户话单数据后,对设备数据和用户话单数据进行预处理,然后根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系,挖掘了用户、设备和家庭的关联关系,获得用户、家庭和设备的不易发现的潜在关系,使得预测的用户需求更加精准。将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务,使得设备提供智能化的、精准的服务。

另外,本发明的实施方式提供的数据分析方法,所述对所述设备数据和所述用户话单数据进行预处理,包括:根据预先设置的计算框架对所述设备数据和所述用户话单数据进行计算,获取不同框架的计算结果;对所述不同框架的计算结果进行加权平均,获取特征数据。对计算框架输出的计算结果进行加权平均,减小了结果的误差,使得特征数据更加准确。

另外,本发明的实施方式提供的数据分析方法,所述根据所述预处理后的用户话单数据获取家庭和用户之间的关联关系、家庭画像,包括:对所述预处理后的用户话单数据进行分类,将具有相同特征的数据划分为一类;对划分后的用户话单数据进行数据挖掘,获取所述划分后的用户话单数据的关联规则;根据所述关联规则获取家庭和用户之间的关联关系;根据所述家庭和用户之间的关联关系构建家庭单元的拓扑结构;根据所述家庭单元的结构对属于同一家庭单元中的用户的话单数据进行数据挖掘,获取所述家庭画像。引入家庭的概念,使得数据分析的结果不仅体现单个用户的需求还能够体现位于受家庭影响的用户的需求,进一步提高数据分析的精确度。

另外,本发明的实施方式提供的数据分析方法,所述根据所述家庭和用户之间的关联关系构建家庭单元的拓扑结构,包括:从不在家庭单元中的用户中选取两个用户,根据所述家庭和用户之间的关联关系判断所述两个用户是否属于一个家庭;若所述两个用户属于一个家庭,根据所述两个用户构成家庭单元的拓扑结构;根据所述家庭和用户的关联关系判断不在家庭单元中的用户是否属于所述初始的家庭单元;若所述不在家庭单元中的用户属于所述初始的家庭单元,将所述不在家庭单元中的用户增加到所述家庭单元的拓扑结构。采用递推的方式构建家庭单元,将复杂、庞大的分析过程简化为简单过程的多次重复,减少分析计算过程中的消耗。

另外,本发明的实施方式提供的数据分析方法,所述对所述设备画像进行分类,包括:若分类的类别是预先设定的,采用分类算法对所述设备画像进行分类;若分类的类别不是预先设定的,采用聚类算法对所述设备画像进行聚类并根据聚类的结果对所述设备画像进行分类。根据实际情况调整分类的方法,能够灵活地适应不同的情况,从而提高分类的效果。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。

图1是本发明的第一实施方式提供的数据分析方法的流程图;

图2是本发明的第二实施方式提供的数据分析方法的流程图;

图3是本发明的第三实施方式提供的数据分析方法的流程图;

图4是图3所示的本发明的第三实施方式提供的数据分析方法中步骤306的流程图;

图5是本发明的第四实施方式提供的数据分析方法的流程图;

图6是本发明的第五实施方式提供的数据分析系统的结构示意图;

图7是本发明的第六实施方式提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。

以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。

本发明的第一实施方式涉及一种数据分析方法。具体流程如图1所示。

步骤101,获取并保存设备数据和用户话单数据。

在本实施方式中,设备数据可以包括:设备状态、厂商信息、设备操作等;用户话单数据可以包括产品订购,账单话单,位置信息等数据。当然,以上仅为具体的举例说明,在实际的使用过程中设备数据、用户话单数据还可以包括其他数据,此处不做一一赘述。

在本实施方式中,为了更加适应大数据处理、流式文件访问和降低费用,可以将设备数据和用户话单数据保存在分布式存储文件系统中。

步骤102,对设备数据和用户话单数据进行预处理。

在本实施方式中,预处理可以是对相同时期的数据进行分类处理,例如将用户话单数据划分为多个维度,更具体地说可以划分为身份信息、位置信息、通信关系、付费关系、订购关系、终端使用信息6个维度。预处理还可以是针对实时数据将不同时期的数据进行增量处理,保证数据的实时性,避免数据变化而分析结果变化滞后过多导致的预测错误。

步骤103,根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系。

在本实施方式中,预处理后的设备数据可以包括使用时间、下线时间、使用时长、操作指令、警告通知、状态数据等设备使用特征数据;预处理后的用户话单数据可以包括用户身份、用户位置等用户话单特征数据。当然,以上仅为具体的举例说明,在实际的使用过程中预处理后的设备数据、预处理后的用户话单数据还可以包括其他数据,此处不做一一赘述。

在本实施方式中,用户和设备之间的关联关系可以是由APP或者网关的用户信息直接建立。

步骤104,根据用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型,并将行为偏好模型发送给家庭中的设备,供在无需家庭成员操作的情况下为家庭成员提供服务。

在本实施方式中,行为偏好模型可以是发送给家庭设备,供家庭设备经过分析之后得到家庭成员的行为预测,从而提供有针对性、准确、高效和个性化的服务。还可以发送给平台或者运营商,进一步利用数据分析的结果,让平台或者运营商能够进行个性化推荐,提高服务质量和服务推荐的效率。

本发明实施方式相对于现有技术而言,获取并保存设备数据和用户话单数据后,对设备数据和用户话单数据进行预处理,然后根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系,挖掘了用户、设备和家庭的关联关系,获得用户、家庭和设备的不易发现的潜在关系,使得预测的用户需求更加精准。将所述行为偏好模型发送给家庭中的设备,供在无需所述家庭成员操作的情况下为所述家庭成员提供服务,使得设备提供智能化的、精准的服务。

本发明的第二实施方式涉及一种数据分析方法,该方法与第一实施方式提供的数据分析方法基本相同,其区别在于,如图2所示,步骤102包括:

步骤201,根据预先设置的计算框架设备数据和用户话单数据进行计算,获取不同框架的输出数据。

在本实施方式中,计算框架可以是Spark、Flink、Storm等。当然,以上仅为具体的举例说明,在实际的使用过程中计算框架还可以包括其他框架,此处不做一一赘述。

步骤202,对不同框架的输出数据进行加权平均。

在本实施方式中,不对使用的权重进行限制,可以根据实际情况进行调整。

本发明实施方式相对于现有技术而言,在实现第一实施方式带来的有益效果基础上,对计算框架的输出数据进行加权平均,减小了数据预处理的误差,使得处理后的用户话单数据和处理后的设备数据更加准确。

本发明的第三实施方式涉及一种数据分析方法,该方法与第一实施方式提供的数据分析方法基本相同,其区别在于,如图3所示,步骤103包括:

步骤301,根据预处理后的设备数据获取设备画像。

步骤302,根据预处理后的用户话单数据获取用户画像、用户和设备之间的关联关系。

步骤303,对预处理后的用户话单数据进行分类,将具有相同特征的数据划分为一类。

在本实施方式中,通过分类算法或者聚类算法对已经划分维度后的某一维度的数据分别进行分类,但是不对分类方法进行具体限定,分类方法可以是任意一种能够对具有相同特征的数据进行划分的方法。

在本实施方式中相同特征可以是相同的童话对象、相同的用户位置等。当然,以上仅为具体的举例说明,在实际的使用过程中相同特征还可以包括其他特征,此处不做一一赘述。

步骤304,对划分后的用户话单数据挖掘关系规则,获取划分后的用户话单数据的关联规则。

在本实施方式中,挖掘关系规则采用的方法可以是Apriori算法、FP-growth算法等。当然,以上仅为具体的举例说明,在实际的使用过程中挖掘关系规则采用的方法还可以包括其他方法,此处不做一一赘述。

步骤305,根据关联规则获取家庭和用户之间的关联关系。

具体地说,多个用户的位置信息、通话对象相似或者总是存在较强的关联,认为这些用户属于同一个家庭;某个用户与已经确定的家庭中的用户的其他用户在终端使用、使用时间以及使用的频率等存在较强的关联,认为用户属于这个家庭等。当然,以上仅为具体的举例说明,在实际的使用过程中判断方法还可以包括其他方法,此处不做一一赘述。

步骤306,根据家庭和用户之间的关联关系构建家庭单元的拓扑结构。

具体地,如图4所示,步骤306可以包括:

步骤401,从不在家庭单元的拓扑结构中的用户中选取两个用户,根据家庭和用户之间的关联关系判断两个用户是否属于一个家庭。

步骤402,若两个用户属于一个家庭,根据两个用户构成初始家庭单元的拓扑结构。

步骤403,根据家庭和用户的关联关系判断不在家庭单元中的用户是否属于初始的家庭单元。

步骤404,若不在家庭单元的拓扑结构中的用户属于初始的家庭单元,将不在家庭单元中的用户增加到所述家庭单元的拓扑结构。

具体地说,首先判断某两个人是否为一个家庭,再判断某个人是否属于这个家庭。根据家庭特点可知,家庭中的某个成员不会只与家庭中的一员存在关系,因此家庭单元的拓扑结构必须形成一个闭环的状态,判断某个人是否属于某个家庭时,此人必须与家庭中的某两个人存在家庭关系,且取家庭成员较多的家庭作为该成员的家庭。

步骤307,根据家庭单元的结构对属于同一家庭单元中的用户的话单数据和设备数据进行数据挖掘,获取家庭画像。

在本实施方式中,家庭画像可以是青年家庭标签(无孩子、无老人)、儿童标签、老人标签、运动标签、教育标签等。当然,以上仅为具体的举例说明,在实际的使用过程中家庭画像还可以包括其他标签,此处不做一一赘述。

步骤308,根据家庭画像、用户画像、设备画像和家庭和用户之间的关联关系获取家庭和设备之间的关联关系。

在本实施方式中,通过家庭和用户之间的关联关系便可以确定某个群体中的用户是否属于一个家庭。当一个家庭确定了以后,可通过用户和设备之间的关联关系确定该家庭都具备哪些设备,基于此便可以分析家庭中每个人与设备之间的关联。

本发明实施方式相对于现有技术而言,在实现第一实施方式带来的有益效果基础上,引入家庭的概念,获取家庭画像,使得数据分析的结果不仅体现单个用户的需求还能够体现位于受家庭影响的用户的需求,进一步提高数据分析的精确度。同时采用递推的方式构建家庭单元,将复杂、庞大的分析过程简化为简单过程的多次重复,减少分析计算过程中的消耗。

本发明的第四实施方式涉及一种数据分析方法,该方法与第一实施方式提供的数据分析方法基本相同,其区别在于,如图5所示,步骤103包括:

步骤501,根据预处理后的设备数据获取设备画像。

步骤502,根据预处理后的用户话单数据获取用户画像、用户和设备之间的关联关系、家庭和用户之间的关联关系、家庭画像。

步骤503,对设备画像进行分类,获取设备的使用习惯特征。

在本实施方式中,分类的类别可以是:使用时间段、浏览内容、使用频率等。当然,以上仅为具体的举例说明,在实际的使用过程中分类的类别还可以包括其他内容,此处不做一一赘述。

在本实施方式中,使用习惯特征可以是:电视机通常在下午五点浏览美食节目、空调通常在中午十二点到下午两点使用等。

在本实施方法中,步骤503在不同情况下会采用不同的分类方法。

一种是,若分类的类别是预先设定的,采用分类算法对设备画像进行分类。

另一种是,若分类的类别不是预先设定的,采用聚类算法对设备画像进行聚类并根据聚类的结果对设备画像进行分类。

当然,以上两种情况仅为具体的举例说明,在实际的使用过程中,步骤503还可能有其他情形并选择相应的分类方法,此处不做一一赘述。

步骤504,根据家庭和用户之间的关联关系、用户画像获取家庭中每个用户的画像。

步骤505,根据家庭画像对家庭中每个用户的画像和设备的使用习惯特征进行关联。

步骤506,根据关联的结果获取家庭和设备之间的关联关系。

具体地,以电视机的例子,家庭中具有儿童标签的个人便可以认为其通常在下午六点的时候在电视机上浏览儿童节目等,从而得到家庭中每个人对应的设备使用习惯,更进一步地得出家庭与设备的关系。

本发明实施方式相对于现有技术而言,在实现第一实施方式带来的有益效果基础上,采用聚类算法对所述设备画像进行聚类并根据聚类的结果对所述设备画像进行分类。根据实际情况调整分类的方法,能够灵活地适应不同的情况,从而提高关联关系的结果。

上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。

本发明第五实施方式涉及一种数据分析系统,如图6所示,包括:

存储模块601,用于获取并保存设备数据和用户话单数据;

预处理模块602,用于对设备数据和用户话单数据进行预处理;

分析模块603,用于根据预处理后的设备数据和预处理后的用户话单数据,获取用户、设备和家庭之间的关联关系;根据用户、设备和家庭之间的关联关系获取家庭成员的行为偏好模型;

发送模块604,用于将行为偏好模型发送给家庭中的设备,供在无需家庭成员操作的情况下为家庭成员提供服务。

不难发现,本实施方式为与第一实施方式相对应的系统实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。

值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。

本发明第六实施方式涉及一种电子设备,如图7所示,包括:

至少一个处理器701;以及,

与所述至少一个处理器701通信连接的存储器702;其中,

所述存储器702存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器701执行,以使所述至少一个处理器701能够执行本发明第一至第三实施方式所述的数据分析方法。

其中,存储器和处理器采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器的各种电路链接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。

处理器负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器可以被用于存储处理器在执行操作时所使用的数据。

本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

相关技术
  • 评论数据分析方法、系统、电子设备及存储介质
  • 数据分析方法、系统、电子设备和存储介质
技术分类

06120112482184