掌桥专利:专业的专利平台
掌桥专利
首页

基于K-Means聚类算法的贵宾旅客分析方法

文献发布时间:2023-06-19 18:37:28



技术领域

本发明涉及一种基于K-Means聚类算法的贵宾旅客分析方法,属于聚类分析领域。

背景技术

机场是城市(特别是大城市)交通的重要组成部分。随着人们生活水平的不断提高,各大机场亦专门设置了贵宾服务,其目的是让贵宾旅客能够享受到优先优质的服务,即具有便利快捷等效果。但是现有的贵宾管理系统,其却仍存在未实现信息化、信息处理方式落后、信息无法同步传递、预约方式单一、客户认证方式落后、管理效率低、出错率高以及采集分析数据能力差等缺陷,从而使贵宾所体验到的服务大打折扣

掌握乘客行为习惯数据的聚类方法对于研究乘客的消费习惯有重要的作用和意义,随着人们的经济条件的提升,越来越多的人选择通过飞机出行,贵宾服务也成为越来越多的人的选择,单单依靠人工来分析贵宾用户的数据不仅效率低下,而且准确度也不高。通过聚类分析,再加上与另一种聚类方法双向验证,可以提高分析的效率以及分析的准确率。一般的聚类算法有K-means聚类和LDA文档主题提取模型等,一般的优化算法有模拟退火算法和遗传算法等。

2.检索结果

1)一种K-means聚类的初值选择方法

此发明本发明涉及机器学习、模式分类、数据挖掘等分类领域,具体涉及数据挖掘领域中的划分聚类方法。

此发明是一种K-means聚类的初值选择方法,解决了K-means容易陷入局部极值、聚类结果不稳定、严重依赖初始聚类中心的问题。 K-means聚类的初值通常是采用抽样的方法从数据集中获取。为了提高K-means的稳定性,需要为K-means提供质量更好的抽样。传统的解决方法计算复杂度偏高,而且总是拒绝最优的抽样结果。本发明充分考虑理想抽样的空间分布特点,采用样本之间距离的总体水平结合最小距离来评价随机抽样的质量。通过多次抽样,选择评价指标相对最优的抽样结果作为K-means的初值。新的K-means 初值选择方法计算复杂度低,能够很容易捕捉到多次采样中随机出现的最好结果,从而为K-means提供相对更好的初值所需的数据对象,有效降低K-means陷入局部最优的概率,最终提高K-means聚类结果稳定性。

2)一种基于经纬度坐标和k-means聚类算法的交通需求分析方法此发明涉及交通规划、设计与管理领域,具体涉及一种基于经纬度坐标和k-means聚类算法的交通需求分析方法。

此方案的重点在于公开了一种基于经纬度坐标和k-means聚类算法的交通需求分析方法,该方法包括以下步骤:(1)设计居民出行调查表;(2)发放和回收居民出行调查表;(3)获取出发地点和到达地点的经度与纬度;(4)构建数据库,录入与交通需求有关信息;(5)对经纬度数据进行分析和检查;(6)计算出行距离,删除不合理数据;(7) 运用k-means聚类算法对起讫点进行聚类分析,划分交通小区;(8) 调整交通小区划分方案;(9)构建OD矩阵。本发明在精准地获取出发地点和到达地点经纬度坐标的基础上,运用k-means聚类算法划分交通小区并创建OD矩阵,可以快速高效地分析交通出行数据,更好地满足交通规划、设计与管理的工程实践。

3)一种基于K-MEANS聚类算法测试数据相似性划分的K值选择法此发明涉及计算机算法技术领域,具体为一种基于K-MEANS聚类算法测试数据相似性划分的K值选择法。

此发明公开了一种基于K-MEANS聚类算法测试数据相似性划分的K值选择法,包括数据处理测试、线性反馈移位寄存器、k-means算法数据划分、综合平台搭建、实验测试、衡量指标和实验分析,数据处理测试包括激励处理测试和响应处理测试,且激励处理测试主要测试压缩率和压缩后数据的故障覆盖率作,且响应处理测试主要测试被测电路施加测试激励后被测电路的输出,该方法提出使用k-means聚类算法对大量数据进行分类,使得类内的数据尽可能相似,不同类的数据不相似,在类间平均性、类内相似性、类间相异性和运行时间这几项指标的约束下,使用不同长度的线性反馈移位寄存器LFSR产生的大量随机数据对不同分类数下以上项指标的变化趋势进行统计,发现最优聚类区间。

4)空港贵宾服务管理系统

此发明涉及管理系统领域,更具体的说涉及一种空港贵宾服务管理系统。此发明公开一种空港贵宾服务管理系统,包括工作站单元和服务器单元,该工作站单元具有前厅工作站、调度工作站、资源分配工作站、内场工作站、国内头等舱工作站和国外头等舱工作站,该服务器单元则具有贵宾系统服务器、Web服务器、安检信息服务器以及门户网站服务器,上述各个工作站均通过传输线路和交换机而与上述各个服务器之间通信相连。本发明能确保每个环节都为贵宾提供最方便快捷的服务,并且本发明还具有技术支持响应速度快以及可结合实际需求而升级调整等功效。

5)检索结果总体分析

从现有专利和其他文献的检索结果来分析,K-Means聚类算法在K值确定方向已经有较好的方法,在网络与交通方面也有所应用,但本提案在贵宾服务方面尤其是机场贵宾服务方面并未有相关应用,未有相似的专利和文献。

现有全国各个机场规模大小不同,机场受众不同,不同地区不同类型旅客消费习惯差异很大,如何能满足不用客户的需求,了解客户实际想要的,供客户所需的,准确的客户分类的结果是不仅是机场亦是企业优化营销资源的重要依据。

客户的消费金额、消费时间间隔、飞行里程、折扣系数等诸多因素会影响对贵宾的分类,从而不能很好的进行精确的引导和信息推送。

发明内容

为克服现有技术的缺陷,本发明提供一种基于K-Means聚类算法的贵宾旅客分析方法,本发明的技术方案是:

一种基于K-Means聚类算法的贵宾旅客分析方法,利用K-means聚类方法,对航空公司的客户进行了分类,来识别出不同的客户群体,从来发现有用的客户,从而对不同价值的客户类别提供个性化服务,指定相应的营销与服务策略。

所述的K-means聚类方具体包括以下步骤:

(1)数据清洗;(2)属性规约;(3)数据变换;(4)模型构建;(5)特征分析,生成客户特征分析图;(6)对客户进行分析。

所述的步骤(1)具体为:发现数据中存在缺失值,票价最小值为 0、折扣率最小为0、总飞行公里数大于0的记录,对这类数据进行丢弃处理。

所述的步骤(2)具体为:原始数据中选取与模型相关的六个模型特征,六个模型特征分别为:截止时间、入会时间、上一飞行距今、飞行总计、飞行总里程和平均折扣率。

所述的步骤(3)具体为:

(3-1)考虑到客户的入会时间长短会影响到客户价值,通过计算客户加入会员的时间长短,来得到转换的数据集合,设有n个会员,其入会的集合为[d

(3-2)数据五个指标的取值范围数据存在差异,为消除数量级带来的影响,数据集d进行标准化处理,得到样本集D;

其中,

所述的步骤(4)具体为:根据五个指标,使用K-Means聚类算法对客户进行聚类分群,分群数k=5;

对样本集D,K-Means算法就是针对聚类划分C={C1,C2,…,Ci}最小化平方误差;

其中,

所述的步骤(5)具体为:

S1、从样本集D中随机选取K=5个样本作为初始均值向量{μ1,μ2 ,μ3,μ4,μ5};

S2、令

S3、将各样本回归于与之距离最近的聚类中心,求各个类的样本的均值,作为新的聚类中心:

S4、若聚类中心不再发生变动或者达到迭代次数,算法结束,否则回到步骤S2。

所述的步骤(6)具体为:

1)重要保持客户:平均折扣率较高、仓位等级高、飞行总计高、飞行总里程高、飞行总计上一次飞行距今低,将资源优先投放到这类客户身上,进行差异化管理;

2)重要发展客户:平均折扣率高,这类客户入会时长短、当前价值低、发展潜力大,应促使客户增加消费;

3)重要挽留客户:平均折扣率、飞行总计、飞行总里程高,客户价值变化的不确定性高,掌握客户最新信息、维持与客户的互动;

4)一般和低价值客户:其他属性都低、上一次飞行距今高,这类客户在打折促销时才会选择消费。

对于一级客户:在平均折扣率属性上最大,可定义为重要发展客户;对于二级客户:在飞行总计、飞行总里程属性上较小,定义为一般客户;对于三级客户:在飞行总计、飞行总里程属性最小,定义为低价值客户;对于四级客户:在飞行总计、飞行总里程属性最大,定义为重要保持客户;对于五级客户:在入会时长属性最大,定义为重要挽留客户。

本发明的优点是:

通过K-Means聚类方法对航空公司提供的数据进行分析之后,可以有效的对不同类型的客户进行分类、相同类别的客户之间差异化较小,保证后期提供贵宾服务时候可按照分类进行差异化的定制服务,更好的适应不同客户的需求。

另外,随着区域之间联系加强,人们的生活质量愈发的提高,飞机出行越发的方便,客户对服务的要求也越来越高。通过K-Means聚类算法的贵宾旅客分析方法,可以最大限度的多维度实现对大量数据的聚类分析,分类结果会愈发的精确,用户也可以在无感的情况下,得到更好更优质定制化的服务。

具体实施方式

下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。

本发明涉及一种基于K-Means聚类算法的贵宾旅客分析方法,利用K-means聚类方法,对航空公司的客户进行了分类,来识别出不同的客户群体,从来发现有用的客户,从而对不同价值的客户类别提供个性化服务,指定相应的营销与服务策略。

所述的K-means聚类方具体包括以下步骤:

(1)数据清洗;(2)属性规约;(3)数据变换;(4)模型构建; (5)特征分析,生成客户特征分析图;(6)对客户进行分析。

所述的步骤(1)具体为:发现数据中存在缺失值,票价最小值为 0、折扣率最小为0、总飞行公里数大于0的记录,对这类数据进行丢弃处理。

所述的步骤(2)具体为:原始数据中选取与模型相关的六个模型特征,六个模型特征分别为:截止时间、入会时间、上一飞行距今、飞行总计、飞行总里程和平均折扣率。

所述的步骤(3)具体为:

(3-1)考虑到客户的入会时间长短会影响到客户价值,通过计算客户加入会员的时间长短,来得到转换的数据集合,设有n个会员,其入会的集合为[d

(3-2)数据五个指标的取值范围数据存在差异,为消除数量级带来的影响,数据集d进行标准化处理,得到样本集D;

其中,

所述的步骤(4)具体为:根据五个指标,使用K-Means聚类算法对客户进行聚类分群,分群数k=5;

对样本集D,K-Means算法就是针对聚类划分C={C1,C2,…,Ci}最小化平方误差;

其中,

所述的步骤(5)具体为:

S1、从样本集D中随机选取K=5个样本作为初始均值向量{μ1,μ2,μ3,μ4 ,μ5};

S2、令

S3、将各样本回归于与之距离最近的聚类中心,求各个类的样本的均值,作为新的聚类中心:

S4、若聚类中心不再发生变动或者达到迭代次数,算法结束,否则回到步骤S2。

所述的步骤(6)具体为:

1)重要保持客户:平均折扣率较高、仓位等级高、飞行总计高、飞行总里程高、飞行总计上一次飞行距今低,将资源优先投放到这类客户身上,进行差异化管理;

2)重要发展客户:平均折扣率高,这类客户入会时长短、当前价值低、发展潜力大,应促使客户增加消费;

3)重要挽留客户:平均折扣率、飞行总计、飞行总里程高,客户价值变化的不确定性高,掌握客户最新信息、维持与客户的互动;

4)一般和低价值客户:其他属性都低、上一次飞行距今高,这类客户在打折促销时才会选择消费。

对于一级客户:在平均折扣率属性上最大,可定义为重要发展客户;对于二级客户:在飞行总计、飞行总里程属性上较小,定义为一般客户;对于三级客户:在飞行总计、飞行总里程属性最小,定义为低价值客户;对于四级客户:在飞行总计、飞行总里程属性最大,定义为重要保持客户;对于五级客户:在入会时长属性最大,定义为重要挽留客户。

本发明区别于已有关于K-Means聚类方法所应用的领域,创造性使用K-Means聚类方法从多维度进行对贵宾旅客的分类,更好更精确的实现贵宾旅客的分类,从而更好的进行推送服务。

多维度数据经过数据清洗、属性规约、数据转化,对航空公司提供的数据利用K-means聚类方法实现对不同地区,不同客户进行聚类划分,实现对不同客户的精确引导,节约服务资源,提高服务质量。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

技术分类

06120115630487