掌桥专利:专业的专利平台
掌桥专利
首页

航司选择的预测方法及装置、电子设备、存储介质

文献发布时间:2023-06-19 16:08:01



技术领域

本发明涉及计算机技术领域,尤其涉及一种航司选择的预测方法及装置、电子设备、存储介质。

背景技术

随着社会对航空运输需求的日益增长,越来越多的航空公司(简称航司)在不同程度地新开或者增加航线,不同航司之间的竞争愈发激烈。用户在选择航司时通常会受到票价、机型、航司品牌等多种因素的影响。目前,航司主要采取人工分析的方式预测用户选择航司的概率,然而,这种方式存在难以对所有影响因素进行全面考量、导致预测准确性低的问题。

发明内容

本发明要解决的技术问题是为了克服现有技术中采用人工分析的方式预测航司选择概率,存在无法量化各种影响因素、预测准确性低的缺陷,提供一种航司选择的预测方法及装置、电子设备、存储介质。

本发明是通过下述技术方案来解决上述技术问题:

本发明提供一种航司选择的预测方法,包括以下步骤:

获取目标航司的航班的用户行为数据;

根据所述用户行为数据提取目标数据;其中,所述目标数据为影响用户选择航司的数据;

将所述目标数据输入航司选择预测模型;

根据所述航司选择预测模型输出的结果确定所述目标航司的选择概率;

其中,所述航司选择预测模型基于训练数据集训练得到,所述训练数据集包括不同航司的航班的历史用户行为数据以及对应选择的航司。

较佳地,所述根据所述航司选择预测模型输出的结果确定所述目标航司的选择概率的步骤包括:

根据所述航司选择预测模型输出的所述目标航司中所有航班的选择概率,计算得到所述目标航司的选择概率。

较佳地,所述根据所述航司选择预测模型输出的结果确定所述目标航司的选择概率的步骤包括:

根据所述航司选择预测模型输出的所述目标数据的权重,计算得到所述目标航司的选择概率。

较佳地,所述目标数据包括以下数据中的至少一种:所述目标航司中所有航班的票价、所述目标航司中所有航班的起降时刻、所述目标航司的机型、所述目标航司的品牌、所述目标航司是否提供附加服务。

本发明还提供一种航司选择的预测装置,包括:

行为数据获取模块,用于获取目标航司的航班的用户行为数据;

目标数据提取模块,用于根据所述用户行为数据提取目标数据;其中,所述目标数据为影响用户选择航司的数据;

目标数据输入模块,用于将所述目标数据输入航司选择预测模型;

选择概率确定模块,用于根据所述航司选择预测模型输出的结果确定所述目标航司的选择概率;

其中,所述航司选择预测模型基于训练数据集训练得到,所述训练数据集包括不同航司的航班的历史用户行为数据以及对应选择的航司。

较佳地,选择概率确定模块包括第一计算单元,用于根据所述航司选择预测模型输出的所述目标航司中所有航班的选择概率,计算得到所述目标航司的选择概率。

较佳地,选择概率确定模块包括第二计算单元,用于根据所述航司选择预测模型输出的所述目标数据的权重,计算得到所述目标航司的选择概率。

较佳地,所述目标数据包括以下数据中的至少一种:所述目标航司中所有航班的票价、所述目标航司中所有航班的起降时刻、所述目标航司的机型、所述目标航司的品牌、所述目标航司是否提供附加服务。

本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,处理器执行计算机程序时实现上述的航司选择的预测方法。

本发明还提供一种计算机可读存储介质,存储计算机程序,计算机程序被处理器执行时实现上述的航司选择的预测方法。

在符合本领域常识的基础上,所述各优选条件,可任意组合,即得本发明各较佳实施例。

本发明的积极进步效果在于:通过航司选择预测模型来预测用户选择航司的概率,可以解决航空公司在人工分析影响航司选择的多维度数据时难以量化的问题,而且还可以提高航司选择的预测结果的准确性。

附图说明

图1为本发明实施例1的航司选择的预测方法的流程图。

图2为本发明实施例2的航司选择的预测方法的应用示意图。

图3为本发明实施例3的航司选择的预测装置的模块示意图。

图4为本发明实施例4的航司选择的预测装置的模块示意图。

图5为本发明实施例5的电子设备的结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。

实施例1

本实施例提供一种航司选择的预测方法,参照图1,该预测方法包括以下步骤:

S1、获取目标航司的航班的用户行为数据;

S2、根据所述用户行为数据提取目标数据;其中,所述目标数据为影响用户选择航司的数据;

S3、将所述目标数据输入航司选择预测模型;

S4、根据所述航司选择预测模型输出的结果确定所述目标航司的选择概率;

其中,所述航司选择预测模型基于训练数据集训练得到,所述训练数据集包括不同航司的航班的历史用户行为数据以及对应选择的航司。所述历史用户行为数据具体可以包括用户搜索数据、用户预订数据等。

在训练航司选择预测模型之前,根据历史用户行为数据提取以下样本数据:所选及备选航司所有航班的票价、所选及备选航司所有航班的起降时刻优劣、所选及备选航司的机型、所选及备选航司的航司品牌、所选及备选航司是否提供餐食、是否提供wifi、所选及备选航司的航司联盟等。根据上述样本数据中航司的各个维度的特征以及对应的用户最终选择的航司,构建训练数据集,并基于训练数据集训练得到航司选择预测模型。

具体地,由于不同起飞日期、不同航线的航班的出行类型通常不同,在航司选择方面不具有可比性,因此需要按照同一起飞日、同一提前订票日和同一航线构建训练数据集。例如,预订上海至三亚在5月1日起飞的航班,与预订广州至上海在9月10日起飞的航班,在航司选择上没有可比性。因为上海至三亚属于旅游出行较多的航线,出发日期也在节假日;而广州至上海属于商务出行较多的航线,出发日期也非节假日。在构建航司选择预测模型时,应当将所选与备选航司中上海至三亚航线5月1日的航班数据进行比较。

具体地,还可以对训练数据集中的数据进行以下预处理:对具有不同量纲的数据进行归一化处理,以消除量纲不同对航司选择预测模型的训练的影响;判断数据是否有序,再对其进行one-hot encoding(一位有效编码),或者label encoding(标签编码)等处理,使这些因素符合模型训练的标准。

本实施例提供的航司选择的预测方法,通过获取页面搜索数据等用户行为数据,提取其中的目标数据输入航司选择预测模型,并根据模型输出的结果确定用户选择目标航司的概率。可以解决航空公司在人工分析影响航司选择的多维度数据时难以量化的问题,同时可以提高航司选择的预测结果的准确性。

实施例2

在实施例1的基础上,本实施例提供一种航司选择的预测方法。

在一可实施的方案中,步骤S4包括:根据所述航司选择预测模型输出的所述目标航司中所有航班的选择概率,计算得到所述目标航司的选择概率。

具体地,可以将目标航司中所有航班的选择概率相加,得到目标航司的选择概率。还可以通过下列方式提高航司选择的预测结果的准确性:

(1)在构建训练数据集时,增加用户画像特征(例如用户的性别、年龄、职业等),以及用户的历史行为习惯特征(例如用户在一定历史时间段内选择各个航司的概率);

(2)采用GBDT(梯度提升决策树算法)、XGB(极限梯度提升树算法)、LGB(轻量梯度提升树算法)等预测能力强的算法训练航司选择预测模型。

本方案提供的航司选择的预测方法,可以优化航司选择预测模型的性能,进而提高航司选择的预测结果的准确性。

在一可实施的方案中,步骤S4包括:根据所述航司选择预测模型输出的所述目标数据的权重,计算得到所述目标航司的选择概率。

具体地,可以采用Logistic Regression(逻辑回归算法)等可解释性强的算法训练航司选择预测模型,将目标数据中各个维度的数据(例如票价、机型等)与对应权重的乘积相加,得到目标航司的选择概率;同时,还可以通过各个维度的数据的权重判断其对航司选择结果的影响。

本方案提供的航司选择的预测方法,可以量化票价、机型等各种因素对航司选择结果的影响,支持航空公司对用户的选择行为作出合理的分析,进而针对性地提高自身的竞争力。

在一可实施的方案中,所述目标数据包括以下数据中的至少一种:所述目标航司中所有航班的票价、所述目标航司中所有航班的起降时刻、所述目标航司的机型、所述目标航司的品牌、所述目标航司是否提供附加服务。

当然,根据不同的实际情况,目标数据可以包括但不限于上述的各种数据。

参照图2,以用户选择北京至上海航线的航空公司A的航班为例,说明本实施例提供的航司选择的预测方法:

步骤一:基于搜索数据、预订数据等用户行为数据构建训练数据集,选取的样本为北京至上海航线的用户预订航空公司A的航班的数据,以及这些用户搜索时被展示的所有航空公司的航班的数据,包括但不限于机型、飞机制造商品牌、是否提供餐食、是否提供wifi、票价、飞机座位数、起飞时刻、用户画像(航司会员、航司联盟会员、历史出行偏好等)。参照表1,将用户购买的航空公司A的航班标记为1,其他仅浏览未购买的航空公司(表中航空公司B~F)的航班标记为0。

表1

步骤二:在根据同一航线、同一起飞日的分组下,对输入的部分数据进行特征处理。比如,具体的起飞时刻,早上9:00起飞和晚上21:00起飞对于用户的选择可能会产生不一样影响,对于起飞时刻来说,需要分区间后再做one-hot encoding处理。如果是不同航班的票价数据、不同航班的座位数数据等,由于其量纲和其他特征差距较大,则也需要进行归一化处理。

步骤三(选择行为预测):

1)从提升航司选择预测模型预测效果的角度,添加更多的用户可能会比较的因素(即特征)进行训练,例如增加用户画像特征、历史行为习惯特征等;

2)将特征处理后的训练数据集输入到XGBoost(极限梯度提升树算法)等预测能力强的算法模型中,训练得到航司选择预测模型,供后续预测使用;

3)对于新的需要进行预测的用户,将用户行为数据输入到上述航司选择预测模型中,可以得到不同航司的航班的选择概率,所有航班的选择概率之和为1。

步骤三(选择因素分析):

1)通过方差选择、相关系数、或树模型等方法进行特征选择,消除变量间的多重共线性,以增强模型的可解释性;

2)将处理好的训练数据集输入Logistic Regression(逻辑回归算法)这类可解释性强的算法中,构建航司选择预测模型;

3)获取各种选择因素(即目标数据)的权重,权重需要转化到-1到1之间;

4)权重的符号表示该因素影响用户选择航司的方向,负号表示反向影响用户的选择概率,正号表示正向影响用户的选择概率。权重的大小则表示该因素对用户选择目标航司的影响程度,权重的绝对值越大表示该因素对用户选择行为的影响力度越大。

5)根据各个选择因素的权重可以计算目标航司的选择概率,计算公式如下:

选择概率=β

其中,β

实施例3

本实施例提供一种航司选择的预测装置,参照图3,该装置包括:

行为数据获取模块1,用于获取目标航司的航班的用户行为数据;

目标数据提取模块2,用于根据所述用户行为数据提取目标数据;其中,所述目标数据为影响用户选择航司的数据;

目标数据输入模块3,用于将所述目标数据输入航司选择预测模型;

选择概率确定模块4,用于根据所述航司选择预测模型输出的结果确定所述目标航司的选择概率;

其中,所述航司选择预测模型基于训练数据集训练得到,所述训练数据集包括不同航司的航班的历史用户行为数据以及对应选择的航司。

由于本实施例提供的航司选择的预测装置与实施例1的航司选择的预测方法的实现原理类似、有益效果类似,故在此不再赘述。

实施例4

在实施例3的基础上,参照图4,本实施例提供一种航司选择的预测装置。

在一可实施的方案中,选择概率确定模块包括第一计算单元401,用于根据所述航司选择预测模型输出的所述目标航司中所有航班的选择概率,计算得到所述目标航司的选择概率。

在一可实施的方案中,选择概率确定模块包括第二计算单元402,用于根据所述航司选择预测模型输出的所述目标数据的权重,计算得到所述目标航司的选择概率。

在一可实施的方案中,所述目标数据包括以下数据中的至少一种:所述目标航司中所有航班的票价、所述目标航司中所有航班的起降时刻、所述目标航司的机型、所述目标航司的品牌、所述目标航司是否提供附加服务。

由于本实施例提供的航司选择的预测装置与实施例2的航司选择的预测方法的实现原理类似、有益效果类似,故在此不再赘述。

实施例5

本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1或2所提供的航司选择的预测方法。

如图5所示,电子设备9具体包括:

至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:

总线93包括数据总线、地址总线和控制总线。

存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。

存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1或2所提供的航司选择的预测方法。

电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

实施例6

本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1或2所提供的航司选择的预测方法的步骤。

其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。

在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1或2所提供的航司选择的预测方法的步骤。

其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

技术分类

06120114710152