一种用于在线招聘的双向推荐系统及方法

文献发布时间：2023-06-19 19:35:22

技术领域

本发明涉及互联网信息推荐系统技术领域，具体而言，涉及一种用于在线招聘的双向推荐系统及方法。

背景技术

在线招聘市场作为一种重要的在线市场，支撑求职者与招聘者之间进行双方共赢的人力岗位交易。为了避免用户遭遇信息过载困境，在线招聘市场依赖推荐系统来获取符合用户偏好的有限结果，这使得关于推荐技术的研究越来越得到重视和发展。

目前多数推荐技术的研究都是关于用户-物品匹配的传统推荐，仅需要考虑单方用户的偏好信息，无法满足需要同时考虑双方用户偏好的在线招聘市场。在用户-用户匹配的互惠推荐中，需要同时考虑双方用户的偏好信息，才能实现用户之间的匹配；由于模型的复杂度高，数据形式较为特殊，现有的少数关于在线招聘中的推荐系统双向匹配度低，准确性差，用户体验不好。

发明内容

为解决上述问题，本发明的目的在于提供一种能够支持在线招聘市场中的推荐需求，同时满足对求职者和招聘者双方独立偏好的考量需求，实现用户-用户之间互惠匹配的高准度预测的双向推荐系统及方法。

本发明提供了一种用于在线招聘的双向推荐系统，该系统包括：输入模块、求职者特征提取模块、招聘者特征提取模块、特征分配模块、求职者多阶段行为编码模块、招聘者多阶段行为编码模块和输出模块；其中，

所述输入模块将原始特征转化后得到输入特征，并分别将所述输入特征输入到所述求职者特征提取模块和所述招聘者特征提取模块，所述原始特征为与求职者的求职行为和招聘者的招聘行为相关的特征；

所述求职者特征提取模块和所述招聘者特征提取模块分别从所述输入特征中提取求职者特征信息和招聘者特征信息；

所述特征分配模块将提取到的所述求职者特征信息和所述招聘者特征信息进行特征聚合，将聚合后的特征信息分配到所述求职者多阶段行为编码模块和所述招聘者多阶段行为编码模块；

所述求职者多阶段行为编码模块和所述招聘者多阶段行为编码模块分别对所述聚合后的特征信息进行处理，生成多个求职者行为概率值和多个招聘者行为概率值；

所述输出模块根据所述多个求职者行为概率值和所述多个招聘者行为概率值计算输出求职者与招聘者双向匹配结果。

作为本发明进一步的改进，所述原始特征包括求职者属性信息、求职者偏好信息、招聘者属性信息、招聘者偏好信息、求职者与招聘者交互信息以及环境信息；所有原始特征分为类别型特征和数值型特征。

作为本发明进一步的改进，所述输入模块将所述原始特征转化为独热编码向量，并将所述独热编码向量作为所述输入特征。

作为本发明进一步的改进，所述输入模块将所述原始特征转化为独热编码向量包括：

所述输入模块对所有类别型特征进行字典构建，并经过映射得到每个类别型特征对应字典的索引；

所述输入模块对所有数值型特征进行分桶处理，并经过映射后得到每个数值型特征所属桶的索引；

所述输入模块将索引化后的类别型特征和数值型特征转化为独热编码向量。

作为本发明进一步的改进，所述求职者特征提取模块和所述招聘者特征提取模块的结构相同且独立运行，均包括特征嵌入层和特征交互层，

所述特征嵌入层输出对应输入特征的可学习稠密向量，并将得到的所述可学习稠密向量输入到所述特征交互层；

所述特征交互层对同一输入特征进行特征交互，得到多个交互后的特征融合向量，并将所述多个特征融合向量输出到所述特征分配模块。

作为本发明进一步的改进，所述特征交互层采用混合专家模型，通过多个专家对同一输入特征进行各自独立的非线性特征交互，得到交互后的多个特征融合向量。

作为本发明进一步的改进，所述特征分配模块包括特征聚合层和特征自适应选择器，

所述特征聚合层将提取到的所述求职者特征信息和所述招聘者特征信息进行特征聚合，得到聚合后的特征信息，并将所述聚合后的特征信息输入到所述特征自适应选择器；

所述特征自适应选择器通过神经网络自适应学习权重，并分配所述聚合后的特征信息到所述求职者多阶段行为编码模块和招聘者多阶段行为编码模块。

作为本发明进一步的改进，所述求职者多阶段行为编码模块和所述招聘者多阶段行为编码模块的结构相同且独立运行；

所述求职者多阶段行为编码模块包括求职者多行为编码隐层，所述求职者多行为编码隐层根据求职者特征信息对求职者的多个行为进行独立编码，并为求职者的每个行为生成对应的行为概率值；

所述招聘者多阶段行为编码模块包括招聘者多行为编码隐层，所述招聘者多行为编码隐层根据招聘者特征信息对招聘者的多个行为进行独立编码，并为招聘者的每个行为生成对应的行为概率值。

作为本发明进一步的改进，上一行为对应的行为概率值与当前行为对应的行为概率值通过条件概率公式进行乘法运算得到第一条件概率值，所述第一条件概率值用于输入至当前行为对应的二分类损失函数中进行计算以输出当前行为对应的分类结果，第一条件概率值与下一行为对应的行为概率值通过条件概率公式进行乘法运算得到第二条件概率值，所述第二条件概率值用于下一次乘法运算，直至所述输出模块输出最终的分类结果，其中，所述上一行为、所述当前行为和所述下一行为均为多个求职者行为和多个招聘者行为中的一个行为，所述最终的分类结果表示求职者与招聘者双向匹配结果。

本发明还提供了一种用于在线招聘的双向推荐方法，该方法包括：

特征输入，将原始特征转化为输入特征，所述原始特征为与求职者的求职行为和招聘者的招聘行为相关的特征；

特征提取，根据输入特征分别提取求职者特征信息和招聘者特征信息；

特征分配，将求职者特征信息和招聘者特征信息进行特征聚合，并分配聚合后的特征信息；

多阶段行为编码，对聚合后的特征信息进行编码处理，并生成多个求职者行为概率值和多个招聘者行为概率值；

结果输出，根据所述多个求职者行为概率值和所述多个招聘者行为概率值计算输出求职者与招聘者双向匹配结果。

作为本发明进一步的改进，所述原始特征包括求职者属性信息、求职者偏好信息、招聘者属性信息、招聘者偏好信息、求职者与招聘者交互信息以及环境信息；

所有原始特征分为类别型特征和数值型特征。

作为本发明进一步的改进，将所述原始特征转化为独热编码向量，并将所述独热编码向量作为所述输入特征。

作为本发明进一步的改进，将原始特征转化为输入特征包括：

对原始特征中的所有类别型特征进行字典构建，并经过映射得到每个类别型特征对应字典的索引；

对原始特征中的所有数值型特征进行分桶处理，并经过映射后得到每个数值型特征所属桶的索引；

将索引化后的类别型特征和数值型特征转化为独热编码向量。

作为本发明进一步的改进，根据输入特征分别提取求职者特征信息和招聘者特征信息包括：

获取对应输入特征的可学习稠密向量，并对同一输入特征进行特征交互，得到交互后的多个特征融合向量。

作为本发明进一步的改进，采用混合专家模型进行特征交互，通过多个专家对同一输入特征进行各自独立的非线性特征交互，得到多个交互后的特征融合向量。

作为本发明进一步的改进，所述特征分配包括特征聚合和特征自适应选择分配，将提取到的所述求职者特征信息和所述招聘者特征信息进行特征聚合，并通过神经网络自适应学习权重，并分配所述聚合后的特征信息分别进行求职者多行为编码和招聘者多行为编码；

作为本发明进一步的改进，所述多行为编码包括求职者多阶段行为编码和招聘者多阶段行为编码，所述求职者多阶段行为编码和所述招聘者多阶段行为编码相互独立；

求职者多阶段行为编码根据求职者特征信息对求职者的多个行为进行独立编码，并为求职者的每个行为生成对应的行为概率值；

招聘者多行为编码根据招聘者特征信息对招聘者的多个行为进行独立编码，并为招聘者的每个行为生成对应的行为概率值。

作为本发明进一步的改进，所述根据所述求职者行为概率值和所述招聘者行为概率值计算输出求职者与招聘者双向匹配结果包括：

上一行为对应的行为概率值与当前行为对应的行为概率值通过条件概率公式进行乘法运算得到第一条件概率值，所述第一条件概率值用于输入至当前行为对应的二分类损失函数中进行计算以输出当前行为对应的分类结果，第一条件概率值与下一行为对应的行为概率值通过条件概率公式进行乘法运算得到第二条件概率值，所述第二条件概率值用于下一次乘法运算，直至所述输出模块输出最终的分类结果，其中，所述上一行为、所述当前行为和所述下一行为均为多个求职者行为和多个招聘者行为中的一个行为，所述最终的分类结果表示求职者与招聘者双向匹配结果。

本发明的有益效果为：采用求职者和招聘者相互独立的特征提取方式，支持两个输入特征形态迥异，且偏好各自独立的用户群体进行互不影响的独立提取特征信息，通过各自独立的用户编码模型，以及通过自适应学习权重，分配到各自行为编码模型中，使得求职者和招聘者双方各自的行为合理，并充分利用了双方的特征信息，满足了对求职者和招聘者双方独立偏好同时考量的需求，避免了普通推荐系统仅重视单方面偏好导致的高单向匹配、低双向匹配问题，提高了求职者与招聘者之间相互匹配的准确度和效率。

求职者和招聘者双方偏好概率化后，通过条件概率公式，以乘积的方式，并最大化的利用求职者和招聘者的多阶段行为的编码信息，实现了互惠推荐中互惠性质的表达；并且由于多阶段行为的存在，因此输出为多维向量，同时采用多任务模型，匹配行为的前置行为被设计为辅助任务以强化匹配预测主任务的学习，使得双向推荐行为更合理和准确，提高了求职者与招聘者之间互惠匹配的高准度预测。

附图说明

图1为本发明实施例所述的一种用于在线招聘的双向推荐系统的流程示意图；

图2为本发明实施例所述的一种用于在线招聘的双向推荐系统的结构示意图；

图3为本发明实施例所述的一种用于在线招聘的双向推荐系统的专家混合模型图；

图4为本发明实施例所述的一种用于在线招聘的双向推荐系统的运用在线招聘平台上的流程示意图；

图5为本发明实施例所述的一种用于在线招聘的双向推荐方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对发明开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

需要说明，若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……)，则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

另外，在本发明的描述中，所用术语仅用于说明目的，并非旨在限制本公开的范围。术语“包括”和/或“包含”用于指定元件、步骤、操作和/或组件的存在，但并不排除存在或添加一个或多个其他元件、步骤、操作和/或组件的情况。术语“第一”、“第二”等可能用于描述各种元件，不代表顺序，且不对这些元件起限定作用。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个及两个以上。这些术语仅用于区分一个元素和另一个元素。结合以下附图，这些和/或其他方面变得显而易见，并且，本领域普通技术人员更容易理解关于本发明实施例的说明。附图仅出于说明的目的用来描绘本公开实施例。本领域技术人员将很容易地从以下说明中认识到，在不背离本公开原理的情况下，可以采用本发明所示结构和方法的替代实施例。

本发明实施例所述的一种用于在线招聘的双向推荐系统，如图1所示，该系统包括：输入模块、求职者特征提取模块、招聘者特征提取模块、特征分配模块、求职者多阶段行为编码模块、招聘者多阶段行为编码模块和输出模块；其中，

输入模块将原始特征转化后得到输入特征，并分别将输入特征输入到求职者特征提取模块和招聘者特征提取模块；原始特征为与求职者的求职行为和招聘者的招聘行为相关的特征；

求职者特征提取模块和招聘者特征提取模块分别从所述输入特征中提取求职者特征信息和招聘者特征信息，求职者特征提取和招聘者特征提取相互独立，互不影响，求职者特征提取模块提取求职者特征信息，招聘者特征提取模块提取招聘者特征信息；

特征分配模块将提取到的求职者特征信息和招聘者特征信息进行特征聚合，将聚合后的特征信息分配到求职者多阶段行为编码模块和招聘者多阶段行为编码模块；

求职者多阶段行为编码模块对聚合后的特征信息进行处理，生成多个求职者行为概率值；招聘者多阶段行为编码模块对聚合后的特征信息进行处理，生成多个招聘者行为概率值，每个行为概率值均代表当前行为在上一行为发生的条件下预测得到的发生概率，其中当前行为可以是求职者行为或招聘者行为，上一行为可以是求职者行为或招聘者行为。

输出模块根据多个求职者行为概率值和多个招聘者行为概率值计算输出求职者与招聘者双向匹配结果。

一种可选的实施方式，输入模块对原始特征进行处理，原始特征包括求职者属性信息、求职者偏好信息、招聘者属性信息、招聘者偏好信息、求职者与招聘者交互信息以及环境信息，所有原始特征可分为类别型特征与数值型特征。

一种可选的实施方式，输入模块将原始特征转化为独热编码向量，并将独热编码向量作为输入特征分别输入到求职者特征提取模块与招聘者特征提取模块中以供所述求职者特征提取模块和招聘者特征提取模块进行特征提取。

输入模块将原始特征转化为独热编码向量包括：输入模块对所有类别型特征进行字典构建，并经过映射得到每个类别型特征对应字典的索引；输入模块对所有数值型特征进行分桶处理，分桶处理可采用等频率分桶，分桶数量根据不同特征各自设定，并经过映射后得到每个数值型特征所属桶的索引；输入模块将索引化后的类别型特征和数值型特征转化为独热编码向量，同时转化后的独热编码向量分别输入到求职者特征提取模块与招聘者特征提取模块进行处理。

一种可选的实施方式，如图2所示，求职者特征提取模块和招聘者特征提取模块的结构相同且独立运行，均包括特征嵌入层和特征交互层，

特征嵌入层输出对应输入特征的可学习稠密向量，并将得到的可学习稠密向量输入到特征交互层；特征嵌入层可以设计为n个key-value字典，key是对应的n个输入特征，value是统一维度可学习稠密向量。输入模块提供的独热编码向量在特征嵌入层中，通过key查询，返回对应value的学习稠密向量，输入到下游特征交互层。

特征交互层对同一输入特征进行特征交互，得到交互后的多个特征融合向量，并将多个特征融合向量输出到特征分配模块，所述多个特征融合向量用于表示求职者特征信息和招聘者特征信息。

进一步的，为了实现求职者与招聘者特征交互编码后可以共享给下游的求职者多阶段行为编码模块和招聘者多阶段行为编码模块自适应学习权重进行配比，特征交互层采用混合专家模型，通过多个专家对同一输入特征进行各自独立的非线性特征交互，得到交互后的多个特征融合向量。

特征交互层例如采用MoE的方式，MoE结构如图3所示，通过多个专家模型自适应地独立学习求职者与招聘者的特征提取，并通过多个门模型结构对下游的子任务进行自适应权重分配的学习。

一种可选的实施方式，特征分配模块包括特征聚合层和特征自适应选择器，特征聚合层将提取到的求职者特征信息和招聘者特征信息进行特征聚合，得到聚合后的特征信息，并将聚合后的特征信息输入到特征自适应选择器；特征自适应选择器通过神经网络自适应学习权重，并分配聚合后的特征信息到求职者多阶段行为编码模块和招聘者多阶段行为编码模块。

一种可选的实施方式，如图2所示，求职者多阶段行为编码模块和招聘者多阶段行为编码模块的结构相同且独立运行；

求职者多阶段行为编码模块包括求职者多行为编码隐层，求职者多行为编码隐层根据求职者特征信息对求职者的多个行为进行独立编码，对于每一个求职者的n个行为，有n个独立的多行为编码结构，自适应地学习权重，并为求职者的每个行为生成对应的行为概率值；

招聘者多阶段行为编码模块包括招聘者多行为编码隐层，对于每一个招聘者的m个行为，有m个独立的多行为编码结构，自适应地学习权重，招聘者多行为编码隐层根据招聘者特征信息对招聘者的多个行为进行独立编码，并为招聘者的每个行为生成对应的行为概率值。

其中，求职者多阶段行为编码模块包括求职者多行为编码隐层的处理过程例如采用以下方式：配比上游输入的来自求职者特征编码模块的特征融合向量，加权融合后进入到使用ReLU作为激活函数的n个三层前馈神经网络，最后通过Sigmoid激活函数，输出代表对应的n个行为分别在前一个行为发生后发生的概率。相应的，招聘者多阶段行为编码模块包括招聘则多行为编码隐层的处理过程例如采用以下方式：配比上游输入的来自招聘者特征编码模块的特征融合向量，加权融合后进入到使用ReLU作为激活函数的m个三层前馈神经网络，最后通过Sigmoid激活函数，输出代表对应的m个行为分别在前一个行为发生后发生的概率。

例如，如图2所示，对于求职者的n个行为，求职者多行为编码隐层分别输出n个行为概率值，其中第1行为概率值对应求职者行为P1在该行为P1的前一个行为发生后发生的概率，第2行为概率值对应求职者行为P2在该行为P2的前一个行为发生后发生的概率，……，第i行为概率值对应求职者行为Pi在该行为Pi的前一个行为发生后发生的概率，第n行为概率值对应求职者行为Pn在该行为Pn的前一个行为发生后发生的概率，其中i表示求职者的行为编号。相应的，对于招聘者的m个行为，招聘者多行为编码隐层分别输出m个行为概率值，其中第1行为概率值对应招聘者行为P1在该行为P1的前一个行为发生后发生的概率，第2行为概率值对应招聘者行为P2在该行为P2的前一个行为发生后发生的概率，……，第i行为概率值对应招聘者行为Pi在该行为Pi的前一个行为发生后发生的概率，第n行为概率值对应招聘者行为Pn在该行为Pn的前一个行为发生后发生的概率，其中i表示招聘者的行为编号。

一种可选的实施方式，上一行为对应的行为概率值与当前行为对应的行为概率值通过条件概率公式进行乘法运算得到第一条件概率值，所述第一条件概率值用于输入至当前行为对应的二分类损失函数中进行计算以输出当前行为对应的分类结果，第一条件概率值与下一行为对应的行为概率值通过条件概率公式进行乘法运算得到第二条件概率值，所述第二条件概率值用于下一次乘法运算，直至所述输出模块输出最终的分类结果，其中，所述上一行为、所述当前行为和所述下一行为均为多个求职者行为和多个招聘者行为中的一个行为，所述最终的分类结果表示求职者与招聘者双向匹配结果。

输出模块将求职者行为概率值和招聘者行为概率值通过条件概率公式进行乘法运算，并输入到各行为对应的二分类损失函数中进行计算，最后输出求职者与招聘者双向匹配结果。通过两个用户行为之间的乘法运算，提供能够诠释求职者-招聘者互惠性质的主任务表达和辅助任务表达。

例如，如图2所示，输出模块用于：

将求职者行为P1对应的行为概率值输入至该行为P1对应的二分类损失函数即P1二分类Loss中进行计算；

将求职者行为P1对应的行为概率值和求职者行为P2对应的行为概率值通过条件概率公式进行乘法运算得到条件概率值p

将条件概率值p

……，

条件概率值p

……，

条件概率值p

条件概率值r

……，

条件概率值r

……，

条件概率值r

一种可选的实施方式，该系统运用的一种在线招聘场景具体流程如图4所示，求职者向本发明任意实施例提供的推荐系统发送请求推荐服务，该系统向求职者提供推荐列表，求职者浏览该系统提供的推荐列表，求职者基于推荐列表浏览岗位或申请岗位，同时在线招聘平台记录求职者浏览推荐列表并申请岗位的多阶段的多个行为数据，申请岗位的求职者组成候选人列表，招聘者浏览候选人列表，与此同时在线招聘平台记录招聘者浏览候选人并接收申请的多阶段的多个行为数据。在线招聘平台将记录的求职者和招聘者行为数据导入到多任务模型中进行模型训练，并将模型训练结果应用到本发明的双向推荐系统中，进一步提高系统的匹配准确度。

本发明实施例所述的一种用于在线招聘的双向推荐方法，如图5所示，该方法包括：

特征输入，将原始特征转化为输入特征，原始特征为与求职者的求职行为相关和招聘者的招聘行为相关的特征，所述原始特征为与求职者的求职行为和招聘者的招聘行为相关的特征；

特征提取，根据输入特征分别提取求职者特征信息和招聘者特征信息；

特征分配，将求职者特征信息和招聘者特征信息进行特征聚合，并分配聚合后的特征信息；

多阶段行为编码，对聚合后的特征信息进行编码处理，并生成多个求职者行为概率值和多个招聘者行为概率值；每个行为概率值代表该阶段在前一阶段发生的条件下的预测发生概率。

结果输出，根据所述多个求职者行为概率值和所述多个招聘者行为概率值计算输出求职者与招聘者双向匹配结果。

一种可选的实施方式，原始特征包括求职者属性信息、求职者偏好信息、招聘者属性信息、招聘者偏好信息、求职者与招聘者交互信息以及环境信息，所有原始特征可分为类别型特征与数值型特征。对所有类别型特征进行字典构建，并经过映射得到每个类别型特征对应字典的索引；对所有数值型特征进行分桶处理，并经过映射后得到每个数值型特征所属桶的索引，将索引化后的类别型特征和数值型特征转化为独热编码向量并用于特征提取。

一种可选的实施方式，求职者特征提取和招聘者特征提取独立进行特征嵌入向量化和特征交互，特征交互采用混合专家模型，通过多个专家对同一输入特征进行各自独立的非线性特征交互，得到交互后的多个特征融合向量，并基于特征融合向量，通过神经网络自适应学习权重，分配特征信息到多行为编码隐层进行多阶段行为编码，生成多个行为对应的多个行为概率值，每个行为概率值代表该阶段在前一阶段发生的条件下的预测发生概率。将代表多行为预测发生概率的多个行为概率值通过条件概率公式进行乘法运算，并输入到各行为对应的二分类损失函数中进行计算；通过两个用户行为之间的乘法运算，建立以求职者/招聘者行为的乘积为形式的互惠性质表达。

即，本领域技术人员可以理解，实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备（可以是单片机，芯片等）或处理器（processor）执行本申请各实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-OnlyMemory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

此外，本领域普通技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本领域技术人员应理解，尽管已经参考示例性实施例描述了本发明，但是在不脱离本发明的范围的情况下，可进行各种改变并可用等同物替换其元件。另外，在不脱离本发明的实质范围的情况下，可进行许多修改以使特定情况或材料适应本发明的教导。因此，本发明不限于所公开的特定实施例，而是本发明将包括落入所附权利要求范围内的所有实施例。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：胡骁;程远;王悦;祝恒书;
专利申请人：北京华品博睿网络技术有限公司;