掌桥专利:专业的专利平台
掌桥专利
首页

一种基于知识图谱的职业推荐方法

文献发布时间:2024-04-18 20:02:18


一种基于知识图谱的职业推荐方法

技术领域

本发明一般地涉及数据处理技术领域。更具体地,本发明涉及一种基于知识图谱的职业推荐方法。

背景技术

职业规划是指个人在职业发展过程中,通过制定目标、采取行动和做出决策,以达到职业生涯的成功和满意。随着社会经济的不断发展和职业结构的不断变化,职业规划对于个人的职业成功愈发重要。然而,由于职业信息庞杂、个人能力与兴趣不同、未来预测困难等原因,许多人在职业规划过程中面临困惑和挑战。现有的职业推荐方法通常是个人根据自己目前的学历和专业通过互联网搜索海量的岗位信息,通过人为分析各个岗位对应的要求,来规划自己未来的职业,该种方法费时费力,且做出的职业规划可能存在由于不合适,而导致职业满意度和成功率较低。

知识图谱(Knowledge Graph)是一种表示和展示知识的结构化工具,由节点(实体)和边(关系)组成,节点代表实体,边代表实体之间的关系,并利用可视化技术将知识以图形化的方式呈现出来,以帮助用户更好地理解和利用知识。知识图谱旨在描述客观世界中的概念、实体、事件及其之间的关系,是一种先进的技术手段,可用来对各种知识进行储存和管理,并对各种知识进行直观地展示,因此为了提高职业规划的效率,可采用知识图谱自动进行职业规划。在对个人进行职业规划时,可采用知识图谱将海量的职业信息进行整合、关联和分析,为个人提供更加准确、全面的职业规划建议。

发明内容

为解决上述一个或多个技术问题,本发明在如下的方面中提供方案。

在第一方面中,本发明提供了一种基于知识图谱的职业推荐方法,包括:依据就业者的职业信息构建知识图谱,所述职业信息包含年龄、专业、学历、职业类型和对应的岗位要求;基于所述知识图谱并结合目标人员未来可能从事的职业以及对应的岗位要求生成职业路径,并获取每条职业路径经过的节点;所述职业路径中的各个节点分别表示目标人员从事对应的职业需达到的各种岗位要求;获取每条职业路径中各个节点到其下游节点就业者花费的时间并结合目标人员的学习能力值计算职业路径中从各个节点到其相邻下游节点目标人员需花费的时间;对于每条职业路径,依据所述知识图谱中各个节点的相邻上游节点和相邻下游节点计算职业路径的相邻节点之间的通过率;依据所述通过率、所述花费的时间以及职业路径中节点数计算每条职业路径所需的成本,并将成本最小的职业路径推荐给目标人员。

在一个实施例中,所述计算职业路径中从各个节点到其相邻下游节点目标人员需花费的时间包括:依据职业路径中各个节点到其下游节点就业者花费的时间建立累积概率密度函数;所述累积概率密度函数的自变量为某一节点到其下游节点就业者花费的时间,因变量为该时间对应的累积概率;对于每条职业路径,依据所述累积概率密度函数的反函数和目标人员的学习能力值计算出职业路径中从各个节点到其相邻下游节点目标人员需花费的时间。

在一个实施例中,从职业路径中一个节点到其相邻下游节点目标人员需花费的时间与所述累积概率密度函数的反函数值呈正相关,与目标人员的学习能力值呈负相关。

在一个实施例中,对于职业路径中相邻的节点k和节点k+1,从节点k到节点k+1,目标人员需花费的时间计算表达式为:

其中,

在一个实施例中,目标人员未来可能从事的职业获取方法包括:

获取目标人员的职业信息,计算目标人员的职业数据和所有就业者中每个人员的职业数据的相似度,相似度计算公式如下:

式中,

从计算的所有相似度中确定出数值最大的相似度,并将数值最大的相似度对应的就业者所从事过的职业作为目标人员未来可能从事的职业。

在一个实施例中,所述目标人员的学习能力值的计算方法包括:

根据就业者的职业数据中和学习能力相关的数据建立学习能力高斯函数Gus,所述学习能力高斯函数的自变量为学习能力值,因变量为该学习能力值出现的概率;

依据目标人员的上学时间和所述学习能力高斯函数计算目标人员的学习能力值,其计算表达式为:

其中,

在一个实施例中,若职业路径中节点A的下游相邻节点为节点B,所述计算职业路径的相邻节点之间的通过率包括:

获取知识图谱中D节点的所有相邻上游节点以及D节点的所有相邻下游节点,然后分别计算其每个相邻上游节点对应的职业数据包含D节点的概率并将其记为上游节点包含概率,以及D节点对应的职业数据包含其各个相邻下游节点的概率并将其记为下游节点包含概率;

各个上游节点包含概率的和与各个下游节点包含概率的和相乘即得A节点到D节点的通过率。

在一个实施例中,对于某条职业路径,计算其所需的成本包括:分别计算各对相邻节点对应的成本,然后将各对相邻节点对应的成本相加即得该条职业路径所需的成本;对于相邻节点来说,其对应的成本与该对相邻节点对应的通过率成反比,与该对相邻节点对应的花费的时间成正比。

在一个实施例中,所述职业路径所需的成本的计算表达式为:

其中,

本发明的技术效果为:本发明的基于知识图谱的职业推荐方法在为目标人员进行职业规划时,首先通过收集人们的职业信息构建职业知识图谱,根据目标人员和就业者职业信息的相似度,得到目标人员可能的职业路径,根据目标人员和就业者职业信息中和学习相关的信息计算出目标人员的学习能力值,再计算出目标人员通过路径上每个节点的时间和通过率,最终计算出每条可能的职业路径的成本,根据成本的高低向目标人员进行职业规划,由于在进行职业规划时考虑到了目标人员的学习能力以及目标人员和就业者的职业相似度且自动进行职业规划,无需人为参与,因此采用本发明的基于知识图谱的职业推荐方法可以大大提高职业规划的效率和合理性,自动为目标人员匹配职业并推荐最优的职业规划结果。

附图说明

通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:

图1是示意性示出本发明的实施例的基于知识图谱的职业推荐方法流程图;

图2是示意性示出本发明的实施例的构建的知识图谱的部分示意图;

图3是示意性示出本发明的实施例的节点关系示意图;

图4是示意性示出本发明的实施例的目标人员需花费的时间计算方法流程图;

图5是示意性示出本发明的实施例的生成的职业路径示意图;

图6是示意性示出本发明的实施例的目标人员未来可能从事的职业获取方法流程图;

图7是示意性示出本发明的实施例的目标人员的学习能力值的计算方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面结合附图来详细描述本发明的具体实施方式。

基于知识图谱的职业推荐方法实施例:

如图1所示,本发明的基于知识图谱的职业推荐方法,包括:

S101、依据就业者的职业信息构建知识图谱,所述职业信息包含年龄、专业、学历、职业类型和对应的岗位要求。

所述就业者包括各个行业各种岗位的多个工作人员,优选地,多种职业包含当前社会中各种热门职业,例如教师、医生、建筑工人、造价师、电气工程师、程序员、公务员、事业单位工作人员、销售顾问、律师、会计师等职业。学历可以包括高中、大专、本科以及研究生。职业类型包含各个行业的职业,例如可以包括教育行业、医疗行业、金融行业、法律行业、建筑行业等。职业类型可以包括教师、医生、会计、工程造价师、律师以及人力资源等。岗位要求包括对年龄范围、学历、专业以及各种技能证书的要求。技能证书例如会计证、律师资格证等。

如图2所示,构建的知识图谱中是以就业者为实体,以年龄、专业、学历、职业类型和对应的岗位要求为属性,以各个属性对应的具体信息为属性值。例如:对于属性“年龄”,若其对应的信息为23岁,则该属性对应的属性值为“23岁”,对于属性“学历”,若其对应的信息为“高中”,则该属性对应的属性值为“高中”。

在本实施例中职业信息包含年龄、专业、学历、职业类型和对应的岗位要求,在其他实施例中,知识图谱中的节点还可以包含薪资和公司类型等。

S102、生成职业路径,并获取每条职业路径经过的节点,具体为:基于所述知识图谱并结合目标人员未来可能从事的职业以及对应的岗位要求生成职业路径,并获取每条职业路径经过的节点;所述职业路径中的各个节点分别表示目标人员从事对应的职业需达到的各种岗位要求。

例如:若目标人员未来可能从事的职业为教师,教师的岗位要求为本科毕业、持有教师资格证,目标人员当前学历为高中,则生成的职业路径为高中至本科毕业,本科毕业至持有教师资格证。

S103、计算职业路径中从各个节点到其相邻下游节点目标人员需花费的时间,具体为:获取每条职业路径中各个节点到其下游节点就业者花费的时间并结合目标人员的学习能力值计算职业路径中从各个节点到其相邻下游节点目标人员需花费的时间;

通常情况下,目标人员的学习能力越强,其达到一项岗位要求的速度会越快,因此其从一个节点到相邻的下一个节点花费的时间会越短;若就业者从该节点到相邻的下一个节点花费的时间较长,则目标人员也会花费较长的时间。因此,职业路径中从各个节点到其相邻下游节点目标人员需花费的时间可依据就业者花费的时间和目标人员的学习能力值进行计算。

S104、对于每条职业路径,依据所述知识图谱中各个节点的相邻上游节点和相邻下游节点计算职业路径的相邻节点之间的通过率。

对于某一对相邻节点A和D来说,假设在职业路径中D节点是A节点的下游节点,可首先获取知识图谱中D节点的所有相邻上游节点以及D节点的所有相邻下游节点,然后分别计算其每个相邻上游节点对应的职业数据包含D节点的概率并将其记为上游节点包含概率,以及D节点对应的职业数据包含其各个相邻下游节点的概率并将其记为下游节点包含概率,依据所有的上游节点包含概率和下游节点包含概率计算A节点到D节点的通过率。各个上游节点包含概率的和与各个下游节点包含概率的和相乘即得A节点到D节点的通过率。

例如:如图3所示,假设D节点的相邻上游节点为A节点和B节点,D节点的相邻下游节点为C节点,则A节点到D节点的通过率的计算表达式为:

(1)

式中,

S105、依据所述通过率、所述花费的时间以及职业路径中节点数计算每条职业路径所需的成本,并将成本最小的职业路径推荐给目标人员。

对于某条职业路径来说,可分别计算各对相邻节点对应的成本,然后将各对相邻节点对应的成本相加即得该条职业路径所需的成本。对于某对相邻节点来说,其对应的成本与该对相邻节点对应的通过率成反比,与该对相邻节点对应的花费的时间成正比。

假设职业路径中有k个须通过的节点,则职业路径所需的成本的计算表达式为:

(2)

其中,

本发明的基于知识图谱的职业推荐方法在为目标人员进行职业规划时,首先通过收集人们的职业信息构建职业知识图谱,根据目标人员和就业者职业信息的相似度,得到目标人员可能的职业路径,根据目标人员和就业者职业信息中和学习相关的信息计算出目标人员的学习能力值,再计算出目标人员通过路径上每个节点的时间和通过率,最终计算出每条可能的职业路径的成本,根据成本的高低向目标人员进行职业规划,由于在进行职业规划时考虑到了目标人员的学习能力以及目标人员和就业者的职业相似度且自动进行职业规划,无需人为参与,因此采用本发明的基于知识图谱的职业推荐方法可以大大提高职业规划的效率和合理性,自动为目标人员匹配职业并推荐最优的职业规划结果。

由以上实施例可知,对职业路径中从各个节点到其相邻下游节点目标人员需花费的时间的计算需依据职业路径中各个节点到其下游节点就业者花费的时间和目标人员的学习能力值,如图4所示,在一个实施例中,所述计算职业路径中从各个节点到其相邻下游节点目标人员需花费的时间包括:

S401、建立累积概率密度函数,具体为:依据所述知识图谱获取每条职业路径中各个节点到其下游节点就业者花费的时间,进而依据所述就业者花费的时间建立累积概率密度函数;所述累积概率密度函数的自变量为某一节点到其下游节点就业者花费的时间,因变量为该时间对应的累积概率。

如图5所示,例如目标人员目前是一个高中学生,其未来可能从事职业为会计,会计的岗位要求为学历是本科毕业、需要持有初级会计证、中级会计证、普通话证,则生成的职业路径可以为,高中至大学,大学至持有初级会计证,持有初级会计证至持有中级会计证,持有中级会计证至持有普通话证。在其它实施例中的职业路径中,持有普通话证也可以排在持有初级会计证之前或持有中级会计证与持有初级会计证之间。

建立的累积概率密度函数共有四个,其中第一个累积概率密度函数的自变量为高中至大学所花费的时间,第二个累积概率密度函数的自变量为大学至持有初级会计证所花费的时间,第三个累积概率密度函数的自变量为持有初级会计证至持有中级会计证所花费的时间,第四个累积概率密度函数的自变量为持有中级会计证至持有普通话证所花费的时间。

若从事会计职业的历史人物中有五个从事过会计职业,其中有三个人从高中至大学所花费的时间为3年,有两个人从高中至大学所花费的时间为4年,则对于第一个累积概率密度函数来说自变量取3时对应的因变量取值为3/5,自变量取4对应的因变量取值为2/5。假设五个人中有两个人从大学入学至持有初级会计证所花费的时间为5年,有三个人从大学入学至持有初级会计证所花费的时间为6年,则对于第二个累积概率密度函数来说,自变量取5时对应的因变量取值为2/5,自变量取6时对应的因变量取值为3/5。假设五个人中有一个人从持有初级会计证至持有中级会计证所花的时间为2年,有四个人从持有初级会计证至持有中级会计证所花的时间为3年,则对于第三个累积概率密度函数来说,自变量取2时对应的因变量取值为1/5,自变量取3时,对应的因变量取4/5。假设五个人中有四个人从持有中级会计证至持有普通话证所花的时间为1年,有一人从持有中级会计证至持有普通话证所花的时间为2年,则对于第四个累积概率密度函数来说,自变量取1时对应的因变量取值为4/5,自变量取2时,对应的因变量取值为1/5。

S402、计算职业路径中各个节点到其相邻下游节点目标人员需花费的时间,具体为:对于每条职业路径,依据所述累积概率密度函数的反函数值和目标人员的学习能力值计算从各个节点到其相邻下游节点目标人员需花费的时间。

由以上实施例可知,从职业路径中一个节点到其相邻下游节点目标人员需花费的时间与所述累积概率密度函数的反函数值呈正相关,与目标人员的学习能力值呈负相关。在一个实施例中,对于职业路径中相邻的节点k和节点k+1,从节点k到节点k+1,目标人员需花费的时间计算表达式为:

(3)

其中,

由以上实施例可知,在生成职业路径时需依据目标人员未来可能从事的职业,在一个实施例中,如图6所示,目标人员未来可能从事的职业获取方法包括:

S601、获取目标人员的职业信息,计算目标人员的职业数据和所有就业者中每个人员的职业数据的相似度,相似度计算公式如下:

(4)

式中,

对于不包含数值的属性值,可以对其赋值,例如:若属性为学历,属性值为高中,则可对其赋值1,属性值为大学本科,可对其赋值2,属性值为研究生,可对其赋值3。

S602、从计算的所有相似度中确定出数值最大的相似度,并将数值最大的相似度对应的就业者所从事过的职业作为目标人员未来可能从事的职业。

由以上实施例可知,对于每条职业路径,需要依据目标人员的学习能力值计算从各个节点到其相邻下游节点目标人员需花费的时间,在一个实施例中,如图7所示,目标人员的学习能力值的计算方法包括:

S701、建立学习能力高斯函数,具体为:根据就业者的职业数据中和学习能力相关的数据建立学习能力高斯函数Gus,所述学习能力高斯函数的自变量为学习能力值,因变量为该学习能力值出现的概率。

和学习能力相关的数据包含学历、上学时间、取得奖状的次数、取得奖学金的次数等。在建立学习能力高斯函数Gus时可仅依据以上一种类型的数据,也可结合多种类型的数据。若仅依据学历构建学习能力高斯函数Gus,则需依据学历高低,对就业者的学历进行赋值,以学历对应的数值为自变量,例如学历为高中,则学历对应的数值为1,学历为大学,则学历对应的数值为2,学历为研究生,则学历对应的数值为3。学习能力值出现的概率是指,在所有就业者中,达到该学习能力值的就业者占就业者总数的比例。

S702、依据目标人员的上学时间和所述学习能力高斯函数计算目标人员的学习能力值,其计算表达式为:

(5)

其中,

在本说明书的描述中,“多个”、“若干个”的含义是至少两个,例如两个,三个或更多个等,除非另有明确具体的限定。

虽然本说明书已经示出和描述了本发明的多个实施例,但对于本领域技术人员显而易见的是,这样的实施例只是以示例的方式提供的。本领域技术人员会在不偏离本发明思想和精神的情况下想到许多更改、改变和替代的方式。应当理解的是在实践本发明的过程中,可以采用对本文所描述的本发明实施例的各种替代方案。

相关技术
  • 一种基于知识图谱的配乐推荐方法及电子设备
  • 一种基于知识图谱的推荐方法及装置
  • 一种基于知识图谱解耦的推荐系统及其推荐方法
  • 基于知识图谱的常见职业病风险预测方法
技术分类

06120116577632