掌桥专利:专业的专利平台
掌桥专利
首页

一种基于大数据的人才信息分析管理方法、系统及装置

文献发布时间:2024-04-18 19:58:21


一种基于大数据的人才信息分析管理方法、系统及装置

技术领域

本申请涉及数据处理领域,尤其涉及一种基于大数据的人才信息分析管理方法、系统及装置。

背景技术

当今社会,市场的竞争归根到底是人才的竞争,企业经营战略的各个阶 段都必须有适当的人才作为支撑。

目前,企业寻找与职位相匹配的人才主要是依赖服务平台的搜索功能或进行线下市场招聘收取求职者简历,对于求职者的人才信息需要人工进行筛选,花费大量的人力成本,并且最后的筛选结果也是较为粗略的结果,不能很好的给企业推荐人才。

发明内容

本申请提供了一种基于大数据的人才信息分析管理方法、系统及装置,用于自动确定与目标企业人才需求对应的目标人才,对于求职者的人才信息不需要人工进行筛选,减少人力成本,为企业精确提供人才推荐,提高用户体验。

本申请第一方面提供了一种基于大数据的人才信息分析管理方法,包括:

获取待分析人才的人才简历信息;

基于所述待分析人才的身份信息对所述人才简历信息进行身份确认;

在身份确认通过后,将所述人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,所述人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息,所述关键词提取过程包括:

基于NLP技术对特定的关键词进行提取,并将提取出的关键词与预先构建的词汇表进行字段匹配,得到对应的字段以及字段取值,通过数据结构对所述字段以及字段取值进行存储,得到所述人才数据信息,所述信息提取模型通过输入若干份人才简历信息样本预训练得到,所述特定的关键词包括关于身份信息、学历信息、工作履历信息、技能信息及求职意向信息的关键词;

将所述人才数据信息定向存储至人才信息管理数据库;

当确定目标企业存在人才需求时,确定所述目标企业的人才需求意向信息,并从所述人才信息管理数据库中获取若干个人才数据信息;

确定所述人才数据信息的第一特性及所述人才需求意向信息的第二特性,计算所述第一特性符合所述第二特性的符合值,并确定所述人才需求意向信息对所述第二特性的重视值,基于所述第一特性、所述第二特性、所述符合值及所述重视值利用数据匹配算法计算所述人才数据信息与所述人才需求意向信息的匹配度,所述第一特性包括第一身份、第一学历、第一工作履历、第一技能及第一求职意向,所述第二特性包括第二身份、第二学历、第二工作履历、第二技能及第二求职意向;

按照由高到低对所述匹配度进行排序,确定匹配级别,根据所述匹配级别确定目标人才。

可选地,所述基于所述待分析人才的身份信息对所述人才简历信息进行身份确认包括:

基于所述待分析人才的身份信息确定所述待分析人才的第一人脸图像;

将所述第一人脸图像和所述人才简历信息输入人脸判别模型,确定所述人才简历信息中包含的第二人脸图像,并提取所述第一人脸图像的第一人脸轮廓特征和所述第二人脸图像的第二人脸轮廓特征,提取所述第一人脸图像的第一人脸五官点特征和所述第二人脸图像的第二人脸五官点特征,所述人脸判别模型通过输入若干个人脸图像样本和人才简历信息样本预训练得到;

基于所述人脸判别模型的全连接层将所述第一人脸轮廓特征和所述第一人脸五官点特征组合成一组第一特征向量,将所述第二人脸轮廓特征和所述第二人脸五官点特征组合成一组第二特征向量;

将所述第一特征向量和所述第二特征向量输入所述人脸判别模型的softmax分类器,输出所述待分析人才的身份判别结果,根据所述身份判别结果对所述人才简历信息进行身份确认。

可选地,所述确定所述人才数据信息的第一特性及所述人才需求意向信息的第二特性,计算所述第一特性符合所述第二特性的符合值,并确定所述人才需求意向信息对所述第二特性的重视值,基于所述第一特性、所述第二特性、所述符合值及所述重视值利用数据匹配算法计算所述人才数据信息与所述人才需求意向信息的匹配度包括:

分别确定所述人才数据信息所对应人才的第一身份、第一学历、第一工作履历、第一技能及第一求职意向,并设i={1,2,3,4,5}分别表示所述第一身份、所述第一学历、所述第一工作履历、所述第一技能及所述第一求职意向这五个第一特性;

确定所述人才需求意向信息所对应人才需求的第二身份、第二学历、第二工作履历、第二技能及第二求职意向,并设j={1,2,3,4,5}分别表示所述第二身份、所述第二学历、所述第二工作履历、所述第二技能及所述第二求职意向这五个第二特性;

计算所述第一特性i中符合所述第二特性j的符合值,并确定所述人才需求意向信息对所述第二特性j的重视值;

基于数据匹配算法计算所述人才数据信息与所述人才需求意向信息的匹配度,其中,所述数据匹配算法为:

其中,P表示所述匹配度,u表示所述人才数据信息,v表示所述目标企业的人才需求意向信息,

其中,根据权重计算公式计算权重值

其中,N表示所述人才信息管理数据库中第一求职意向为第二求职意向的人才总数,

可选地,所述计算所述第一特性i中符合所述第二特性j的符合值包括:

构建特性关联词汇表,所述特性关联词汇表包括所述第一特性i、第二特性j及符合值;

使用所述特性关联词汇表对所述第一特性i和所述第二特性j进行检测,若所述第一特性i符合第二特性j,则将所述符合值赋值为1,若不符合,则对所述符合值赋值0。

可选地,在所述将所述人才数据信息定向存储至人才信息管理数据库之后,所述人才信息分析管理方法还包括:

对所述人才信息管理数据库中的人才数据信息进行标签定位,根据所述人才数据信息对应人才当前的工作状态将其标签定位为在职状态和/或自由状态;

所述从所述人才信息管理数据库中获取若干个人才数据信息包括:

从所述人才信息管理数据库中确定当前标签定位为自由状态的人才对应的人才数据信息,并获取所述人才数据信息。

可选地,所述根据所述匹配级别确定目标人才包括:

筛选匹配级别高于预设阈值的人才,并将所述人才确定为目标人才,向所述目标企业的招聘端定向推送所述目标人才的人才数据信息。

可选地,所述将所述人才数据信息定向存储至人才信息管理数据库包括:

将所述人才数据信息进行结构化处理,以json格式定向存储至人才信息管理数据库中。

可选地,所述将所述人才数据信息定向存储至人才信息管理数据库包括:

在人才信息管理数据库中设置当前待存储的人才信息存储限值;

判断所述人才数据信息所包括的身份信息、学历信息、工作履历信息、技能信息及求职意向信息这五大特性是否达到所述人才信息存储限值;

若是,则将所述人才数据信息定向存储至所述人才信息管理数据库的第一梯度人才库;

若否,则将所述人才数据信息定向存储至所述人才信息管理数据库的备用人才库,并对所述人才数据信息进行标记。

本申请第二方面提供了一种基于大数据的人才信息分析管理系统,包括:

获取单元,用于获取待分析人才的人才简历信息;

确认单元,用于基于所述待分析人才的身份信息对所述人才简历信息进行身份确认;

第一确定单元,用于在身份确认通过后,将所述人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,所述人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息,所述关键词提取过程包括:

基于NLP技术对特定的关键词进行提取,并将提取出的关键词与预先构建的词汇表进行字段匹配,得到对应的字段以及字段取值,通过数据结构对所述字段以及字段取值进行存储,得到所述人才数据信息,所述信息提取模型通过输入若干份人才简历信息样本预训练得到,所述特定的关键词包括关于身份信息、学历信息、工作履历信息、技能信息及求职意向信息的关键词;

存储单元,用于将所述人才数据信息定向存储至人才信息管理数据库;

第二确定单元,用于当确定目标企业存在人才需求时,确定所述目标企业的人才需求意向信息,并从所述人才信息管理数据库中获取若干个人才数据信息;

匹配单元,用于确定所述人才数据信息的第一特性及所述人才需求意向信息的第二特性,计算所述第一特性符合所述第二特性的符合值,并确定所述人才需求意向信息对所述第二特性的重视值,基于所述第一特性、所述第二特性、所述符合值及所述重视值利用数据匹配算法计算所述人才数据信息与所述人才需求意向信息的匹配度,所述第一特性包括第一身份、第一学历、第一工作履历、第一技能及第一求职意向,所述第二特性包括第二身份、第二学历、第二工作履历、第二技能及第二求职意向;

第三确定单元,用于按照由高到低对所述匹配度进行排序,确定匹配级别,根据所述匹配级别确定目标人才。

可选地,所述确认单元具体用于基于所述待分析人才的身份信息确定所述待分析人才的第一人脸图像;

将所述第一人脸图像和所述人才简历信息输入人脸判别模型,确定所述人才简历信息中包含的第二人脸图像,并提取所述第一人脸图像的第一人脸轮廓特征和所述第二人脸图像的第二人脸轮廓特征,提取所述第一人脸图像的第一人脸五官点特征和所述第二人脸图像的第二人脸五官点特征,所述人脸判别模型通过输入若干个人脸图像样本和人才简历信息样本预训练得到;

基于所述人脸判别模型的全连接层将所述第一人脸轮廓特征和所述第一人脸五官点特征组合成一组第一特征向量,将所述第二人脸轮廓特征和所述第二人脸五官点特征组合成一组第二特征向量;

将所述第一特征向量和所述第二特征向量输入所述人脸判别模型的softmax分类器,输出所述待分析人才的身份判别结果,根据所述身份判别结果对所述人才简历信息进行身份确认。

可选地,所述匹配单元具体用于分别确定所述人才数据信息所对应人才的第一身份、第一学历、第一工作履历、第一技能及第一求职意向,并设i={1,2,3,4,5}分别表示所述第一身份、所述第一学历、所述第一工作履历、所述第一技能及所述第一求职意向这五个第一特性;

确定所述人才需求意向信息所对应人才需求的第二身份、第二学历、第二工作履历、第二技能及第二求职意向,并设j={1,2,3,4,5}分别表示所述第二身份、所述第二学历、所述第二工作履历、所述第二技能及所述第二求职意向这五个第二特性;

计算所述第一特性i中符合所述第二特性j的符合值,并确定所述人才需求意向信息对所述第二特性j的重视值;

基于数据匹配算法计算所述人才数据信息与所述人才需求意向信息的匹配度,其中,所述数据匹配算法为:

其中,P表示所述匹配度,u表示所述人才数据信息,v表示所述目标企业的人才需求意向信息,

其中,根据权重计算公式计算权重值

其中,N表示所述人才信息管理数据库中第一求职意向为第二求职意向的人才总数,

可选地,所述匹配单元具体用于构建特性关联词汇表,所述特性关联词汇表包括所述第一特性i、第二特性j及符合值;

使用所述特性关联词汇表对所述第一特性i和所述第二特性j进行检测,若所述第一特性i符合第二特性j,则将所述符合值赋值为1,若不符合,则对所述符合值赋值0。

可选地,所述人才信息分析管理系统还包括:

标签定位单元,用于对所述人才信息管理数据库中的人才数据信息进行标签定位,根据所述人才数据信息对应人才当前的工作状态将其标签定位为在职状态和/或自由状态;

所述第二确定单元具体用于从所述人才信息管理数据库中确定当前标签定位为自由状态的人才对应的人才数据信息,并获取所述人才数据信息。

可选地,所述第三确定单元具体用于筛选匹配级别高于预设阈值的人才,并将所述人才确定为目标人才,向所述目标企业的招聘端定向推送所述目标人才的人才数据信息。

可选地,所述存储单元具体用于将所述人才数据信息进行结构化处理,以json格式定向存储至人才信息管理数据库中。

可选地,所述存储单元具体用于在人才信息管理数据库中设置当前待存储的人才信息存储限值;

判断所述人才数据信息所包括的身份信息、学历信息、工作履历信息、技能信息及求职意向信息这五大特性是否达到所述人才信息存储限值;

若是,则将所述人才数据信息定向存储至所述人才信息管理数据库的第一梯度人才库;

若否,则将所述人才数据信息定向存储至所述人才信息管理数据库的备用人才库,并对所述人才数据信息进行标记。

本申请第三方面提供了一种基于大数据的人才信息分析管理装置,所述装置包括:

处理器、存储器、输入输出单元以及总线;

所述处理器与所述存储器、所述输入输出单元以及所述总线相连;

所述存储器保存有程序,所述处理器调用所述程序以执行第一方面以及第一方面中任一项可选的人才信息分析管理方法。

本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质上保存有程序,所述程序在计算机上执行时执行第一方面以及第一方面中任一项可选的人才信息分析管理方法。

从以上技术方案可以看出,本申请具有以下优点:

本申请方法通过获取待分析人才的人才简历信息;基于待分析人才的身份信息对人才简历信息进行身份确认;在身份确认通过后,将人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,该人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息;将人才数据信息定向存储至人才信息管理数据库;当确定目标企业存在人才需求时,确定目标企业的人才需求意向信息;从人才信息管理数据库中获取若干个人才数据信息,根据数据匹配算法计算若干个人才数据信息分别与人才需求意向信息的匹配度,并按照由高到低对匹配度进行排序,确定匹配级别,根据匹配级别确定目标人才,以使得自动确定与目标企业人才需求对应的目标人才,对于求职者的人才信息不需要人工进行筛选,减少人力成本,为企业精确提供人才推荐,提高用户体验。

需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。

附图说明

为了更清楚地说明本申请中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请提供的基于大数据的人才信息分析管理方法一个实施例流程示意图;

图2为本申请提供的基于大数据的人才信息分析管理方法另一个实施例流程示意图;

图3为本申请提供的基于大数据的人才信息分析管理系统一个实施例结构示意图;

图4为本申请提供的基于大数据的人才信息分析管理系统另一个实施例结构示意图;

图5为本申请提供的基于大数据的人才信息分析管理装置一个实施例结构示意图。

具体实施方式

本申请提供了一种基于大数据的人才信息分析管理方法、系统及装置,用于自动确定与目标企业人才需求对应的目标人才,对于求职者的人才信息不需要人工进行筛选,减少人力成本,为企业精确提供人才推荐,提高用户体验。

需要说明的是,本申请提供的基于大数据的人才信息分析管理方法,可以应用于终端,还可以应用于服务器上,例如终端可以是智能手机或电脑、平板电脑、智能电视、智能手表、便携计算机终端也可以是台式计算机等固定终端。为方便阐述,本申请中以终端为执行主体进行举例说明。

请参阅图1,图1为本申请提供的基于大数据的人才信息分析管理方法的一个实施例,该方法包括:

S101、获取待分析人才的人才简历信息;

终端根据大数据获取多个待分析人才的人才简历信息,该人才简历信息可以人才简历图像或人才简历文档的形式存在。具体地,终端可获取各招聘软件中投递到目标企业的待分析人才的人才简历信息,或获取各招聘软件中浏览过目标企业的待分析人才的人才简历信息,或获取目标企业线下招聘收取并存储到终端的待分析人才的人才简历信息,或基于大数据从其他方式获取各类人才的人才简历信息,此处不做限定。

S102、基于待分析人才的身份信息对人才简历信息进行身份确认;

终端在对该待分析人才进行人才信息分析管理之前,需要对该待分析人才进行身份确认,核实待分析人才的人才简历信息。具体地,可以获取待分析人才的身份信息,通过身份信息对人才简历信息进行身份核实,该身份信息为可唯一证明该待分析人才的信息,包括身份证、学信网信息等。需要说明的是,获取待分析人才的身份信息须经其本人同意或授权。例如,终端可以获取待分析人才的身份证,确定身份证图像,根据身份证图像和人才简历信息上包括的人脸图像进行身份核实。或者,获取待分析人才的学信网学历查询编码,根据学信网学历查询编码对人才简历信息上包括的学历信息进行学历核实,以确认该人才简历信息上包括的信息属于该待分析人才。或者,终端还可通过其他方式对该人才简历信息进行身份确认,此处不做限定。

S103、在身份确认通过后,将人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,该人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息,该关键词提取过程包括:基于NLP技术对特定的关键词进行提取,并将提取出的关键词与预先构建的词汇表进行字段匹配,得到对应的字段以及字段取值,通过数据结构对字段以及字段取值进行存储,得到人才数据信息,该信息提取模型通过输入若干份人才简历信息样本预训练得到;

终端将获取到的人才简历信息输入预先训练完成的信息提取模型进行关键词提取,确定该待分析人才的人才数据信息。其中,该人才数据信息包括身份信息,学历信息,工作履历信息,技能信息及求职意向信息,该身份信息可包括待分析人才的照片、姓名、性别、身份证号、联系方式、邮箱账号等信息,该学历信息包括学历等级、就读院校、专业等信息,该工作履历信息包括工龄、曾就业的公司,工作岗位、工作历史成就等信息,该技能信息包括特长、熟练技能及相应的技能证书等信息,该求职意向信息包括意向企业,意向岗位,意向薪资及福利,意向工作地点等信息。

具体地,该关键词提取过程包括以下步骤:

首先,将人才简历信息输入信息提取模型中,基于NLP技术对人才简历信息进行识别其中的关键词或短语,提取特定的关键词。其中,该特定的关键词包括关于(或触及)身份信息、学历信息、工作履历信息、技能信息及求职意向信息等信息的关键词。例如,可包括前述所提及的身份信息中的待分析人才的照片、姓名、性别、身份证号、联系方式、邮箱账号等信息,学历信息中的学历等级、就读院校、专业等信息,该工作履历信息中的工龄、曾就业的公司,工作岗位、工作历史成就等信息,该技能信息中的特长、熟练技能及相应的技能证书等信息,该求职意向信息中的意向企业,意向岗位,意向薪资及福利,意向工作地点等信息所对应的关键词。

然后,将提取出的关键词与数据库中预存的词汇表中含有的字段进行字段匹配,得到对应的字段以及字段取值,将提取的关键词填入词汇表中。该词汇表中的字段包括前述所提及的身份信息、学历信息、工作履历信息、技能信息及求职意向信息等信息包含的字段,该字段对应的字段取值通过NLP技术进行提取得到。

最后,将词汇表中的字段及字段取值存储至数据结构中,根据数据结构中的字段及字段取值确定并输出人才数据信息。

其中,该信息提取模型包括基于NLP技术的结构网络及以数据库为基础的数据结构网络,该数据库可为SQL数据库,或其他数据库,该信息提取模型通过将若干份人才简历信息样本输入初始模型中进行训练得到。

S104、将人才数据信息定向存储至人才信息管理数据库;

终端将信息提取模型输出的人才数据信息按照人才信息管理数据库的存储要求定向存储至该人才信息管理数据库中。例如,可以将该人才数据信息以知识图谱的形式存储至人才信息管理数据库中,提高信息可观性,或者,将该人才数据信息定向存储至人才信息管理数据库的特定位置,或者,以其他方式存储,此处不做限定。通过在人才信息管理数据库中定向存储多个人才的人才数据信息,在进行企业招揽人才时,可快速、有效根据这些人才数据信息确定并招揽人才。

S105、当确定目标企业存在人才需求时,确定目标企业的人才需求意向信息,并从人才信息管理数据库中获取若干个人才数据信息;

当目标企业存在人才需求,需进行人才招揽时,终端根据目标企业的招聘要求确定该目标企业的人才需求意向信息,其中,该人才需求意向信息可包括对需求人才的身份信息、学历信息、工作履历信息、技能信息及求职意向信息等信息对应的要求,以使得根据该要求进行后续人才的招揽。

接着,终端从人才信息管理数据库中获取到先前存储的若干个人才对应的人才数据信息,以根据该人才需求意向信息和人才数据信息进行人才匹配。

S106、确定人才数据信息的第一特性及人才需求意向信息的第二特性,计算第一特性符合第二特性的符合值,并确定人才需求意向信息对第二特性的重视值,基于第一特性、第二特性、符合值及重视值利用数据匹配算法计算人才数据信息与人才需求意向信息的匹配度,该第一特性包括第一身份、第一学历、第一工作履历、第一技能及第一求职意向,该第二特性包括第二身份、第二学历、第二工作履历、第二技能及第二求职意向;

终端确定人才数据信息中代表人才的第一身份,第一学历,第一工作履历,第一技能和第一求职意向这五大第一特性,确定人才需求意向信息中代表人才需求的第二身份,第二学历,第二工作履历,第二技能及第二求职意向这五大第二特性,计算第一特性中符合第二特性的符合值及确定人才需求意向信息对第二特性的重视值。该符合值可根据字符串相似度算法进行计算确定或将第一特性与第二特性输入关联词汇表中进行字段匹配确定。该重视值表示目标企业对第二特性中某一特性的偏好程度,以区分目标企业对不同特性的重视程度。

根据数据匹配算法计算人才信息管理数据库中所包含的若干个人才数据信息分别与该人才需求意向信息的匹配度。其中,该数据匹配算法可使用相似度算法,例如余弦相似度算法、字符串相似度算法或文本相似度算法等,也可以使用其他数据匹配算法,此处不做限定。

S107、按照由高到低对匹配度进行排序,确定匹配级别,根据该匹配级别确定目标人才。

终端将计算得出的若干个人才的人才数据信息与企业的匹配度从高到底进行顺序排序,并确定若干个人才数据信息对应的匹配级别,从而根据该匹配级别确定目标企业意向招揽的目标人才。

本实施例中,终端通过获取待分析人才的人才简历信息;基于待分析人才的身份信息对人才简历信息进行身份确认;在身份确认通过后,将人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,该人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息;将人才数据信息定向存储至人才信息管理数据库;当确定目标企业存在人才需求时,确定目标企业的人才需求意向信息;从人才信息管理数据库中获取若干个人才数据信息,根据数据匹配算法计算若干个人才数据信息分别与人才需求意向信息的匹配度,并按照由高到低对匹配度进行排序,确定匹配级别,根据匹配级别确定目标人才,以使得自动确定与目标企业人才需求对应的目标人才,对于求职者的人才信息不需要人工进行筛选,减少人力成本,为企业精确提供人才推荐,提高用户体验。

为使本申请提供的基于大数据的人才信息分析管理方法更加的明显易懂,下面对本申请提供的基于大数据的人才信息分析管理方法进行详细说明:

请参阅图2,图2为本申请提供的基于大数据的人才信息分析管理方法另一个实施例,该方法包括:

S201、获取待分析人才的人才简历信息;

本实施例中的步骤S201与前述图1所示实施例中的步骤S101类似,具体此处不做赘述。

S202、基于待分析人才的身份信息对人才简历信息进行身份确认;

可选地,终端获取待分析人才的身份图像信息,通过人脸判别方式对人才简历信息进行身份确认。具体地,基于待分析人才的身份信息确定待分析人才的第一人脸图像。其中该身份信息可为身份证,终端获取待分析人才身份证上的第一人脸图像。

然后,将第一人脸图像和人才简历信息输入预训练的人脸判别模型,根据该人脸判别模型确定人才简历信息中的第二人脸图像,该人才简历信息中包括第二人脸图像。接着,通过人脸判别模型提取该第一人脸图像的第一人脸轮廓特征和第二人脸图像的第二人脸轮廓特征,提取该第一人脸图像的第一人脸五官点特征和第二人脸图像的第二人脸五官点特征。进一步地,该人脸判别模型包括轮廓与五官部位粗细提取相结合的神经网络模型,通过该神经网络模型所包括的卷积池化分别对第一人脸图像的第一人脸轮廓特征和第二人脸图像的第二人脸轮廓特征进行粗提取,对第一人脸图像的第一人脸五官点特征和第二人脸图像的第二人脸五官点特征进行细提取。

再基于该人脸判别模型的全连接层将粗细提取结合的第一人脸轮廓特征和第一人脸五官点特征组合成一组第一特征向量,将粗细提取结合的第二人脸轮廓特征和所述第二人脸五官点特征组合成一组第二特征向量;

最后将该第一特征向量和第二特征向量输入人脸判别模型的softmax分类器,输出待分析人才的身份判别结果,根据身份判别结果对人才简历信息进行身份确认。例如,将第一特征向量和第二特征向量输入softmax分类器,若输出的待分析人才的身份判别结果为两者一致,则对该人才简历信息进行身份确认,输出该人才简历信息属实,若两者不一致,则输出该人才简历信息存疑。

需要说明的是,该人脸判别模型通过输入若干个人脸图像样本和人才简历信息样本预训练得到。具体地,构建人脸图像样本集和人才简历信息样本集,该人脸图像样本集包括若干个人脸图像样本,该人才简历信息样本集包括若干份简历信息样本,该若干份简历信息样本中包含简历对象人才的人脸图像。

构建以人脸识别为基础,轮廓与五官部位粗细提取相结合的神经网络模型。将该人脸图像样本集和人才简历信息样本集输入神经网络模型中进行图像特征提取,根据提取的图像特征确定人脸轮廓特征和具体五官点特征,具体地,使用大量卷积池化粗提取出图像的人脸轮廓特征,使用Inception-ResNet网络细提取人脸图像的具体五官点特征,将人脸轮廓特征和具体五官点特征输入网络模型的全连接层中进行特征组合,再根据组合的特征向量输入softmax分类器进行判别训练,计算损失函数和梯度,根据损失函数值和梯度利用反向传播算法对神经网络模型和子网络模型,softmax分类器的模型参数进行优化更新,通过上述步骤利用人脸图像样本集和人才简历信息样本集对模型进行迭代训练直至损失函数收敛,得到训练完成的人脸判别模型。

S203、在身份确认通过后,将人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,该人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息,该关键词提取过程包括:基于NLP技术对特定的关键词进行提取,并将提取出的关键词与预先构建的词汇表进行字段匹配,得到对应的字段以及字段取值,通过数据结构对字段以及字段取值进行存储,得到人才数据信息,该信息提取模型通过输入若干份人才简历信息样本预训练得到;

本实施例中的步骤S203与前述图1所示实施例中的步骤S103类似,具体此处不做赘述。

S204、将人才数据信息定向存储至人才信息管理数据库;

可选地,终端将信息提取模型输出的人才数据信息按照人才信息管理数据库的存储要求定向存储至该人才信息管理数据库中。具体地,终端可将该人才数据信息进行结构化处理,以json格式定向存储至人才信息管理数据库中,提高数据存储的可视化效果。

进一步地,终端可在人才信息管理数据库中设置当前待存储的人才信息存储限值,该人才信息存储限值用于对人才的优秀程度进行区分。终端判断该人才数据信息所包括的身份、学历、工作履历、技能及求职意向五大特性是否达到该人才信息存储限值;若是,则确定该人才达到预设优秀程度,则将人才数据信息存储至人才信息管理数据库的第一梯度人才库,该第一梯度人才库用于存储较为优秀的人才的人才数据信息;若否,则将该人才数据信息存储至人才信息管理数据库的备用人才库,并对人才数据信息进行标记。例如,若设置该人才信息存储限值为本地人才,重点高校毕业生,三年工作经验,则当某一人才的个人数据信息均达到该人才信息存储限值时,将该人才的个人信息数据信息存储至第一人才库;若该人才为非本地人,其个人数据信息中只有重点高校毕业和三年工作经验符合人才信息存储限值,则将该人才存储至备用人才库,并对其非本地人的身份信息进行标记。

通过人才信息存储限值对人才进行区分,并定向存储至不同人才库,可有效区分不同人才,对不同人才进行有效管理,方便后续目标企业从不同的人才库中招揽意向人才。

S205、对人才信息管理数据库中的人才数据信息进行标签定位,根据人才数据信息对应人才当前的工作状态将其标签定位为在职状态和/或自由状态;

可选地,终端可实时更新人才信息管理库中的人才数据信息,以提高人才数据信息的时效性。具体地,对人才信息管理数据库中的人才数据信息进行标签定位,主要对人才当前的就职状态进行跟踪,若该人才已就业,则在人才信息管理数据库中对该人才对应的人才数据信息进行标签定位,将其标签定位为在职状态,若该人才当前未就职,则将其标签定位为自由状态,以便后续目标企业可以针对该人才进行选择性招揽。

S206、当确定目标企业存在人才需求时,确定目标企业的人才需求意向信息,并从人才信息管理数据库中确定当前标签定位为自由状态的人才对应的人才数据信息,并获取该人才数据信息;

可选地,当目标企业存在人才需求,需进行人才招揽时,终端根据目标企业的招聘要求确定该目标企业的人才需求意向信息,其中,该人才需求意向信息可包括对需求人才的身份信息、学历信息、工作履历信息、技能信息及求职意向信息等信息对应的要求,以使得根据该要求进行后续人才的招揽。

接着,在人才信息管理数据库中对人才进行标签定位筛选,确定并获取标签定位为自由状态的人才对应的人才数据信息,以便针对该人才进行招揽。

S207、确定该人才数据信息的第一特性及人才需求意向信息的第二特性,计算第一特性符合第二特性的符合值,并确定人才需求意向信息对第二特性的重视值,基于第一特性、第二特性、符合值及重视值利用数据匹配算法计算人才数据信息与人才需求意向信息的匹配度,该第一特性包括第一身份、第一学历、第一工作履历、第一技能及第一求职意向,该第二特性包括第二身份、第二学历、第二工作履历、第二技能及第二求职意向;

终端分别确定人才数据信息所对应人才的第一身份、第一学历、第一工作履历、第一技能及第一求职意向,并设i={1,2,3,4,5}分别表示第一身份、第一学历、第一工作履历、第一技能及第一求职意向这五个第一特性;确定人才需求意向信息所对应人才需求的第二身份、第二学历、第二工作履历、第二技能及第二求职意向,并设j={1,2,3,4,5}分别表示第二身份、第二学历、第二工作履历、第二技能及第二求职意向这五个第二特性。

然后,计算第一特性i中符合第二特性j的符合值。具体地,构建特性关联词汇表,该特性关联词汇表包括第一特性i、第二特性j及符合值;使用该特性关联词汇表对第一特性i和第二特性j进行检测,若第一特性i符合第二特性j,则将符合值赋值为1,若不符合,则对符合值赋值0。

进一步地,该特性关联词汇表包括关联主词汇表及关联分词汇表,其中关联主词汇表用于确定第一特性i与第二特性j是否符合,关联分词汇表用于判断第一特性i中所包含的具体信息是否符合第二特性j中所需求的具体信息。例如,关联主词汇表如表1所示,关联分词汇表如表2所示。则根据表1及表2可确定该人才的个人数据信息的第一特性i与人才需求意向信息的第二特性j的符合值。

表1:

表2:

或者,终端也可根据其他计算方式,计算第一特性i中符合第二特性j的符合值,具体此处不做限定。

接着,终端确定该人才需求意向信息对第二特性j的重视值,其中该重视值表示偏好程度,即当目标企业更看重或更偏好第二特性中某一特性时,可对该特性进行不同权重赋值,表示其重视值,如下表3所示。

表3:

/>

具体地,该重视值可根据目标企业的意向需求自行设定,也可根据大数据计算目前市场对人才各特性的偏好程度确定,此处不做限定。

最后,基于数据匹配算法计算人才数据信息与人才需求意向信息的匹配度,其中,该数据匹配算法为:

其中,P表示匹配度,u表示人才数据信息,v表示目标企业的人才需求意向信息,

其中,根据权重计算公式计算权重值

其中,N表示人才信息管理数据库中第一求职意向为第二求职意向的人才总数,

S208、按照由高到低对匹配度进行排序,确定匹配级别,筛选匹配级别高于预设阈值的人才,并将该人才确定为目标人才,向目标企业的招聘端定向推送目标人才的人才数据信息。

可选地,终端将计算得出的若干个人才的人才数据信息与企业的匹配度从高到底进行顺序排序,并确定若干个人才数据信息对应的匹配级别,其中,该匹配级别可分为低匹配级别、中匹配级别和高匹配级别。终端筛选出匹配级别为高匹配级别的人才数据信息对应的目标人才,向目标企业的招聘端定向推送该目标人才的人才数据信息,以使得目标企业的招聘人员可招揽高符合人才需求意向的目标人才。

本实施例中,终端通过获取待分析人才的人才简历信息;基于待分析人才的身份信息对人才简历信息进行身份确认;在身份确认通过后,将人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,该人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息;将人才数据信息定向存储至人才信息管理数据库,对人才进行有效管理。

同时,当确定目标企业存在人才需求时,确定目标企业的人才需求意向信息;从人才信息管理数据库中获取若干个人才数据信息,根据数据匹配算法计算若干个人才数据信息分别与人才需求意向信息的匹配度,并按照由高到低对匹配度进行排序,确定匹配级别,根据匹配级别确定目标人才,以使得自动确定与目标企业人才需求对应的目标人才,对于求职者的人才信息不需要人工进行筛选,减少人力成本,为企业精确提供人才推荐,提高用户体验。

上述对本申请提供的基于大数据的人才信息分析管理方法进行了说明,下面对本申请提供的基于大数据的人才信息分析管理系统进行说明:

请参阅图3,图3为本申请提供的基于大数据的人才信息分析管理系统一个实施例,该系统包括:

获取单元301,用于获取待分析人才的人才简历信息;

确认单元302,用于基于所述待分析人才的身份信息对所述人才简历信息进行身份确认;

第一确定单元303,用于在身份确认通过后,将所述人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,所述人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息,所述关键词提取过程包括:

基于NLP技术对特定的关键词进行提取,并将提取出的关键词与预先构建的词汇表进行字段匹配,得到对应的字段以及字段取值,通过数据结构对所述字段以及字段取值进行存储,得到所述人才数据信息,所述信息提取模型通过输入若干份人才简历信息样本预训练得到,所述特定的关键词包括关于身份信息、学历信息、工作履历信息、技能信息及求职意向信息的关键词;

存储单元304,用于将所述人才数据信息定向存储至人才信息管理数据库;

第二确定单元305,用于当确定目标企业存在人才需求时,确定所述目标企业的人才需求意向信息,并从所述人才信息管理数据库中获取若干个人才数据信息;

匹配单元306,用于确定所述人才数据信息的第一特性及所述人才需求意向信息的第二特性,计算所述第一特性符合所述第二特性的符合值,并确定所述人才需求意向信息对所述第二特性的重视值,基于所述第一特性、所述第二特性、所述符合值及所述重视值利用数据匹配算法计算所述人才数据信息与所述人才需求意向信息的匹配度,所述第一特性包括第一身份、第一学历、第一工作履历、第一技能及第一求职意向,所述第二特性包括第二身份、第二学历、第二工作履历、第二技能及第二求职意向;

第三确定单元307,用于按照由高到低对所述匹配度进行排序,确定匹配级别,根据所述匹配级别确定目标人才。

本实施例系统中,各单元所执行的功能与前述图1所示方法实施例中的步骤对应,具体此处不再赘述。

本实施例中,系统通过获取待分析人才的人才简历信息;基于待分析人才的身份信息对人才简历信息进行身份确认;在身份确认通过后,将人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,该人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息;将人才数据信息定向存储至人才信息管理数据库,当确定目标企业存在人才需求时,确定目标企业的人才需求意向信息;从人才信息管理数据库中获取若干个人才数据信息,根据数据匹配算法计算若干个人才数据信息分别与人才需求意向信息的匹配度,并按照由高到低对匹配度进行排序,确定匹配级别,根据匹配级别确定目标人才,以使得自动确定与目标企业人才需求对应的目标人才,对于求职者的人才信息不需要人工进行筛选,减少人力成本,为企业精确提供人才推荐,提高用户体验。

下面对本申请提供的基于大数据的人才信息分析管理系统进行详细说明,请参阅图4,图4为本申请提供的基于大数据的人才信息分析管理系统另一个实施例,该系统包括:

获取单元401,用于获取待分析人才的人才简历信息;

确认单元402,用于基于所述待分析人才的身份信息对所述人才简历信息进行身份确认;

第一确定单元403,用于在身份确认通过后,将所述人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,所述人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息,所述关键词提取过程包括:

基于NLP技术对特定的关键词进行提取,并将提取出的关键词与预先构建的词汇表进行字段匹配,得到对应的字段以及字段取值,通过数据结构对所述字段以及字段取值进行存储,得到所述人才数据信息,所述信息提取模型通过输入若干份人才简历信息样本预训练得到,所述特定的关键词包括关于身份信息、学历信息、工作履历信息、技能信息及求职意向信息的关键词;

存储单元404,用于将所述人才数据信息定向存储至人才信息管理数据库;

第二确定单元406,用于当确定目标企业存在人才需求时,确定所述目标企业的人才需求意向信息,并从所述人才信息管理数据库中获取若干个人才数据信息;

匹配单元407,用于确定所述人才数据信息的第一特性及所述人才需求意向信息的第二特性,计算所述第一特性符合所述第二特性的符合值,并确定所述人才需求意向信息对所述第二特性的重视值,基于所述第一特性、所述第二特性、所述符合值及所述重视值利用数据匹配算法计算所述人才数据信息与所述人才需求意向信息的匹配度,所述第一特性包括第一身份、第一学历、第一工作履历、第一技能及第一求职意向,所述第二特性包括第二身份、第二学历、第二工作履历、第二技能及第二求职意向;

第三确定单元408,用于按照由高到低对所述匹配度进行排序,确定匹配级别,根据所述匹配级别确定目标人才。

可选地,所述确认单元402具体用于基于所述待分析人才的身份信息确定所述待分析人才的第一人脸图像;

将所述第一人脸图像和所述人才简历信息输入人脸判别模型,确定所述人才简历信息中包含的第二人脸图像,并提取所述第一人脸图像的第一人脸轮廓特征和所述第二人脸图像的第二人脸轮廓特征,提取所述第一人脸图像的第一人脸五官点特征和所述第二人脸图像的第二人脸五官点特征,所述人脸判别模型通过输入若干个人脸图像样本和人才简历信息样本预训练得到;

基于所述人脸判别模型的全连接层将所述第一人脸轮廓特征和所述第一人脸五官点特征组合成一组第一特征向量,将所述第二人脸轮廓特征和所述第二人脸五官点特征组合成一组第二特征向量;

将所述第一特征向量和所述第二特征向量输入所述人脸判别模型的softmax分类器,输出所述待分析人才的身份判别结果,根据所述身份判别结果对所述人才简历信息进行身份确认。

可选地,所述匹配单元407具体用于分别确定所述人才数据信息所对应人才的第一身份、第一学历、第一工作履历、第一技能及第一求职意向,并设i={1,2,3,4,5}分别表示所述第一身份、所述第一学历、所述第一工作履历、所述第一技能及所述第一求职意向这五个第一特性;

确定所述人才需求意向信息所对应人才需求的第二身份、第二学历、第二工作履历、第二技能及第二求职意向,并设j={1,2,3,4,5}分别表示所述第二身份、所述第二学历、所述第二工作履历、所述第二技能及所述第二求职意向这五个第二特性;

计算所述第一特性i中符合所述第二特性j的符合值,并确定所述人才需求意向信息对所述第二特性j的重视值;

基于数据匹配算法计算所述人才数据信息与所述人才需求意向信息的匹配度,其中,所述数据匹配算法为:

其中,P表示所述匹配度,u表示所述人才数据信息,v表示所述目标企业的人才需求意向信息,

其中,根据权重计算公式计算权重值

其中,N表示所述人才信息管理数据库中第一求职意向为第二求职意向的人才总数,

可选地,所述匹配单元407具体用于构建特性关联词汇表,所述特性关联词汇表包括所述第一特性i、第二特性j及符合值;

使用所述特性关联词汇表对所述第一特性i和所述第二特性j进行检测,若所述第一特性i符合第二特性j,则将所述符合值赋值为1,若不符合,则对所述符合值赋值0。

可选地,所述人才信息分析管理系统还包括:

标签定位单元405,用于对所述人才信息管理数据库中的人才数据信息进行标签定位,根据所述人才数据信息对应人才当前的工作状态将其标签定位为在职状态和/或自由状态;

所述第二确定单元406具体用于从所述人才信息管理数据库中确定当前标签定位为自由状态的人才对应的人才数据信息,并获取所述人才数据信息。

可选地,所述第三确定单元408具体用于筛选匹配级别高于预设阈值的人才,并将所述人才确定为目标人才,向所述目标企业的招聘端定向推送所述目标人才的人才数据信息。

可选地,所述存储单元404具体用于将所述人才数据信息进行结构化处理,以json格式定向存储至人才信息管理数据库中。

可选地,所述存储单元404具体用于在人才信息管理数据库中设置当前待存储的人才信息存储限值;

判断所述人才数据信息所包括的身份信息、学历信息、工作履历信息、技能信息及求职意向信息这五大特性是否达到所述人才信息存储限值;

若是,则将所述人才数据信息定向存储至所述人才信息管理数据库的第一梯度人才库;

若否,则将所述人才数据信息定向存储至所述人才信息管理数据库的备用人才库,并对所述人才数据信息进行标记。

本实施例系统中,各单元所执行的功能与前述图2所示方法实施例中的步骤对应,具体此处不再赘述。

本实施例中,系统通过获取待分析人才的人才简历信息;基于待分析人才的身份信息对人才简历信息进行身份确认;在身份确认通过后,将人才简历信息输入信息提取模型进行关键词提取,确定人才数据信息,该人才数据信息包括身份信息、学历信息、工作履历信息、技能信息及求职意向信息;将人才数据信息定向存储至人才信息管理数据库,对人才进行有效管理。

同时,当确定目标企业存在人才需求时,确定目标企业的人才需求意向信息;从人才信息管理数据库中获取若干个人才数据信息,根据数据匹配算法计算若干个人才数据信息分别与人才需求意向信息的匹配度,并按照由高到低对匹配度进行排序,确定匹配级别,根据匹配级别确定目标人才,以使得自动确定与目标企业人才需求对应的目标人才,对于求职者的人才信息不需要人工进行筛选,减少人力成本,为企业精确提供人才推荐,提高用户体验。

本申请还提供了一种基于大数据的人才信息分析管理装置,请参阅图5,图5为本申请提供的基于大数据的人才信息分析管理装置一个实施例,该装置包括:

处理器501、存储器502、输入输出单元503、总线504;

处理器501与存储器502、输入输出单元503以及总线504相连;

存储器502保存有程序,处理器501调用程序以执行如上任一基于大数据的人才信息分析管理方法。

本申请还涉及一种计算机可读存储介质,计算机可读存储介质上保存有程序,当程序在计算机上运行时,使得计算机执行如上任一基于大数据的人才信息分析管理方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-only memory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

相关技术
  • 一种基于大数据的测试用例管理方法及装置
  • 一种基于课程信息的课堂数据智能管理方法及其装置
  • 一种基于大数据的智能教育信息分析系统
  • 一种基于大数据的人才信息招聘数据智能管理方法及系统
  • 一种基于大数据分析的商品信息管理方法与系统
技术分类

06120116480947