掌桥专利:专业的专利平台
掌桥专利
首页

声纹识别方法、装置、存储介质以及电子设备

文献发布时间:2023-06-19 16:06:26



技术领域

本发明涉及计算机领域,具体而言,涉及一种声纹识别方法、装置、存储介质以及电子设备。

背景技术

现如今,房地产从过去的增量时代转入存量时代,已是不争的事实。房地产整体外部环境的变化,让房地产开发商需要转换角色,从过去的开发者,转换成运营者。随之出现了非常常见的一个场景问题:“飞单”。“飞单”是案场内的置业顾问和案场外的房产中介,通过藏客内单外挂、截客相互介绍等方式,或因客户归属划分不清造成营销费用剧增。在现有技术中,采用摄像头抓拍人脸的方式,在签约时,通过扫描身份证或者再次人脸拍摄,与存储的人脸进行比对,判定是否“飞单”。但由于采用的摄像头采集人脸,并存储,严重侵犯了个人隐私。

发明内容

本发明实施例提供了一种声纹识别方法、装置、存储介质以及电子设备,以至少解决因客户归属划分不清导致的营销费用剧增的技术问题。

根据本发明实施例的一个方面,提供了一种声纹识别方法,包括:获取客户的目标语音录音;对上述目标语音录音进行声纹提取操作,得到第一目标声纹;将上述第一目标声纹与声纹数据库进行比对,得到第一比对结果;在上述第一比对结果为比对成功的情况下,将上述客户标记为风险客户,并向用户发送风险预警信息;在上述第一比对结果为未比对成功的情况下,将上述客户标记为第三方客户,并将上述第一目标声纹保存至上述声纹数据库。

根据本发明实施例的另一方面,提供了一种声纹识别装置,包括:第一获取模块,用于获取客户的目标语音录音;提取模块,用于对上述目标语音录音进行声纹提取操作,得到第一目标声纹;第一比对模块,用于将上述第一目标声纹与声纹数据库进行比对,得到第一比对结果;第一标记模块,用于在上述第一比对结果为比对成功的情况下,将上述客户标记为风险客户,并向用户发送风险预警信息;第二标记模块,用于在上述第一比对结果为未比对成功的情况下,将上述客户标记为第三方客户,并将上述第一目标声纹保存至上述声纹数据库。

作为一种可选的示例,上述获取模块包括:第一获取单元,用于获取上述用户、上述客户以及第三方沟通的第一语音录音;检测单元,用于对上述第一语音录音进行语音质量检测操作,得到质量合格的第二语音录音;分离单元,用于对上述第二语音录音进行人声分离操作,得到上述用户的第三语音录音、上述客户的目标语音录音以及上述第三方的第四语音录音。

作为一种可选的示例,上述检测单元包括:检测子单元,用于对上述第一语音录音进行语音质量检测操作,得到检测结果;删除子单元,用于在上述检测结果为质量不合格的情况下,删除上述第一语音录音;保留子单元,用于在上述检测结果为质量合格的情况下,保留上述第一语音录音。

作为一种可选的示例,上述提取模块包括:第一处理单元,用于对上述目标语音录音进行去除噪声技术和有效音提取操作,得到第五语音录音;第二处理单元,用于对上述第五语音录音进行傅里叶变换和声学特征提取操作,得到第六语音录音;训练单元,用于根据上述第六语音录音训练声纹模型,得到已训练的声纹模型;输入单元,用于将上述目标语音录音输入至已训练的声纹模型,得到第一目标声纹。

作为一种可选的示例,上述比对模块包括:第二获取单元,用于获取上述第一目标声纹的目标声纹特征向量;第三获取单元,用于获取上述声纹数据库中的所有声纹特征向量;打分单元,用于对上述目标声纹特征向量和上述所有声纹特征向量的相似度进行打分,得到目标分数组;第三处理单元,用于在上述目标分数组中存在大于或等于阈值的分数值的情况下,得到上述第一对比结果为比对成功;第四处理单元,用于在上述目标分数组中不存在大于或等于上述阈值的分数值的情况下,得到上述第一对比结果为未比对成功。

作为一种可选的示例,上述打分单元包括:打分子单元,用于对上述目标声纹特征向量和上述所有声纹特征向量的相似度进行打分,得到原始分数组;处理子单元,用于将上述原始分数组中的每一个分数值与100相乘,得到上述目标分数组。

作为一种可选的示例,上述第一标记模块包括:第四获取单元,用于上述客户在客户数据库内存在风险预警记录的情况下,获取上述客户首次注册时间;第一确定单元,用于在上述首次注册时间未超过保护期的情况下,确定上述客户为上述风险客户;第二确定单元,用于在上述首次注册时间超过保护期的情况下,确定上述客户为上述第三方客户。

作为一种可选的示例,上述装置还包括:第一确定模块,用于在上述客户存在上述第三方客户标签的情况下,确定上述客户为上述第三方客户;第二确定模块,用于在上述客户数据库内不存在上述风险预警记录的情况下,确定上述客户为上述第三方客户。

作为一种可选的示例,上述装置还包括:第二获取模块,用于在上述客户为自然到访的情况下,获取上述客户的第二目标声纹;第二比对模块,用于将上述第二目标声纹与上述声纹数据库进行比对,得到第二比对结果;第三标记模块,用于在上述第二比对结果为未比对成功的情况下,上述客户标记为自然到访客户,并将上述第二目标声纹保存至上述声纹数据库。

根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被处理器运行时执行上述声纹识别方法。

根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的声纹识别方法。

在本申请的上述声纹识别方法可用于营销智能技术的预测与优化的过程中,在本发明实施例中,采用了获取客户的目标语音录音;对上述目标语音录音进行声纹提取操作,得到第一目标声纹;将上述第一目标声纹与声纹数据库进行比对,得到第一比对结果;在上述第一比对结果为比对成功的情况下,将上述客户标记为风险客户,并向用户发送风险预警信息;在上述第一比对结果为未比对成功的情况下,将上述客户标记为第三方客户,并将上述第一目标声纹保存至上述声纹数据库的方法,由于在上述方法中,通过在声纹数据库中查找是否存在客户的第一目标声纹,若存在则将客户划分为风险客户,从而实现了清楚划分客户的归属和及时预警的目的,进而解决了因客户归属划分不清导致的营销费用剧增的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的一种可选的声纹识别方法的流程图;

图2是根据本发明实施例的一种可选的声纹识别方法的比对图;

图3是根据本发明实施例的一种可选的声纹识别方法的第一目标声纹的获取图;

图4是根据本发明实施例的一种可选的声纹识别方法的目标分数组的获取图;

图5是根据本发明实施例的一种可选的声纹识别方法的签约流程图;

图6是根据本发明实施例的一种可选的声纹识别装置的结构示意图;

图7是根据本发明实施例的一种可选的电子设备的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例的第一方面,提供了一种声纹识别方法,可选地,如图1所示,上述方法包括:

S102,获取客户的目标语音录音;

S104,对目标语音录音进行声纹提取操作,得到第一目标声纹;

S106,将第一目标声纹与声纹数据库进行比对,得到第一比对结果;

S108,在第一比对结果为比对成功的情况下,将客户标记为风险客户,并向用户发送风险预警信息;

S110,在第一比对结果为未比对成功的情况下,将客户标记为第三方客户,并将第一目标声纹保存至声纹数据库。

可选地,本实施例中,客户为到房地产销售案场中,想购置房产的客户,可以是未通过第三方案场外的房产中介带领的自然到访的客户,也可以为通过第三方案场外的房产中介带领的的客户。声纹是用电声学仪器显示的携带言语信息的声波频谱,声纹不仅具有特定性,而且有相对稳定性的特点。声纹数据库,包括历史到访房地产销售案场的客户的所有声纹。风险客户为存在“飞单”风险的客户。第三方客户为通过第三方案场外的房产中介带领,且不存在“飞单”风险的客户。

可选地,本实施例中,可以通过用户身上的语音工牌获取到访客户与用户沟通中产生的目标语音录音。其中,用户即房地产销售案场中的置业顾问。将客户的目标语音录音进行声纹提取操作,得到客户的第一目标声纹。将第一目标声纹与声纹数据库进行比对,查找声纹数据库中是否存在第一目标声纹,比对成功即声纹数据库中存在第一目标声纹的情况下,将客户标记为存在“飞单”风险的风险客户,并向用户发送风险预警信息以提示用户。未比对成功即声纹数据库中不存在第一目标声纹的情况下,表示客户为首次到访,不存在“飞单”风险,将客户标记为第三方客户,并将第一目标声纹保存至声纹数据库。

可选地,本实施例中,通过在声纹数据库中查找是否存在客户的第一目标声纹,若存在则将客户划分为风险客户,从而实现了清楚划分客户的归属和及时预警的目的,进而解决了因客户归属划分不清导致的营销费用剧增的技术问题。

作为一种可选的示例,获取客户的目标语音录音包括:

获取用户、客户以及第三方沟通的第一语音录音;

对第一语音录音进行语音质量检测操作,得到质量合格的第二语音录音;

对第二语音录音进行人声分离操作,得到用户的第三语音录音、客户的目标语音录音以及第三方的第四语音录音。

可选地,本实施例中,用户为房地产销售案场中的置业顾问。第三方为案场外的房产中介。通过第三方带领到案场的客户,由用户置业顾问接待,通过用户身上的语音工牌获取到三方沟通的第一语音录音,其中包括用户的语音录音、客户的语音录音以及第三方的语音录音。经过语音质量检测,得到质量合格的第二语音录音,最后对第二语音录音进行人声分离操作,分离出客户的目标语音录音,其中还包括用户的第三语音录音以及第三方的第四语音录音。

作为一种可选的示例,对第一语音录音进行语音质量检测操作包括:

对第一语音录音进行语音质量检测操作,得到检测结果;

在检测结果为质量不合格的情况下,删除第一语音录音;

在检测结果为质量合格的情况下,保留第一语音录音。

可选地,本实施例中,对第一语音录音进行语音质量检测操作,可能会检测到语音不清楚或无法分辨出是哪一方的语音的情况,将这些质量不合格的语音录音删除,将质量合格的语音录音保留,得到质量合格的第二语音录音。

作为一种可选的示例,对目标语音录音进行声纹提取操作,得到第一目标声纹包括:

对目标语音录音进行去除噪声技术和有效音提取操作,得到第五语音录音;

对第五语音录音进行傅里叶变换和声学特征提取操作,得到第六语音录音;

根据第六语音录音训练声纹模型,得到已训练的声纹模型;

将目标语音录音输入至已训练的声纹模型,得到第一目标声纹。

可选地,本实施例中,对目标语音录音进行预处理,其中包括去除噪声操作和有效音提取操作,得到第五语音录音,再进行傅里叶变换和声学特征提取操作,得到第六语音录音,将第六语音录音输入至基于深度神经网络的未训练的声纹模型进行训练,直到损失函数收敛,得到已训练的声纹模型。

作为一种可选的示例,将第一目标声纹与声纹数据库进行比对,得到第一比对结果包括:

获取第一目标声纹的目标声纹特征向量;

获取声纹数据库中的所有声纹特征向量;

对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到目标分数组;

在目标分数组中存在大于或等于阈值的分数值的情况下,得到第一对比结果为比对成功;

在目标分数组中不存在大于或等于阈值的分数值的情况下,得到第一对比结果为未比对成功。

可选地,本实施例中,可以通过基于CNN的深度神经网络提取客户的第一目标声纹的目标声纹特征向量,和声纹数据库中的所有声纹特征向量,对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到目标分数组,例如声纹数据库中存在5个声纹数据,将获得5个声纹特征向量,第一声纹特征向量、第二声纹特征向量、第三声纹特征向量、第四声纹特征向量、第五声纹特征向量,分别进行相似度打分,得到第一声纹特征向量与目标声纹特征向量的相似分数85,以此类推得到目标分数组【85,52,36,68,98】。阈值可以选择95,在目标分数组中存在大于或等于阈值95的分数值98的情况下,得到第一对比结果为比对成功。若得到目标分数组为【85,52,36,68,94】,在目标分数组中不存在大于或等于阈值95的分数值的情况下,得到第一对比结果为未比对成功。

作为一种可选的示例,对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到目标分数组包括:

对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到原始分数组;

将原始分数组中的每一个分数值与100相乘,得到目标分数组。

可选地,本实施例中,对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到原始分数组,例如声纹数据库中存在5个声纹数据,将获得5个声纹特征向量,第一声纹特征向量、第二声纹特征向量、第三声纹特征向量、第四声纹特征向量、第五声纹特征向量,分别进行相似度打分,得到第一声纹特征向量与目标声纹特征向量的相似分数0.85,以此来推得到原始分数组【0.85,0.52,0.36,0.68,0.94】,将原始分数组中的每一个分数值与100相乘,得到目标分数组【85,52,36,68,94】。

作为一种可选的示例,在第一比对结果为比对成功的情况下,将客户标记为风险客户,并向用户发送风险预警信息包括:

客户在客户数据库内存在风险预警记录的情况下,获取客户首次注册时间;

在首次注册时间未超过保护期的情况下,确定客户为风险客户;

在首次注册时间超过保护期的情况下,确定客户为第三方客户。

可选地,本实施例中,在第一比对结果为比对成功的情况下,即声纹数据库中存在客户的声纹,客户非第一次到访,在客户数据库内查询该客户是否有风险预警记录,若存在,获取客户首次注册时间,即第一次到访时间,并查询首次注册时间是否已超过保护期,若还在保护期间内,即为未超过保护期的情况下,确定客户为存在“飞单”风险的风险客户,后续不进行签约。若不在保护期间内,即超过保护期的情况下,确定客户为第三方客户,后续可以正常签约。例如客户的首次注册时间为2021.01.01,保护期为一年,现在时间为2021.12.25,还在保护期间内,若现在时间为2022.04.01,不在保护期间内。

作为一种可选的示例,上述方法还包括:

在客户存在第三方客户标签的情况下,确定客户为第三方客户;

在客户数据库内不存在风险预警记录的情况下,确定客户为第三方客户。

可选地,本实施例中,在客户数据库内查询该客户有第三方客户标签,确定客户为第三方客户,后续可以正常签约。在客户数据库内不存在风险预警记录,确定客户为第三方客户,后续可以正常签约。

作为一种可选的示例,方法还包括:

在客户为自然到访的情况下,获取客户的第二目标声纹;

将第二目标声纹与声纹数据库进行比对,得到第二比对结果;

在第二比对结果为未比对成功的情况下,客户标记为自然到访客户,并将第二目标声纹保存至声纹数据库。

可选地,本实施例中,客户在未通过第三方带领到案场的,为自然到访客户,由用户置业顾问接待,通过用户身上的语音工牌获取到双方沟通的语音录音,经过语音质量检测,得到质量合格的语音录音,最后进行人声分离操作,分离出客户的第二目标语音录音,通过已训练的声纹模型得到客户的第二目标声纹,将第二目标声纹与声纹数据库进行比对,查找声纹数据库中是否存在第二目标声纹,未比对成功即声纹数据库中不存在第二目标声纹的情况下,表示客户为首次到访,不存在“飞单”风险,将客户标记为自然到访客户,并将第二目标声纹保存至声纹数据库,后续可以正常签约。

可选地,本申请中所提及的“飞单”是案场内的置业顾问和案场外的房产中介,通过藏客内单外挂、截客相互介绍等方式,或因客户归属划分不清造成营销费用剧增。结合一个示例进行说明,本发明涉及一种基于声纹识别技术的案场防“飞单”的方法,通过案场中置业顾问佩戴的语音工牌获取沟通时产生的语音,进行质量检测、人声分离,声纹提取等操作得到客户的第一目标声纹,通过将第一目标声纹分别与声纹数据库中的历史声纹做1:N比对,未比对成功即声纹数据库中不存在第一目标声纹的情况下,表示客户为首次到访,不存在“飞单”风险。

语音工牌的设备特性:工牌样式设计,融入场景环节,无感知佩戴,仅重25g;仅有开关机键,开机即录音,减少频繁设备操作;10小时录音续航,16G存储满足一天音频数据采集;通过有线方式回传数据和充电,支持蓝牙查看设备状态;物体组成的因特网平台直接管理设备,支持设备固件功能优化及升级。

具体流程如图2所示:

A,通过第三方案场外的房产中介带领的客户:

1.通过语音工牌获取沟通时产生三方的语音录音,得到第一语音录音;

2.对第一语音录音进行语音质量检测操作,将质量不合格的语音录音删除,将质量合格的语音录音保留,得到质量合格的第二语音录音;

3.对第二语音录音进行人声分离操作,分离出客户的目标语音录音,还包括用户的第三语音录音以及第三方的第四语音录音;

4.对目标语音录音进行去除噪声技术、有效音提取操作、傅里叶变换、声学特征提取操作,得到第六语音录音,根据第六语音录音训练声纹模型,得到已训练的声纹模型,将目标语音录音输入至已训练的声纹模型,得到第一目标声纹。如图3所示;

5.将第一目标声纹与声纹数据库进行比对,比对成功的情况下,将客户标记为风险客户,并向用户发送风险预警信息,未比对成功的情况下,将客户标记为第三方客户,并将第一目标声纹保存至声纹数据库;

将第一目标声纹与声纹数据库进行比对包括,如图4所示:

(1)获取第一目标声纹的目标声纹特征向量和声纹数据库中的所有声纹特征向量;

(2)对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到原始分数组;

(3)将原始分数组中的每一个分数值与100相乘,得到目标分数组。

(4)在目标分数组中存在大于或等于阈值的分数值的情况下,得到第一对比结果为比对成功;在目标分数组中不存在大于或等于阈值的分数值的情况下,得到第一对比结果为未比对成功。

6.在客户数据库内查询该客户是否有风险预警记录,若不存在,确定客户为第三方客户,后续可以正常签约。若存在,获取客户首次注册时间,并查询首次注册时间是否已超过保护期,若还在保护期间内,确定客户为风险客户,后续不进行签约。若不在保护期间内,确定客户为第三方客户,后续可以正常签约,如图5所示。

B.自然到访的客户:

通过用户身上的语音工牌获取到双方沟通的语音录音,经过语音质量检测,得到质量合格的语音录音,最后进行人声分离操作,分离出客户的第二目标语音录音,通过已训练的声纹模型得到客户的第二目标声纹,将第二目标声纹与声纹数据库进行比对,查找声纹数据库中是否存在第二目标声纹,未比对成功的情况下,将客户标记为自然到访客户,并将第二目标声纹保存至声纹数据库,后续可以正常签约。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

根据本申请实施例的另一方面,还提供了一种声纹识别装置,如图6所示,包括:

获取模块602,用于获取客户的目标语音录音;

提取模块604,用于对目标语音录音进行声纹提取操作,得到第一目标声纹;

比对模块606,用于将第一目标声纹与声纹数据库进行比对,得到第一比对结果;

第一标记模块608,用于在第一比对结果为比对成功的情况下,将客户标记为风险客户,并向用户发送风险预警信息;

第二标记模块610,用于在第一比对结果为未比对成功的情况下,将客户标记为第三方客户,并将第一目标声纹保存至声纹数据库。

可选地,本实施例中,客户为到房地产销售案场中,想购置房产的客户,可以是未通过第三方案场外的房产中介带领的自然到访的客户,也可以为通过第三方案场外的房产中介带领的的客户。声纹是用电声学仪器显示的携带言语信息的声波频谱,声纹不仅具有特定性,而且有相对稳定性的特点。声纹数据库,包括历史到访房地产销售案场的客户的所有声纹。风险客户为存在“飞单”风险的客户。第三方客户为通过第三方案场外的房产中介带领,且不存在“飞单”风险的客户。

可选地,本实施例中,可以通过用户身上的语音工牌获取到访客户与用户沟通中产生的目标语音录音。其中,用户即房地产销售案场中的置业顾问。将客户的目标语音录音进行声纹提取操作,得到客户的第一目标声纹。将第一目标声纹与声纹数据库进行比对,查找声纹数据库中是否存在第一目标声纹,比对成功即声纹数据库中存在第一目标声纹的情况下,将客户标记为存在“飞单”风险的风险客户,并向用户发送风险预警信息以提示用户。未比对成功即声纹数据库中不存在第一目标声纹的情况下,表示客户为首次到访,不存在“飞单”风险,将客户标记为第三方客户,并将第一目标声纹保存至声纹数据库。

可选地,本实施例中,通过在声纹数据库中查找是否存在客户的第一目标声纹,若存在则将客户划分为风险客户,从而实现了清楚划分客户的归属和及时预警的目的,进而解决了因客户归属划分不清导致的营销费用剧增的技术问题。

作为一种可选的示例,获取模块包括:

第一获取单元,用于获取用户、客户以及第三方沟通的第一语音录音;

检测单元,用于对第一语音录音进行语音质量检测操作,得到质量合格的第二语音录音;

分离单元,用于对第二语音录音进行人声分离操作,得到用户的第三语音录音、客户的目标语音录音以及第三方的第四语音录音。

可选地,本实施例中,用户为房地产销售案场中的置业顾问。第三方为案场外的房产中介。通过第三方带领到案场的客户,由用户置业顾问接待,通过用户身上的语音工牌获取到三方沟通的第一语音录音,其中包括用户的语音录音、客户的语音录音以及第三方的语音录音。经过语音质量检测,得到质量合格的第二语音录音,最后对第二语音录音进行人声分离操作,分离出客户的目标语音录音,其中还包括用户的第三语音录音以及第三方的第四语音录音。

作为一种可选的示例,检测单元包括:

检测子单元,用于对第一语音录音进行语音质量检测操作,得到检测结果;

删除子单元,用于在检测结果为质量不合格的情况下,删除第一语音录音;

保留子单元,用于在检测结果为质量合格的情况下,保留第一语音录音。

可选地,本实施例中,对第一语音录音进行语音质量检测操作,可能会检测到语音不清楚或无法分辨出是哪一方的语音的情况,将这些质量不合格的语音录音删除,将质量合格的语音录音保留,得到质量合格的第二语音录音。

作为一种可选的示例,提取模块包括:

第一处理单元,用于对目标语音录音进行去除噪声技术和有效音提取操作,得到第五语音录音;

第二处理单元,用于对第五语音录音进行傅里叶变换和声学特征提取操作,得到第六语音录音;

训练单元,用于根据第六语音录音训练声纹模型,得到已训练的声纹模型;

输入单元,用于将目标语音录音输入至已训练的声纹模型,得到第一目标声纹。

可选地,本实施例中,对目标语音录音进行预处理,其中包括去除噪声操作和有效音提取操作,得到第五语音录音,再进行傅里叶变换和声学特征提取操作,得到第六语音录音,将第六语音录音输入至基于深度神经网络的未训练的声纹模型进行训练,直到损失函数收敛,得到已训练的声纹模型。

作为一种可选的示例,比对模块包括:

第二获取单元,用于获取第一目标声纹的目标声纹特征向量;

第三获取单元,用于获取声纹数据库中的所有声纹特征向量;

打分单元,用于对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到目标分数组;第三处理单元,用于在目标分数组中存在大于或等于阈值的分数值的情况下,得到第一对比结果为比对成功;

第四处理单元,用于在目标分数组中不存在大于或等于阈值的分数值的情况下,得到第一对比结果为未比对成功。

可选地,本实施例中,可以通过基于CNN的深度神经网络提取客户的第一目标声纹的目标声纹特征向量,和声纹数据库中的所有声纹特征向量,对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到目标分数组,例如声纹数据库中存在5个声纹数据,将获得5个声纹特征向量,第一声纹特征向量、第二声纹特征向量、第三声纹特征向量、第四声纹特征向量、第五声纹特征向量,分别进行相似度打分,得到第一声纹特征向量与目标声纹特征向量的相似分数85,以此类推得到目标分数组【85,52,36,68,98】。阈值可以选择95,在目标分数组中存在大于或等于阈值95的分数值98的情况下,得到第一对比结果为比对成功。若得到目标分数组为【85,52,36,68,94】,在目标分数组中不存在大于或等于阈值95的分数值的情况下,得到第一对比结果为未比对成功。

作为一种可选的示例,打分单元包括:

打分子单元,用于对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到原始分数组;

处理子单元,用于将原始分数组中的每一个分数值与100相乘,得到目标分数组。

可选地,本实施例中,对目标声纹特征向量和所有声纹特征向量的相似度进行打分,得到原始分数组,例如声纹数据库中存在5个声纹数据,将获得5个声纹特征向量,第一声纹特征向量、第二声纹特征向量、第三声纹特征向量、第四声纹特征向量、第五声纹特征向量,分别进行相似度打分,得到第一声纹特征向量与目标声纹特征向量的相似分数0.85,以此来推得到原始分数组【0.85,0.52,0.36,0.68,0.94】,将原始分数组中的每一个分数值与100相乘,得到目标分数组【85,52,36,68,94】。

作为一种可选的示例,第一标记模块包括:

第四获取单元,用于客户在客户数据库内存在风险预警记录的情况下,获取客户首次注册时间;

第一确定单元,用于在首次注册时间未超过保护期的情况下,确定客户为风险客户;

第二确定单元,用于在首次注册时间超过保护期的情况下,确定客户为第三方客户。

可选地,本实施例中,在第一比对结果为比对成功的情况下,即声纹数据库中存在客户的声纹,客户非第一次到访,在客户数据库内查询该客户是否有风险预警记录,若存在,获取客户首次注册时间,即第一次到访时间,并查询首次注册时间是否已超过保护期,若还在保护期间内,即为未超过保护期的情况下,确定客户为存在“飞单”风险的风险客户,后续不进行签约。若不在保护期间内,即超过保护期的情况下,确定客户为第三方客户,后续可以正常签约。例如客户的首次注册时间为2021.01.01,保护期为一年,现在时间为2021.12.25,还在保护期间内,若现在时间为2022.04.01,不在保护期间内。

作为一种可选的示例,上述装置还包括:

第一确定模块,用于在客户存在第三方客户标签的情况下,确定客户为第三方客户;

第二确定模块,用于在客户数据库内不存在风险预警记录的情况下,确定客户为第三方客户。

可选地,本实施例中,在客户数据库内查询该客户有第三方客户标签,确定客户为第三方客户,后续可以正常签约。在客户数据库内不存在风险预警记录,确定客户为第三方客户,后续可以正常签约。

作为一种可选的示例,上述装置还包括:

第二获取模块,用于在客户为自然到访的情况下,获取客户的第二目标声纹;

第二比对模块,用于将第二目标声纹与声纹数据库进行比对,得到第二比对结果;

第三标记模块,用于在第二比对结果为未比对成功的情况下,客户标记为自然到访客户,并将第二目标声纹保存至声纹数据库。

可选地,本实施例中,客户在未通过第三方带领到案场的,为自然到访客户,由用户置业顾问接待,通过用户身上的语音工牌获取到双方沟通的语音录音,经过语音质量检测,得到质量合格的语音录音,最后进行人声分离操作,分离出客户的第二目标语音录音,通过已训练的声纹模型得到客户的第二目标声纹,将第二目标声纹与声纹数据库进行比对,查找声纹数据库中是否存在第二目标声纹,未比对成功即声纹数据库中不存在第二目标声纹的情况下,表示客户为首次到访,不存在“飞单”风险,将客户标记为自然到访客户,并将第二目标声纹保存至声纹数据库,后续可以正常签约。

本实施例的其他示例请参见示例,在此不在赘述。

图7是根据本申请实施例的一种可选的电子设备的结构框图,如图7所示,包括处理器702、通信接口704、存储器706和通信总线708,其中,处理器702、通信接口704和存储器706通过通信总线708完成相互间的通信,其中,

存储器706,用于存储计算机程序;

处理器702,用于执行存储器706上所存放的计算机程序时,实现如下步骤:

获取客户的目标语音录音;

对目标语音录音进行声纹提取操作,得到第一目标声纹;

将第一目标声纹与声纹数据库进行比对,得到第一比对结果;

在第一比对结果为比对成功的情况下,将客户标记为风险客户,并向用户发送风险预警信息;

在第一比对结果为未比对成功的情况下,将客户标记为第三方客户,并将第一目标声纹保存至声纹数据库。

可选地,在本实施例中,上述的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线、或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括RAM,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。

作为一种示例,上述存储器706中可以但不限于包括上述声纹识别装置中的获取模块602、提取模块604、比对模块606、第一标记模块608以及第二标记模块610。此外,还可以包括但不限于上述请求的处理装置中的其他模块单元,本示例中不再赘述。

上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。

本领域普通技术人员可以理解,图7所示的结构仅为示意,实施上述声纹识别方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图7其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图7中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7所示的不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。

根据本发明的实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被处理器运行时执行上述声纹识别方法中的步骤。

可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术分类

06120114703742