掌桥专利:专业的专利平台
掌桥专利
首页

用于认证和补偿的方法和系统

文献发布时间:2023-06-19 19:28:50


用于认证和补偿的方法和系统

技术领域

本公开涉及一种用于认证和补偿的方法和系统,并且具体涉及一种基于耳机传递函数(HPTF)针对耳机进行生物特征认证和动态补偿的方法和系统。

背景技术

生物特征认证用于对边缘装置实现无缝用户体验,同时提供装置(诸如手机和膝上型计算机)安全。为了实现更好的用户体验,发明了各种技术来减少意图至动作时间。这个意图至动作时间是由用户希望目标装置执行动作的时刻至边缘装置完成执行的时刻定义的。然后开发了现代识别技术(诸如图像和语音识别技术)以减少意图至动作时间。边缘计算与云服务相结合的最新进展极大地提高了生活质量。

面部识别基于使相机安装在目标装置上,并且大部分是通过使用神经网络相关技术来比较预先注册的面部特征而实现的。然后使用各种技术(诸如基于IR的深度传感器和立体成像)来提高视觉精度。这些方法主要用于防止恶意人员通过展示目标的照片来破坏系统。然而,这些系统在功率消耗和传感器成本方面往往花费更高。此外,在过去两年中,移动装置正试图摆脱使图像传感器前置以实现更高的屏占比。

语音识别基于使传声器捕获声学输入,随后分析输入至预先注册的命令的实时流式传输以进行匹配。由于识别准确度在很大程度上是与SNR结合,因此熟知算法(诸如多传声器和降噪)被用来提高准确度。在功率消耗和传感器成本方面,多通道和降噪技术也花费较高。此外,语音识别需要用户说出关键词,这在公共场合有时可能不方便。

为克服上述不便以及功率消耗和传感器的成本较高的缺点,有必要提供一种改进的认证技术。

此外,通常在许多耳机中,HPTF是通过在仿真人头上使用特殊的耳朵模拟器来测量的。声学工程师根据所测量的HPTF调整耳机的频率响应。然而,由于个体差异,由耳朵模拟器测量的HPTF可能并不令人满意。当最终用户购买耳机并听音乐时,他听到的可能不是声学工程师已调好的期望声音。不同的聆听者在一个耳机中听到不同的声音,即使他们完美地佩戴耳机。此外,尽管耳机具有良好的低音表现,但如果未正确地佩戴耳机,聆听者仍可能听到很少的低音,因为耳机与聆听者的耳朵之间存在大量空气泄漏。

聆听者的个人HPTF涉及在耳机的内表面与鼓膜之间的与所测量的HPTF的反射不同的反射,或者仅仅是因为一些不期望的空气泄漏,这会引入一些音色畸变。

为了通过耳机向不同的聆听者忠实地回放声音,需要对HPTF进行校准和补偿。因此,有必要提供一种改进的技术,用于在认证后使用耳机时自适应且有效地执行实时校准。

发明内容

根据本公开的一个方面,提供了一种针对耳机进行认证和动态补偿的方法。所述方法在用户佩戴耳机时,基于耳机传递函数(HPTF)来针对用户执行认证。所述方法还可以检测用户的HPTF与经调整的HPTF之间是否存在频率响应偏差。此外,如果用户的HPTF与经调整的HPTF之间存在频率响应偏差,则所述方法可以基于检测到的频率响应偏差来动态地补偿用户的HPTF。

根据本公开的另一个方面,提供了一种针对耳机进行认证和动态补偿的系统。所述系统包括存储器和耦合至存储器的处理器。处理器被配置为在用户佩戴耳机时,基于耳机传递函数(HPTF)来针对用户执行认证。此外,处理器被配置为检测用户的HPTF与经调整的HPTF之间是否存在频率响应偏差。此外,处理器被配置为:在用户的HPTF与经调整的HPTF之间存在频率响应偏差的情况下,基于检测到的频率响应偏差,动态地补偿用户的HPTF。

根据本公开的又一个方面,提供了一种包括计算机可执行指令的计算机可读存储介质,所述计算机可执行指令在由计算机执行时,使计算机执行本文公开的方法。

附图说明

图1示出了根据本公开的一个或多个实施方案的FxLMS的系统配置。

图2示出了根据本公开的一个或多个实施方案的针对耳机进行认证和动态补偿的方法的流程图。

图3示出了根据本公开的一个或多个实施方案的构建HPTF模型和认证决策的方法流程图。

图4示出了根据本公开的一个或多个实施方案的基于HPTF对用户进行实时认证的方法流程图。

图5示出了根据本公开的一个或多个实施方案的基于HPTF进行动态补偿的方法流程图。

图6示出了经调整的HPTF曲线、用户的HPTF曲线和对应的补偿曲线的示例性结果。

图7示出了根据本公开的一个或多个实施方案的基于HPTF进行动态补偿的框图。

图8示出了HPTF曲线针对用户的左耳朵的实验结果。

图9示出了HPTF曲线针对用户的右耳朵的实验结果。

为有助于理解,已尽可能使用相同的附图标记来指代附图中通用的相同元件。可以设想,一个实施方案中公开的元件可在无需特别指明的情况下有利地在另一个实施方案中使用。这里所指的附图不应理解成按比例绘制,除非特别注明。而且,为了清楚地说明和解释,通常将附图简化并将细节或部件省略。附图和讨论用于解释下面讨论的原理,其中相同的标号表示相同的元件。

具体实施方式

下面将提供示例进行说明。对各种示例的描述将出于说明目的而呈现,而非旨在详尽或仅限于所公开的实施方案。在不背离所描述实施方案的范围和精神的情况下,许多修改和变化对于本领域普通技术人员来说将是显而易见的。

耳机传递函数(HPTF)被定义为从耳机的扬声器至鼓膜处的声压的声学传递函数。一般来说,不同的耳机或聆听者的个人HPTF有明显差异,因为每个耳机都具有其自身的设计特点,并且每个聆听者也具有其独特的耳朵特性。相应地,本公开将针对基于HPTF的应用提供一些实施方案。例如,在耳机产品中,本文讨论的方法和系统可以应用于生物特征认证。在生物特征认证之后,本发明将提供一种方法和系统,用于进行频率响应偏差的检测和校准,以在耳机产品的使用期间针对个人用户获得期望声音表现。

主动噪声消除(ANC)耳机基于对周围噪声的监测。即,所述耳机使用内部传声器和外部传声器来捕获环境声音。然后,利用经校准回放系统保持周围噪声的幅值并反转其相位,可以再现具有紧密耦合反馈回路的高精度抗噪声。

HPTF涉及两个部分,即自由场测量以及耳廓加耳道与内部传声器之间的冲激响应。由于可以在受控环境中测量自由场测量,并且可以在生产线中校准制造公差,因此剩下的唯一变量是传声器至耳廓加耳道响应,如描绘为耳朵参考点(ERP)至耳朵入口点(EEP)。这个ER P至EEP传递函数(H

图1示出了根据本公开的一个或多个实施方案的FxLMS的系统配置的示意图。可以利用系统识别算法(诸如FxLMS)动态地计算H

w(n+1)=w(n)-μe(n)r′(n) (1)

其中μ是自适应步长,w(n)是在时间n的权重向量,e(n)=d(n)+w

图2示出了根据本公开的一个或多个实施方案的针对耳机进行认证和动态补偿的方法的流程图。如图1所示,在S201处,当用户佩戴耳机时,基于耳机传递函数(HPTF)来针对用户执行认证。认证结果可以用于确定用户是否可以继续使用耳机。然后,为了获得耳机的期望声音表现,可以实时地执行自适应和有效的校准和补偿。例如,在S202处,检测用户的HPTF与经调整的HPTF之间的频率响应偏差。然后,在S203处,基于检测到的频率响应偏差对用户的HPTF执行动态补偿。将在下面说明图1所示方法的具体实现方式。

HPTF认证

在认证应用方面,HPTF差异问题可以变换为识别问题,可以利用统计建模(诸如贝叶斯方法和神经网络)来解决所述识别问题。

为了区分目标用户的通用HPTF,将使用统计模型。在本实施方案(不限于)中,基于所测量的冲激响应来构建高斯混合模型(GMM)。为了构建GMM参考,首先将消声室中的自由场响应测量为H

H

为了提高准确度,可以将数据预处理为幅值数据和相对相位数据,如下所示,

∠H

然后,可以将每个数据点(i)视为向量:每样本数据[幅值,相位]×[左,右],并在每个测试对象的头部上针对不同配件测量所述数据点M次。然后根据GMM模型构建过程对全局模型进行相应的训练,以获得X~N

HPTF模型构建和认证决策

图3示出了根据本公开的一个或多个实施方案的构建HPTF模型和认证决策的方法流程图。

例如,通常可以测量消声自由场换能器至传声器传递函数,即获得H

为了注册新目标,通过使用FxLMS结合存储的H

其中β

为了使用上面创建的模型实现生物认证,距离函数计算如下:如果平均(||X-Y||)>(||Y-μ

运行时HPTF提取模型

图4示出了根据本公开的一个或多个实施方案的基于HPTF对用户进行实时认证的方法流程图。在S401处,当最终用户使用耳机时,可以获得来自传声器和换能器的音频流。任选地,可以在获得来自传声器和换能器的音频流之前执行针对音频回放和用户输入的检查。在S402处,可以如上所述获得换能器与传声器之间的传递函数H

偏差检测和频率响应校准

为了通过耳机向不同的聆听者忠实地回放声音并改善使用的声音体验,可以对HPTF进行校准和补偿。可以使用一些方法来做到这一点。例如,可以使用一种方法:将传声器放入聆听者的耳道内并且执行一次性校准,播放扫频信号或其他特殊测量信号。所述方法可以对HPTF进行补偿,但补偿后只保持较短的时间,因为聆听者可能不会每次都将耳机佩戴在同一位置,这意味着聆听者每次要使用耳机时都必须重复这个校准,否则校准可能无效。本文还公开了一种用于进行实时补偿的改进的自适应且有效的方法。

考虑到聆听者可能佩戴发生空气泄漏的耳机,并且不同聆听者具有不同的HPTF并且通常与标准仿真人头的HPTF有很大差异,本文提出了一种方法,以由声学工程师补偿真实HPTF与精心设计的HPTF之间的差异。

图5示出了根据本公开的一个或多个实施方案的基于HPTF进行动态补偿的框图。在S501处,可以通过FxLMS估计聆听者的HPTFH(f),并且在S502处,获得聆听者的通过FxLMS估计的HPTFH(f)的幅度响应。此外,可以从工程师获得经调整的HPTFH

M(f)=|H(f)|,M

其中|*|是绝对值运算符。然后,在S503处,比较M(f)和M

然后,在S504处,基于检测到的频率响应偏差对用户的HPTF曲线执行动态补偿。例如,平滑且有界的校准函数F(*)被用于获得其差异的经补偿幅度M

M

其中F(*)可以是一些线性或非线性函数,例如,

图7示出了根据本公开的一个或多个实施方案的基于HPTF进行动态补偿的框图。如图7所示,用于动态补偿的系统可以包括预处理单元701、后处理单元702、FxLMS系统703、实时校准单元704和补偿单元705。例如,当用户佩戴耳机听音乐时,可以首先由预处理单元701对音乐输入进行预处理,诸如通过A/D转换、EQ、自适应限幅器、缩混等。然后,经预处理的数据被输入到补偿单元705。通过使用FxLMS系统703,可以如上所述估计聆听者的传递函数HPTF。在实时校准单元704中,将HPTFH(f)的幅度响应与来自工程师的经调整HPTFH

在本公开中,提供了一种新的方式来匿名检测跨不同用户的HPTF之间的个体差异。然后展示基于频率响应偏差可以如何利用差异进行应用(诸如生物特征认证和耳机健康检测)。最后,基于检测到的HPTF与目标曲线之间的增量差异,可以对差异执行动态补偿,并将提供一致的聆听体验。

图8和图9示出了HPTF曲线针对用户的左耳和右耳的实验结果。例如,随机选择5个用户进行实验,并且每个用户正常戴上耳机,以相应地提取HPTF。图8和图9分别示出了针对左耳和右耳的堆叠在彼此之上的每个用户的均值和方差。如根据结果所展示,每个人之间的分布存在可识别的差异,并且可以将其描绘为从上一节提到的特征距离。这个特征距离在500Hz至2kHz以及5kHz至15kHz附近特别明显,因为这些是测试对象之间的耳廓和耳道差异。图8还可指示耳机的左声道存在一些空气泄漏,因为每个用户在200Hz以下的频率响应差异很大。

上面公开了用于使用运行时计算的HPTF模型与可听装置交互的新颖方法。此类动作可以在消费者装置(诸如解锁安全装置(例如移动电话))和声学个性化(例如播放/暂停、加载/存储播放列表)中找到。这同样适用于电子商务和软件服务。例如,用于安全支付的认证协议(例如Google Store)和用于身份识别和验证的会议软件(例如WebEx登录ID自动化会议设置)。本文公开的技术基于来自左耳与右耳两者的在个体之间的HPTF差异,并且为数字认证和人机交互提供替代手段。这也扩展到使用统计分析来确定可听声学行为的方法。

已呈现各种实施方案的描述以用于说明目的,但并非意在详尽或限于公开的实施方案。选择本文使用的术语是为了最好地解释实施方案的原理,对市场上发现的技术的实际应用或技术上的改进,或者使本领域的其他普通技术人员能够理解本文公开的实施方案。

在前面,参考了本公开中呈现的实施方案。然而,本公开的范围不限于具体描述的实施方案。相反,前述特征和元素的任何组合(无论是否与不同的实施方案相关)都被设想为实现和实践设想的实施方案。此外,尽管本文公开的实施方案可以实现优于其他可能解决方案或优于现有技术的优点,但是特定优点是否由给定实施方案实现并不限制本公开的范围。因此,前述方面、特征、实施方案和优点仅仅是说明性的并且不被认为是所附权利要求的要素或限制,除非在权利要求中明确陈述。

本公开的各方面可采用以下形式:完全硬件实施方案、完全软件实施方案(包括固件、常驻软件、微代码等)或组合了软件方面与硬件方面的实施方案,所述各实施方案在本文中一般都可称为“电路”、“模块”、“单元”或“系统”。

本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括一个(或多个)计算机可读存储介质,所述计算机可读存储介质在其上具有计算机可读程序指令,用于使处理器执行本公开的各方面。

计算机可读存储介质可以是可以保持和存储供指令执行装置使用的指令的有形装置。计算机可读存储介质可以是例如但不限于电子存储装置、磁性存储装置、光学存储装置、电磁存储装置、半导体存储装置或前述的任何合适的组合。计算机可读存储介质的更具体示例的不完全列表包括以下各项:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存存储器)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码的装置(诸如具有记录在其上的指令的凹槽中的穿孔卡或凸起结构),以及前述的任何合适的组合。如本文所用,计算机可读存储介质不应理解为暂态信号本身,诸如无线电波或其他自由传播电磁波、通过波导或其他传输介质传播的电磁波(例如,穿过光纤电缆的光脉冲)或通过线材传输的电信号。

本文所述的计算机可读程序指令可以经由网络(例如,互联网、局域网、广域网和/或无线网络)从计算机可读存储介质下载到相应的计算/处理装置,或者下载到外部计算机或外部存储装置。网络可以包括铜传输线缆、光学传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。

本文参考根据本公开的实施方案的方法、设备(系统)和计算机程序产品的流程图图示和/或框图描述了本公开的各方面。应当理解,流程图图示和/或框图中的每个框以及流程图图示和/或框图中的框的组合可以通过计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理设备的处理器以便产生机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令建立用于实施在流程图和/或框图的一个或多个框中规定的功能/操作的手段。

附图中的流程图和框图示出根据本公开的各种实施方案的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。就这一点而言,流程图或框图中的每个框可表示指令模块、指令片段或指令部分,其包括用于实现指定逻辑功能的一个或多个可执行指令。在一些替代实现方式中,框中标注的功能可以以不同于图中标注的顺序发生。例如,连续示出的两个框实际上可以大体上同时执行,或者这些框有时可以按相反的顺序执行,这取决于所涉及的功能。还应注意到,框图和/或流程图图示的每个框,以及框图和/或流程图图示的框的组合,可由执行指定功能或动作或执行专用硬件和计算机指令的组合的基于专用硬件的系统来实现。

尽管前述内容针对本公开的实施方案,但是可在不背离其基本范围的情况下设计出本公开的其他和更多实施方案,且所述基本范围由以下权利要求确定。

相关技术
  • 用于地址生成服务器的用户认证方法、设备、系统及介质
  • 用于认证用户身份的方法、装置和系统
  • 正品认证用标签、该标签的认证代码生成方法、该标签的认证方法及系统、用于认证该标签的便携终端及用于该标签的认证的计算机可读性记录介质
  • 正品认证用标签、该标签的认证代码生成方法、该标签的认证方法及系统、用于认证该标签的便携终端及用于该标签的认证的计算机可读性记录介质
技术分类

06120115928188