乐器、声学

双MIC输入的环境声抑制方法、装置、存储介质及设备

本发明公开了一种双MIC输入的环境声抑制方法、装置、存储介质及设备，其中，所述方法包括：在设备上外接一远场麦克风设备，并使得外接麦克风设备与设备内置麦克风设备同时进行音频采集工作，获得外接音频数据和内置音频数据；对外接音频数据和内置音频数据分别进行频域变换处理，获得外接频域音频数据和内置频域音频数据；基于外接频域音频数据和内置频域音频数据分别进行自相关谱和互相关谱计算，获得外接频域音频数据和内置频域音频数据的自相关谱和互相关谱；基于自相关谱和所述互相关谱利用频域相关性函数进行频域增益计算，消除外接音频数据中的环境噪声。在本发明实施例中，可以实现抑制麦克风的环境声音的录入，提升语音的清晰度。

2023-08-21
一种合成歌声音频的方法以及装置

本公开是关于一种合成歌声音频的方法以及装置，属于音频处理领域。所述方法包括：获取预存的平均歌声模型；获取目标歌声数据的目标特征值文本以及目标声学参数；根据所述目标特征值文本以及所述目标声学参数，确定所述目标发音人的特征值文本与声学参数的特征对应表；基于所述目标特征值文本以及所述目标声学参数，对所述平均歌声模型进行训练，得到目标歌声模型；当接收到待合成曲谱时，提取所述待合成曲谱的特征值文本，基于所述待合成曲谱的特征值文本、所述目标歌声模型以及所述特征对应表，得到所述待合成曲谱对应的目标歌声音频。采用本公开，可以提高歌声合成的效率。

2023-08-21
语音生成方法、装置、存储介质和电子设备

本公开是关于一种语音生成方法、装置、存储介质、电子设备，该方法包括：通过预设训练后的情绪分类模型，根据输入语音的声音频谱特征和该输入语音对应的语义文本，确定该输入语音对应的语音情绪标签；从该语义文本中提取认知信息；根据预设的情绪关联模型、预设的文本关联模型、该语音情绪标签和该认知信息确定该语音情绪标签对应的回应情绪标签和该语义文本对应的回复文本；根据该回应情绪标签确定的语调和该回复文本生成针对该输入语音的回复语音。能够获取输入语音的语音情绪和语义文本，并以该语音情绪对应的回应情绪和所述语义文本对应的回复文本生成相应的回复语音，提高智能语音交互的智能化程度。

2023-08-21
音频播放音量的调节方法、装置及存储介质

本申请涉及一种音频播放音量的调节方法、装置及存储介质，属于信号处理技术领域，该方法包括：对每帧音频数据确定音频数据在不失真条件下的音量等级最大值；获取音频文件的音量等级设置值；在音量等级设置值大于音量等级最大值时，按照音量等级最大值对音频数据的播放音量进行调整；可以解决音频文件整体放大时容易出现截止失真的问题；由于对音频文件逐帧进行处理，将可能出现失真的一帧音频数据按照不失真条件下的音量等级最大值进行调整，可以保证放大后的音频数据均不失真，从而可以保证回声消除效果和音频播放效果。另外，通过在调整音频数据时，逐帧调整预设的音量等级间隔值，可以实现音频音量的平滑过渡。

2023-08-21
一种智能语音设备唤醒测试装置

本发明提供了一种智能语音设备唤醒测试装置。包括固定支架、第一夹持组件、第二夹持组件和振动激励器。本发明技术方案通过将振动激励器固定设置在第一夹持组件或第二夹持组件上，以将骨传导麦克风固定于振动激励器上，测试时，振动激励器的振动表面拾取到骨传导麦克风的振动信号，骨传导麦克风拾取振动激励器的激励信号，并传输至主板，以唤醒语音唤醒系统，测试人员以查看语音唤醒系统是否被唤醒，来判断该骨传导麦克风内的唤醒功能是否有效。通过上述结构，可以有效的将骨传导麦克风的振动传递至振动激励，并准确获取振动信号，降低唤醒测试的误差，准确地评判骨传导麦克风送话器功能的优劣性。

2023-08-21
一种信息处理方法、装置、设备及可读存储介质

本发明公开了一种信息处理方法、装置、设备及可读存储介质，涉及人工智能技术领域，以提高为用户推荐的话术的准确性。该方法包括：根据实际话术反馈信息中的话术和用户特征进行显著性检验，得到第一显著性检验结果，所述实际话术反馈信息包括话术、用户特征及反馈信息；根据所述实际话术反馈信息获得显著性检验基准结果；将所述话术和用户特征的组合与反馈信息进行N次随机组合，并根据获得的N个随机话术反馈信息得到第二显著性检验结果，其中，N为大于1的整数；根据所述第一显著性检验结果、所述显著性检验基准结果和所述第二显著性检验结果，确定是否需要利用所述话术进行算法建模。本发明实施例可以提高为用户推荐的话术的准确性。

2023-08-21
声音处理方法、装置、电子设备和可读存储介质

本发明实施例提供了一种声音处理方法、装置、电子设备和可读存储介质，涉及计算机技术领域，通过本发明实施例，电子设备可以基于麦克风阵列中每个麦克风收集的音频数据，确定麦克风阵列的拾音方向特性，即电子设备可以根据收集的音频数据准确确定拾音方向，进而，电子设备可以基于该拾音方向以及多个麦克风进行降噪处理，实现了针对特定声源的定向拾音，即使环境中存在噪音或者电子设备远离该特定声源，电子设备也可以清晰的捕捉该特定声源发出的声音。

2023-08-21
一种语音文本的显示方法、装置、设备及存储介质

本发明实施例公开了一种语音文本的显示方法、装置、设备及存储介质。包括：根据麦克风阵列采集的语音确定音源的第一位置信息；将所述语音转换为文本内容，并根据所述语音的音量确定所述文本内容对应的目标字体大小；根据所述第一位置信息和所述目标字体大小将所述文本内容在设定三维坐标系中显示。本发明实施例提供的语音文本的显示方法，可以将语音文本与说话人的位置及音量对应起来，提高语音文本的显示效果。

2023-08-21
全面屏声控晾衣架及其控制方法

本发明公开了全面屏声控晾衣架及其控制方法。全面屏声控晾衣架包括晾衣架本体和伸缩式剪刀架。底板内嵌有显示屏，显示屏的面积高于底板的面积的80％。晾衣架本体还内置有声控器，声控器与显示屏电连接，声控器通过驱动电机控制绕线机，使得绕线机带动伸缩式剪刀架受控运动。本发明公开的全面屏声控晾衣架及其控制方法，在底板集成显示屏，显示屏占底板的比例较高形成全面屏形态；声控器判断音频信息是否存在预置关键词，当出现任一预置关键词时，语音处理单元通过电机控制单元和/或显示屏控制单元控制驱动电机和/或显示屏执行相应动作。

2023-08-21
一种微缝低频吸声单元及具有其的嵌套式宽带吸声结构

本发明公开的一种微缝低频吸声单元及具有其的嵌套式宽带吸声结构，属于低频减振降噪技术领域。微缝低频吸声单元包括刚性壳体和设置在刚性壳体上的吸声面板，吸声面板和刚性壳体合围形成刚性背腔，吸声面板的一侧设有阶梯型微缝，阶梯型微缝与刚性背腔连通，阶梯型微缝的上端开口尺寸大于下端开口。嵌套式宽带吸声结构中若干微缝低频吸声单元在高度方向上连续叠加嵌套形成多层并联结构，所有阶梯型微缝的上端开口共面设置在顶板上；每个微缝低频吸声单元对应目标吸声频段的一个吸声峰值，嵌套式宽带吸声结构在低频范围内形成连续的多峰值吸声宽带。能够实现宽带低频噪声的高效吸收，且结构紧凑，吸声频段调整灵活，具有良好且广泛的应用前景。

2023-08-21
语音识别方法、装置、设备及计算机可读存储介质

本公开涉及一种语音识别方法、装置、设备及计算机可读存储介质。方法包括：启动麦克风阵列采集第一语音信号，在确定唤醒引擎处于激活状态的情况下，判断所述第一语音信号中是否包含用于响应唤醒词的应答音；在所述第一语音信号中包含所述应答音的情况下，对所述第一语音信号进行去干扰处理；对所述去干扰处理后的第一语音信号进行语音识别。由此，可以避免用于响应唤醒词的应答音对用户输入的语音的影响，从而能够准确识别用户输入的语音，进而做出准确应答，提升语音交互的成功率和用户体验。

2023-08-21
提示信息生成方法及其语音机器人

本发明公开了一种提示信息生成方法及其语音机器人，其中，所述提示信息生成方法包括：获取来自语音模块的语音交互信息，获取来自体征信息采集模块的体征信息；根据所述语音交互信息和所述体征信息，得到用户情绪状态信息；根据所述用户情绪状态信息，生成提示信息；确定当前用户信息，从所述用户信息中获取预先设定的联系号码信息；根据所述联系号码信息发送所述提示信息。通过提示信息生成方法，能够将老年人的情绪以提示信息的形式发送给指定的联系号码，让联系号码对应的联系人能够及时了解老年人当前情绪状态。

2023-08-21
一种基于被动声学的海上风电场生物监测方法及系统

本发明公开了一种基于被动声学的海上风电场生物监测方法及系统，所述方法包括：通过水听器获取风电场海域生物发生的音频流、船舶噪声和海上风电场施工噪音；通过声学信号采集卡对水听器采集的原始音频数据进行水下生物声音采集，在采集完成后转换得到对应的数字音频信号；通过预设声音程序过滤数字音频信号的海洋背景噪声信号，并分离和标记出海洋生物声音信号、船舶噪声信号和海上风电场施工噪音信号；采用NI LabVIEW程序实时显示并分析海洋生物声音信号，得到对应的海洋生物数据，以使根据海洋生物数据完成海上风电场的生物监测。本发明能够综合考虑海洋生物数据以及外界噪声进行海洋生物信号的实时检测和分类，提高海洋生物监测的实时性和全面性。

2023-08-21
声音可视化方法及装置、存储介质、MR混合现实设备

本发明公开了一种声音可视化方法及装置、存储介质、MR混合现实设备，所述方法包括：实时监测目标环境中的声音信号，其中，所述目标环境为MR混合现实设备所在环境；将监测到的声音信号与预存的多种参考声音进行对比，根据对比结果确定监测到的声音信号所属的类型；从监测到的声音信号中筛选出待转换的声音信号；根据监测到的声音信号的类型，将待转换的声音信号转换成与其内容对应的可视化信息，并将该可视化信息与现实场景融合显示，将声音可视化与MR混合现实技术结合起来，能够在现实场景中呈现可视化信息，在不影响听障人士的现实生活的前提下，还能够帮助听障人士感受周围环境的声音。

2023-08-21
一种基于差分运算和联合字典学习的骨导语音增强方法

本发明提供一种基于差分运算和联合字典学习的骨导语音增强方法。训练阶段，在室内无噪环境中，用骨导麦克风和气导麦克风组成的双麦克风阵列同步采集训练语音；对骨导语音和气导语音的训练信号做短时傅里叶变换得到时频谱幅度，计算它们的差分时频谱幅度；在时频谱上学习骨导语音时频谱幅度和差分时频谱幅度的联合语音字典。检测阶段，对于骨导语音进行短时傅里叶变换得到时频谱幅度和相位，将幅度在联合语音字典的骨导语音子字典上进行投影，用得到的最优稀疏表示系数与联合语音字典的差分时频谱幅度子字典一起重建差分语音时频谱幅度，用于补偿骨导语音时频谱，最后做短时傅里叶逆变换，得到增强后的骨导语音时域信号。

2023-08-21
基于语音合成的配音方法、装置、设备和存储介质

本发明公开了一种基于语音合成的配音方法，包括：获取待配音文本，并对所述待配音文本进行预处理；识别所述待配音文本中单个句子的控制参数；其中，所述控制参数包括句子类型、句子情绪和句子关键度中的至少一种；将所述待配音文本中的单个句子和对应的控制参数输入到预先训练好的语音合成模型中，以合成对应的若干条单句语音；将所述若干条单句语音拼接，输出拼接后的配音信号。本发明还公开了一种基于语音合成的配音装置、一种基于语音合成的配音设备和一种计算机可读存储介质。采用本发明实施例，能为文字配音指定合适的发音人和韵律，提高用户体验。

2023-08-21
音频信号的处理方法、装置、终端及存储介质

本公开是关于一种音频信号的处理方法、装置、终端及存储介质，所述方法应用于终端，通过声音采集模组采集音频信号；根据声音参数，确定采集到的所述音频信号的声源位置是否位于预设范围内；当所述声源位置位于所述预设范围内时，识别所述音频信号，从而能够对声源位置在所述预设范围内的声音进行识别，实现针对特定范围内的声音的识别，提升了终端的用户体验。

2023-08-21
一种多目标声信号混叠下的识别方法

本发明公开了一种多目标声信号混叠下的分离识别方法，其特征在于，包含以下步骤：1)采用多传感器采集多目标的混叠声信号，建立线性瞬时混叠的盲分离模型；2)对混叠声信号进行盲源分离得到单信号；盲源分离采用基于滑动窗技术的在线峭度开关算法。本发明用于分离识别低空飞行目标效果好，在处理时变混合系统时具有良好的盲源分离性能。

2023-08-21
交叉横向增强排布隔板填充粘弹性材料水下吸声结构

本发明提供了一种交叉横向增强排布隔板填充粘弹性材料水下吸声结构，包括底板，底板上刚性连接有若干等距分布的竖直隔板，相邻两个竖直隔板之间组成一个元胞，每个元胞内分布有若干水平隔板并填充有密度为500 kg/m3~1000kg/m3粘弹性材料；所述的水平隔板包括与左侧竖直隔板刚性连接的左隔板以及与右侧竖直隔板刚性连接的右隔板，左隔板和右隔板在竖直方向上交错分布。本发明通过结构的合理设计提高粘弹性材料水下吸声性能，解决了宽频吸声性能较差的难题。

2023-08-21
一种语音信号处理方法、装置、存储介质及终端设备

本发明公开了一种语音信号处理方法、装置、存储介质及终端设备，该方法包括：获取语音片段中的N个语音特征；对N个语音特征进行预设的不可逆变换处理，获得N个第一语音特征；将N个第一语音特征划分为K个语音特征块；其中，语音特征块包含若干个第一语音特征，N≥K＞0；分别对每一个语音特征块中的第一语音特征进行调整处理，获得N个第二语音特征；其中，所述调整处理为从第k个语音特征块中截取部分第一语音特征，或者根据第k个语音特征块中的第一语音特征填充新的语音特征；其中，K≥k＞0；将N个第二语音特征输入至预设的声码器中，合成变声后的语音信号；通过本发明难以从变声后的语音信号中识别出用户身份，加强用户的隐私保护。

2023-08-21
一种控制智能家居设备的方法、装置和音响

本发明提供了一种控制智能家居设备的方法、装置和音响，其中一种控制智能家居设备的方法包括获取语音信息及并根据所述语音信息确定声源位置，根据所述语音信息确定对应控制的目标家居设备类型，根据所述目标家居设备类型及所述声源位置，从预先存储的属于所述目标家居设备类型的至少一个待控制家居设备中确定目标家居设备，向所述目标家居设备发送控制指令。本发明能够对语音信息的声源位置进行定位，并根据语音信息的声源位置确定目标家居设备。

2023-08-21
一种确定语音意图的方法及装置

本发明公开了一种确定语音意图的方法及装置，用以实现得到更准确的语音意图，有助于实现语音精准控制。所述方法，包括：获得输入的语音；获得与所述语音相关的情景上下文；将所述语音的语音内容和所述情景上下文，与预设的意图模板进行匹配；根据匹配一致的意图模板，确定语音意图。

2023-08-21
一种基于差分隐私的联邦声纹识别方法

本发明提出一种基于差分隐私的联邦声纹识别方法，包括一：在服务端进行通用背景模型UBM预训练得到初始通用背景模型UBM；二：客户端接收预训练后的初始通用背景模型UBM，利用本地的私有语音数据进行初始通用背景模型UBM的学习；三：客户端学习得到的统计量进行差分隐私保护；四：服务端聚合多个客户端上传的差分隐私保护后的统计量，更新初始通用背景模型UBM；五：客户端接收更新后通用背景模型UBM，借助本地私有语音数据调整得到该客户端用户的高斯混合模型GMM，利用更新后通用背景模型UBM和该用户的高斯混合模型GMM判别待验证语音是否为该客户端用户所产生。

2023-08-21
一种基于RNN和PAD情感模型的情感语音合成方法

本发明公开了一种基于RNN和PAD情感模型的情感语音合成方法，包括：步骤1，基于情感语音库获取训练数据，包括PAD量化标注得到的PAD值、上下文相关标注、以及特征参数MGC、BAP和F0；步骤2，将训练数据输入基于LSTM的RNN模型进行训练，得到训练后的特征参数MGC、BAP和F0；步骤3，基于PAD情感模型，利用欧几里得距离计算用于修正训练后的特征参数MGC、BAP和F0的权重，然后利用权重对训练后的特征参数进行修正；步骤4，将待合成的文本经过文本分析得到上下文相关标注，然后将其与修正后的特征参数MGC、BAP和F0合成为情感语音。本发明将基于LSTM的RNN模型和PAD情感模型加入到语音合成中，解决传统语音合成带来的问题以及语音合成中情感不足的问题，提高了语音合成的自然度。

2023-08-21
语音识别方法、装置及电子设备

本申请提供了语音识别方法、装置及电子设备，适用于人工智能中的语音识别技术领域，可实现端侧语音识别，该方法包括：获取第一语音数据，并利用语音识别模型对第一语音数据进行处理，得到第一语音识别结果。其中语音识别模型是基于变换器架构的模型，且语音识别模型中包含编码器网络、预测网络和联合网络。编码器网络和预测网络中均包含卷积网络。在本申请实施例中，语音识别模型的编码器网络和预测网络均由包含卷积神经网络。因此，本申请实施例中的语音识别模型训练耗时较短。

2023-08-21
用于采掘装备远程控制的人机语音对讲平台

本发明提出了一种用于采掘装备远程控制的人机语音对讲平台，其中，平台通过远程操作设备的麦克风采集远程操作人员发出的语音信号后，声音采集模块获取麦克风采集的语音信号，语音识别模块对语音信号进行语音识别，以得到语音信息，并将语音信息发送至控制器，控制器响应于接收到的语音信息判断采掘装备的整机状态和传感器状态，并将判断结果通过通信模块发送至语音识别模块，语音识别模块根据判断结果生成回复信息后，语音输出模块将接收到的回复信息发送至音箱，以使音箱播放回复信息。由此，远程操作人员在控制采掘装备启动之前，通过语音交互的方式确定采掘装备的整机状态和传感器状态，从而提高了工作效率，降低了人工成本。

2023-08-21
一种双螺旋耦合水下吸声超表面结构

本发明公开了一种双螺旋耦合水下吸声超表面结构，包括层芯，层芯内间隔设置有多个双螺旋耦合单元，每个双螺旋耦合单元的螺旋中心设置有空腔，空腔与螺旋通道间设置有环型隔板，螺旋通道的侧壁上设置有螺旋型的阻尼内衬层，层芯的顶部设置有穿孔上面板，穿孔上面板上对应双螺旋耦合单元的空腔周期性的开有小孔，层芯的底部设置有下面板，穿孔上面板、层芯和下面板连接形成双螺旋耦合水下吸声超表面结构。本发明具有优异的低频吸声性能以及超薄的亚波长结构尺寸。在设计方面具有更多的可调结构参数，可根据实际工况需求进行相应调节，结构简单，易于制造。

2023-08-21
意图识别方法、模型的训练方法及其装置、设备、介质

意图识别方法、模型的训练方法及其装置、设备、介质，所述意图识别模型的训练方法包括：获取预设外呼场景对应的外呼场景训练数据；基于所述外呼场景的候选意图标签集合，将所述外呼场景训练数据输入初始的意图识别模型，进行迁移学习训练，得到完成训练的意图识别模型；其中，所述外呼场景训练数据包括：用于所述外呼场景的训练话术文本集合和所述训练话术文本集合对应的真实意图标签集合，所述意图识别模型包括：已完成预训练的神经网络模型。采用上述方案，提高意图识别准确率，改善客户交互体验。

2023-08-21
高频音频重建技术的集成

本发明揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低频带音频信号滤波以产生经滤波低频带音频信号。所述方法还包含提取指示是对所述音频数据执行频谱平移还是谐波转置的标记且根据所述标记使用所述经滤波低频带音频信号及所述高频重建元数据来再生所述音频信号的高频带部分。将所述高频再生执行为每个音频频道具有3010个样本的延迟的后处理操作。

2023-08-21
针对计算机化个人助手的技能发现

一种计算机化个人助手通信耦合至计算机数据库，所述计算机数据库包括该计算机化个人助手的多种可用技能。该计算机化个人助手识别用户的当前情境。该计算机化个人助手操作先前训练的学习分类器以评估候选技能的匹配置信度，该匹配置信度指示该当前情境与先前关联于该候选技能的基准情境之间的匹配质量。该计算机化个人助手响应于该匹配置信度超过预定义匹配置信度阈值而执行定义与该候选技能相关联的辅助动作的指令。该计算机化个人助手响应于该匹配置信度并未超过预定义匹配置信度阈值而执行定义与该候选技能相关联的补充帮助动作的指令。

2023-08-21
音频处理方法及装置

一种音频处理方法及装置。该方法包括：基于语音活性检测方法从音频信号中截取音频片段；采用滑动窗口方法对所述音频片段进行目标处理，得到所述音频片段的处理结果。由于滑动窗口方法可以在一个或多个窗口中将语音活性检测所截取出的音频片段中包括的噪声排除在外，因此本申请采用滑动窗口方法对音频片段进行目标处理，可以避免音频片段中噪声的影响，从而可以提高音频处理的准确性。

2023-08-21
语音交互设备、方法、装置、电子设备和存储介质

本申请公开了一种语音交互设备、方法、装置、电子设备和存储介质，涉及语音技术、人工交互、回声消除技术领域。具体实现方案为：通过D类(数字)音频功率放大器将待播放的第一语音信号经过脉冲密度调制器调制，以生成第一脉冲密度调制信号；通过处理器根据获取的第一脉冲密度调制信号及数字麦克风阵列采集的音频信号，确定音频信号中包含的语音指令，以对音频信号进行回声消除，并生成第二待播放的语音信号。由此，通过采集脉冲密度调制信号对音频信号进行调制，并采集调制后的脉冲密度调制信号作为回声参考信号，对数字麦克风采集的音频信号进行回声消除，无需模数转换，从而避免了模数转换带来的干扰噪声，改善了回声消除的效果。

2023-08-21
针对基于车辆的有源噪声控制系统的存储的次级路径精度验证

一种有源噪声消除(ANC)系统可包括提供验证存储在次级路径滤波器中的建模的传递特性的精度，这提供对所述次级路径(即，扬声器与误差传声器之间的传递函数)的估计。使用估计的抗噪声或音乐信号来调整来自所述误差传声器的误差信号，信号分析控制器可检测到ANC不稳定性或噪声升高。这种噪声升高可指示所述次级路径滤波器中的所述存储的传递特性没有准确地表示实际次级路径。因此，在检测到噪声升高后，可修改所述次级路径滤波器的所述存储的传递特性。

2023-08-21
驱动模式优化的发动机阶次消除

发动机阶次消除(EOC)系统基于发动机或其他旋转轴RPM而生成前馈噪声信号，并且使用那些信号和自适应地配置的W滤波器通过经由扬声器发射抗噪声来降低车厢内的SPL。一种EOC系统可包括驱动模式检测器，所述驱动模式检测器用于基于对指示当前车辆工况的信号的分析来检测不同车辆驱动模式。在检测时，所述EOC系统可基于所述当前车辆驱动模式来自适应地调整EOC算法的各种调谐参数。所述EOC系统还可根据所述当前车辆驱动模式基于在所述驱动模式期间哪些发动机阶次占优势而选择性地将不同组的发动机阶次作为噪声消除的目标。

2023-08-21
一种单弦琴

京族单弦琴，历史悠久，流传至今，成为京族人家珍爱的传统乐器，宗族长辈，用单弦琴演奏具有民族风格的乐曲，庆祝节日，拜祭先祖；年轻人，用单弦琴演奏具有民族特色的情歌，隔岸交流，风情独特。单弦琴构造简单，音色独特，低音部分发音悠扬深远，高音部分发音婉转动人，还可以用演奏技巧模仿鸟鸣，人讲话的声音等。但，存在原声音量小；泛音多，基音少；演奏技巧复杂等缺陷。为解决以上问题，本发明提供了一种，通过叠加共鸣的方式，使琴发音洪亮；按照十二平均律的比例在琴体上，设置琴弦发音点相对应的音阶标识，方便演奏；演奏者，以手柄控制定音嘴按压琴弦，使琴发音。可用手指弹拨、拨子碰撞，或者琴弓摩擦琴弦等多种方式演奏的单弦琴。

2023-08-21
一种智能化语音识别装置

本发明公开了一种智能化语音识别装置，包括电源开关、固定盒、固定结构、电源灯、安装罩、控制总成、储备电池、滤波器、散热孔、固定架、喇叭型听筒、放大器和声音接收器，所述固定盒的外侧顶部侧面安装有电源开关，通过将把安装罩和固定架设置为球型，通过在安装架内安装有喇叭型听筒，能够达到多方位采集声音，同时达到提升采集音量的效果，能够扩大识别范围；通过固定结构，可以通过吸盘固定，也可以通过上挤压板与下固定板配合卡接固定，能够随意移动，安装方便，操作简单，通过在固定盒内设置有滤波器和放大器，能够实现对采集音量的处理，去除噪音，扩大音效，能够提高识别的准确度。

2023-08-21
语音信号处理方法、装置、电子设备及存储介质

本发明涉及人工智能技术领域，公开了一种语音信号处理方法、装置、电子设备及存储介质，所述方法包括：对智能设备实时采集到的音频流数据进行语音识别，得到临时识别结果；根据至少一次临时识别结果，确定对应的语料集合，所述语料集合包括至少一个语料；若之后的任一次临时识别结果与所述语料集合中的任一语料匹配，将所匹配的语料确定为所述临时识别结果的预测文本。本发明实施例提供的技术方案，提高了文本预测的效率，缩短了智能设备的响应时间。

2023-08-21
一种同时识别人声和非人声的装置及方法

一种同时识别人声和非人声的装置，包括声源输入单元及与其连接的特征提取单元，所述装置还包括N个识别模型和N个识别结果处理单元，每个识别模型连接有一个识别结果处理单元；所述N个识别模型由人声识别模型和非人声识别模型两种识别模型组成；所述识别结果处理单元对全部识别模型的输出结果进行判断识别为人声或非人声；所述装置还包括识别结果融合单元，所述融合单元的作用是根据人声非人声识别结果处理单元的结果触发上层应用。本发明还公开了一种同时识别人声和非人声的方法。本发明可以解决声源中的多源复杂信号同时分别识别；在保证两者识别效果的情况下，识别响应速度快，反应灵敏。

2023-08-21
音频处理方法和装置

本申请提供了一种音频处理方法和装置，该方法包括：获得待处理的目标音频以及待识别用户的基准音频；基于目标音频中具有的音频间隔端点，将目标音频划分为至少一个音频段；针对每个音频段，将音频段切分为多个第一音频切片，从多个第一音频切片中确定出第一参照音频切片，并基于第一参照音频切片确定出多个第一音频切片中的第一主音频切片集；基于音频段对应的第一主音频切片集的音频特征以及基准音频的音频特征，从至少一个音频段中确定出属于待识别用户的音频段。本申请的方案可以提高从音频中识别属于特定用户的音频段的准确度。

2023-08-21
隔音装置及隔音检测单元体和隔音检测流水作业线

本发明提供一种隔音装置及隔音检测单元体和隔音检测流水作业线，其隔音装置包括隔振密封底板、隔振密封垫板、隔音内罩和隔音外罩，隔音内罩和隔音外罩皆为底部开口的筒体或箱体，隔音内罩以底部开口扣合在隔振密封垫板上，隔音外罩套装在隔音内罩的外部且其内壁与隔音内罩的外壁保持一定的间隙，隔音外罩的开口底部扣合在隔振密封底板上且其底部开口的内缘与隔振密封垫板的外缘密合。本发明提供的隔音装置具有隔音外罩+间隙空腔+隔音内罩的复合隔声结构，使得隔声结构层在整体厚度小于200mm的情况下，可以轻易阻隔55db以上的声音，达到了高效隔音的目的；在隔音装置的基础上可以拓展成为隔音检测单元体并运用于隔音检测流水作业线上。

2023-08-21
语音合成方法、语音合成装置、存储介质与电子设备

本公开提供了一种语音合成方法、语音合成装置、计算机可读存储介质与电子设备，属于语音合成技术领域。所述方法包括：获取其他说话人的多语言语音数据和目标说话人的中文语音文本数据；根据所述多语言语音数据中是否包括文本标签数据确定所述多语言语音数据和所述中文语音文本数据的训练策略；按照所述训练策略训练所述多语言语音数据和所述中文语音文本数据，得到目标说话人的多语言合成模型；获取待合成文本，通过所述多语言合成模型生成待合成文本的预测声学特征；通过声码器将所述预测声学特征转换为所述目标说话人的混合语音数据，以进行播放。本公开可以降低混合语音生成对数据的依赖性，提高合成语音的流利度和自然度。

2023-08-21
一种民间架子鼓

本发明公开了一种民间架子鼓，包括固定框、挂在所述固定框一端的移动框，所述固定框内部设置有第一镲、第二檫、第三檫，所述固定框顶部设置有与其固定连接的第一锣，与其旋转连接的旋转架、旋转盖，所述移动框一侧设置有用于挂在所述固定框上的挂钩，另一侧设置有与其旋转连接的翻转架，所述移动框内部挂设有第一鼓、第二鼓，所述固定框上端面一侧固定设置有第四镲、第五镲，所述移动框上端面一侧固定设置有第六镲。本发明通过合理的布置实现了一人即可同时操作多种乐器完成演奏的有益效果。本发明构思巧妙，布局合理，操作方便，实用性强，具有较高的推广意义。

2023-08-21
一种轻质薄膜低频降噪结构

本发明一种轻质薄膜低频降噪结构，属于降噪结构领域；包括纯聚酰亚胺(PI)膜以及附着在纯聚酰亚胺(PI)膜上的十字型铝合金振子和中心十字振子，所述纯聚酰亚胺(PI)膜外圆周均匀设置一个乙烯乙酸乙烯酯共聚物(EVA)圆环，所述中心十字振子位于纯聚酰亚胺(PI)膜中心位置，十字型铝合金振子分别对称设置在中心十字振子的四周。本发明的降噪结构不仅具有良好的降噪效能，而且可以大幅降低结构重量，实现降噪结构轻质化、小型化要求。

2023-08-21
人工合成语音检测方法、装置、计算机设备及存储介质

本发明公开了一种人工合成语音检测方法、装置、计算机设备及存储介质，该人工合成语音检测方法包括：采集用户接收到的语音数据；将语音数据输入预训练深度卷积对抗生成网络中，对语音数据进行分帧、加窗处理并提取语音数据的音频特征；对音频特征进行识别分析并获得语音数据的可信度；根据可信度判别语音数据的真实性。通过上述方式，本发明能够通过对抗生成网络对用户接收到的语音数据的真实性进行识别，帮助用户更好地提高对语音诈骗的防范意识。

2023-08-21
音频处理方法及装置

本说明书提供音频处理方法及装置，其中所述音频处理方法包括：获取携带有原始音频信号的降噪指令；对所述原始音频信号进行降噪处理获得降噪音频信号，并基于所述降噪音频信号确定所述原始音频信号中的噪声音频信号；基于所述降噪音频信号的降噪音频特征以及所述噪声音频信号的噪声音频特征，计算所述原始音频信号的信噪比；根据所述信噪比在所述原始音频信号中筛选出目标音频片段，并根据所述目标音频片段确定响应所述降噪指令的目标音频信号。

2023-08-21
音频处理方法及装置

本说明书提供音频处理方法及装置，其中所述音频处理方法包括：获取包含至少两个语种的音频文件；确定所述音频文件对应的特征矩阵，并将所述特征矩阵输入至语音识别模型进行处理，获得包含语种识别符的目标文本；根据所述语种识别符确定所述目标文本中包含的至少两个语种分别对应的目标字符，并确定所述音频文件的音频时长；基于所述至少两个语种分别对应的目标字符和所述音频时长计算所述音频文件中声源的语速；实现对存在混合语种的语音语速进行精准的确定，进一步满足不同业务场景的使用需求。

2023-08-21
语音交互的方法、装置、设备和计算机存储介质

本发明提供一种语音交互的方法、装置、设备和计算机存储介质，所述方法包括：智能设备在进行语音交互时开启录音，获取用户所输入的语音内容及其对应的文本识别结果；分别利用本地命令词列表以及云端服务器对所述文本识别结果进行指令解析，并从中选取满足预设选取条件的解析结果作为指令；结束所述录音，执行与所述指令相对应的操作。本发明能够缩短用户与智能设备进行语音交互所需的时间，提升语音交互的效率。

2023-08-21
音频信号处理方法、装置、设备及存储介质

本发明实施例提供一种音频信号处理方法、装置、设备及存储介质，该方法包括：首先，在已唤醒语音端点检测VAD的情况下，确定接收到的音频信息中的语音特征；其次，识别已播放的语音合成音频是否包括语音特征；然后，在语音合成音频包括语音特征的情况下，确定语音特征为错误唤醒VAD。由此，解决了设备端“自己跟自己对话”的问题，提高智能语音交流的准确率。

2023-08-21
语音交互的方法、装置、设备和计算机存储介质

本发明提供一种语音交互的方法、装置、设备和计算机存储介质，所述方法包括：智能设备在进行语音交互时开启录音，获取用户所输入的语音内容及其对应的文本识别结果；将所述文本识别结果在命令词列表中进行匹配后，获取与所匹配的命令词相对应的指令；结束所述录音，执行与所述指令相对应的操作。本发明能够缩短语音交互所需的时间，提升语音交互的效率。

2023-08-21
一种基于子带信噪比估计的低复杂度双端检测方法

本发明公开了一种基于子带信噪比估计的低复杂度双端检测方法，包括以下步骤。首先将一帧信号通过分解滤波器得到子带信号，并进行降采样处理；其次在每个子带信号的每帧内找最大值，再将其转到对数域，得到阶梯包络；然后分别估计语音包络和噪声包络，得到当前帧的信噪比估计值；最后将子带信噪比映射为双端判决阈值，将自适应判决阈值应用到相关性判决因子上。使系统进入双讲状态时，及时冻结自适应滤波器的更新步长。本发明在复杂的噪声环境下，能有效提高回声抵消器的双端检测的准确率，在音频会议系统中具有良好的应用前景。

2023-08-21

技术分类

友情链接