乐器、声学

  • 一种双麦克风阵列回声消除方法、装置及电子设备
    一种双麦克风阵列回声消除方法、装置及电子设备

    本申请实施例涉及一种双麦克风阵列回声消除方法、装置及电子设备,所述方法包括:获取远端信号、第一近端信号和第二近端信号;对远端信号、第一近端信号和第二近端信号进行线性滤波处理;分别对第一初始误差频谱、第二初始误差频谱进行质心拟合,获得第一近端信号和第二近端信号的初始抑制增益因子及可变步长因子;利用自适应零极点回声消除器对第一误差频谱和第二误差频谱进行残留回声抑制,获得目标频谱信号;对初始抑制增益因子进行子带范围选取求平滑因子,并进行全频带平滑及指数运算,获得二次抑制增益因子;利用二次抑制增益因子对目标频谱信号进行滤波处理,获得目标近端语音信号。本发明有效提升回声消除效果,提高语音通话质量。

    2023-12-11
  • 用于语音设备的人声识别与增强方法、装置及存储介质
    用于语音设备的人声识别与增强方法、装置及存储介质

    本发明实施例公开了一种用于语音设备的人声识别与增强方法、装置及存储介质,涉及通信技术领域,能够应用于应急救援中需要在面罩内对对讲机的声音进行扩音和声音增强的场景。本发明包括:通过NLMS算法对采集的声音信号进行回声消除,其中,在所采集的声音信号中包括了环境噪音和语音信号;对经过步骤1处理的声音进行频谱分析,并提取符合人声特征的声音信号;通过I I R对符合人声特征的声音信号进行增强处理;将经过增强处理的声音信号送给对讲模块。

    2023-12-11
  • 一种语音切分方法、装置、设备及存储介质
    一种语音切分方法、装置、设备及存储介质

    本公开提供了一种语音切分方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及语音技术领域。具体实现方案为:持续接收目标语音的语音包,在本地缓存接收到的语音包,并向目标VAD服务转发接收到的语音包;接收目标VAD服务检测到的语音片段的信息及切分出的语音片段;监测目标VAD服务是否发生故障;若监测到目标VAD服务发生故障,基于最新接收到的语音片段的信息,确定本地缓存的语音包中待重新切分的语音数据;向新的VAD服务转发待重新切分的语音数据以及接收到的语音包,以使得新的VAD服务对接收到的数据进行语音片段检测并切分语音片段。应用本公开实施例提供的方案能够提高语音切分的容错率。

    2023-12-11
  • 一种K歌宝
    一种K歌宝

    本发明属于移动音频设备技术领域,特别是涉及一种K歌宝。该K歌宝包括喇叭、导声管、导声锥、设有上部空间的箱体以及设有下部空间的手持筒;所述手持筒连接所述箱体,所述喇叭和所述导声管均安装在所述上部空间中,所述喇叭的扬声器伸入所述下部空间,所述导声管上设有连通所述上部空间和所述下部空间的导声通孔;所述导声锥盖合在所述下部空间中,且所述导声锥朝向所述喇叭的扬声器的一侧设有锥形导向面,所述锥形导向面的横截面积自中心位置朝向边缘位置逐渐增大。本发明中,该K歌宝具有较好的立体音效、增强了喇叭的低音特性。

    2023-12-11
  • 采煤机智能控制方法、系统、可读存储介质和采煤机系统
    采煤机智能控制方法、系统、可读存储介质和采煤机系统

    本发明提供了一种采煤机智能控制方法、系统、可读存储介质和采煤机系统,涉及采煤机控制系统技术领域,采煤机控制系统包括语音接收器、地下中转控制器和采煤机控制器,采煤机智能控制方法包括:语音接收器接收语音命令并发送给地下中转控制器;地下中转控制器将语音命令进行转换并发送给采煤机控制器;采煤机控制器基于转换后的语音命令控制采煤机启动或自检或工作。本申请提供的采煤机智能控制方法,通过语音对采煤机进行控制,相比于现有方案都是现场人员现场通过遥控器远程控制端头控制器或机身按钮近距离操作的方案来说,能够快速高效地控制采煤机。无须人工手动对繁多的显示屏界面进行操作了,实现了远程高效控制,大大提高了用户的体验感。

    2023-12-11
  • 重打分模型的训练和语音识别方法、装置、系统及设备
    重打分模型的训练和语音识别方法、装置、系统及设备

    本申请提供一种重打分模型的训练和语音识别方法、装置、系统及设备。该方法包括:获取包括语音样本及语音样本对应的标注文本的第一语音样本和包括语音样本的第二语音样本;确定第二语音样本中语言样本对应的多个候选文本以及候选文本对应的声学得分和语言得分;声学得分用于表征语音样本的可能性词的概率,语言得分用于表征候选文本符合自然语言的概率;对候选文本进行重打分,得到候选文本对应的重打分;根据第一语音样本、第二语音样本、第二语音样本中语音样本对应的多个候选文本以及候选文本对应的声学得分、语言得分和重打分对Transformer网络进行训练,得到重打分模型。

    2023-12-07
  • 声纹识别模型的训练及声纹识别方法、系统、设备和介质
    声纹识别模型的训练及声纹识别方法、系统、设备和介质

    本发明公开了一种声纹识别模型的训练及声纹识别方法、系统、设备和介质,该训练方法包括获取若干样本语音,提取样本语音的每个语音帧对应的声学频谱特征,获取声学频谱特征对应的设定数量维度的目标帧特征,基于目标帧特征处理得到样本语音对应的目标语音特征,基于目标语音特征获取样本语音对应的声纹向量,将同一样本语音对应的声学频谱特征作为输入,对应的声纹向量作为输出,训练得到声纹识别模型;实现了有针对性的提取语音中的声纹信息,对语音中每个语音帧的各个维度进行评估,计算语音帧的维度权重,以选择出重要的声纹信息,减少了声纹识别模型的参数量和计算量,加快了模型的推理时间,提高了模型声纹信息的提取精度和准确率。

    2023-12-06
  • 音频播放方法、装置、设备及计算机可读存储介质
    音频播放方法、装置、设备及计算机可读存储介质

    本发明公开了一种音频播放方法、装置、设备及计算机可读存储介质,属于音视频播放技术领域。本发明通过监测当前所输出的视频画面中是否存在预设特征图像;若存在,则获取所述预设特征图像的发声位置信息;获取所述视频画面对应的原始音频信号,根据所述发声位置信息调整所述原始音频信号得到重建声场位置后的目标音频信号;输出所述目标音频信号以进行音频播放。本发明解决了在播放音频时无法准确还原语音位置,语音临场感较差的技术问题,实现了提升音频播放时的语音临场感和辨识度的技术效果。

    2023-12-06
  • 语音合成模型的训练及语音合成方法、装置、设备和介质
    语音合成模型的训练及语音合成方法、装置、设备和介质

    本申请涉及人工智能技术,提出一种语音合成模型的训练及语音合成方法、装置、设备和介质,该方法包括:获取包含多个文本语音对的数据集;利用数据集对待训练语音合成模型进行训练,获取每个目标训练节点待训练合成模型预测的合成语音;计算每个目标训练节点的样本语音与合成语音之间的重构损失和特征差距;判断每个合成语音是否存在高频噪声;根据重构损失和特征差距对目标合成语音的合成效果进行排序;根据排序结果及附加筛选规则确定合成效果最优的合成语音对应的语音合成模型为已训练的语音合成模型。本申请实现了通过训练节点的模型的重构损失、特征差距以及合成语音是否存在高频噪声多个维度来综合筛选出最优语音合成模型。

    2023-12-05
  • 小样本语种的语音识别方法、装置、电子设备及存储介质
    小样本语种的语音识别方法、装置、电子设备及存储介质

    本发明提供一种小样本语种的语音识别方法、装置、电子设备及存储介质,该方法可以包括:根据获取的小样本语种对应的待识别语音信息,分割为多个帧信息;提取所述多个帧信息中每个帧信息分别对应的语音特征向量;在所述语音特征向量中,确定语音最终特征向量;基于所述目标特征向量,利用预设的编码器‑解码器模型确定所述小样本语种对应的目标语音信息。该方法用以解决现有技术中由于一些待识别语音具有一定的局限性,易导致该电子设备无法准确对上述这些待识别语音进行准确识别的缺陷,实现准确识别小样本语种对应的语音信息。

    2023-12-05
  • 一种基于一阶差分麦克风阵列的信号估计方法
    一种基于一阶差分麦克风阵列的信号估计方法

    本发明提供了一种基于一阶差分麦克风阵列的信号估计方法,首先构建一阶差分麦克风阵列模型,利用该阵列接收信号,并将两麦克风接收到的信号作差,得到时域差值信号。然后对差值信号进行频域分析,可发现其幅频特性曲线有着一种类似梳状的结构,在本发明中称该效应为梳状滤波效应。对该效应进行数学分析,并依据此设计反梳状滤波器。接着利用该滤波器对差值信号进行滤波,即可还原出原信号的频谱,最后结合相位谱还原出原时域信号,实现信号估计的目的。本发明可以有效解决传统信号估计方法的准确度较低,以及基于深度学习的新型信号估计方法计算复杂度较高和鲁棒性差的问题。

    2023-12-05
  • 一种基于二值卷积神经网络的语音唤醒方法及系统
    一种基于二值卷积神经网络的语音唤醒方法及系统

    本发明涉及一种基于二值卷积神经网络的语音唤醒方法及系统,涉及语音识别领域,该方法包括:对语音数据集各语音样本进行MFCC特征提取,获得各语音样本对应的连续MFCC特征帧;以连续MFCC特征帧为教师网络的输入,以对应语音样本的标签为输出训练教师网络,获得训练好的教师网络;基于知识蒸馏方法,采用训练好的教师网络对学生网络进行引导训练,将训练好的学生网络作为语音唤醒系统分类器;学生网络为二值卷积神经网络;将待识别语音信号进行MFCC特征提取,并将提取的连续MFCC特征帧输入语音唤醒系统分类器,将语音唤醒系统分类器的输出输入语音唤醒系统。本发明降低了语音识别的计算量与功耗。

    2023-12-05
  • 语音识别方法和语音识别装置
    语音识别方法和语音识别装置

    公开语音识别方法和语音识别装置。所述语音识别方法包括:接收待识别语音信息;对所接收的待识别语音信息进行音频识别,以确定与所述待识别语音信息对应的命令;执行与所确定的命令对应的操作。

    2023-12-04
  • 中文语音识别纠错方法、装置及电子设备
    中文语音识别纠错方法、装置及电子设备

    本申请提供了中文语音识别纠错方法、装置及电子设备,适用于人工智能中的语音识别技术领域,可以中文语音识别和纠错,该方法包括:获取语音数据,并利用中文语音识别纠错模型对语音数据进行处理,得到修正的中文语音识别结果。其中中文语音识别纠错模型是基于神经网络的模型,包含声学模型和第一文本纠错模型两个子模型,可选地,还可以包含语言模型。在本申请实施例中,采用位置扩张加权构成融合了拼音信息和汉字信息的第一混合批输入,因此,本申请实施例中的中文语音识别纠错模型能够充分利用语音数据的信息,纠错效果较好。

    2023-12-04
  • 语音合成方法及装置、电子设备、计算机可读存储介质
    语音合成方法及装置、电子设备、计算机可读存储介质

    本公开关于一种语音合成方法及装置、电子设备、计算机可读存储介质。该方法包括:将目标对象的语音和待合成文本输入到编码器中,得到第一特征和第二特征,其中,第一特征包含从目标对象的语音提取的特征,第二特征包含从待合成文本提取的特征;将待合成文本输入到时长预测网络中,得到待合成文本中每个文本单元的第一时长,其中,第一时长是待合成文本按所述目标对象的声音呈现的语音中相应文本单元的时长;基于目标语音风格,将每个文本单元的第一时长调整为相应的第二时长;将第一特征、第二特征和第二时长输入到扩帧网络中,得到按第二时长进行扩帧后的第三特征;将第三特征输入到解码器中,得到符合目标语音风格的目标合成语音。

    2023-12-04
  • 语音检测方法、电子设备及计算机存储介质
    语音检测方法、电子设备及计算机存储介质

    本申请实施例提供了一种语音检测方法、电子设备及计算机存储介质,其中,语音检测方法包括:获取待检测的音频数据对应的多个音频帧向量,其中,所述音频数据中包含有至少一个说话人对应的语音数据;对所述多个音频帧向量进行聚类,获得特征聚类结果;从所述特征聚类结果中确定出目标说话人对应的特征向量,并基于所述目标说话人对应的特征向量对所述多个音频帧向量进行掩码,根据掩码结果获得所述目标说话人的音频帧向量。通过本申请实施例,使得提取出的目标说话人的音频帧向量能够准确地代表目标说话人的声音,实现目标说话人音频的精准分离。

    2023-11-30
  • 声学模型训练方法、装置及语音合成方法
    声学模型训练方法、装置及语音合成方法

    本说明书实施例提供一种声学模型训练方法、装置及语音合成方法,其中,所述声学模型训练方法包括:获取多个样本,所述样本包括样本文本输入、与所述样本文本输入对应的样本情感标签以及与所述样本文本输入对应的样本参考梅尔谱;将所述多个样本输入声学模型;基于损失目标,迭代调整所述声学模型的模型参数,直至训练完成。

    2023-11-30
  • 一种语音数据获取方法、装置、电子设备和存储介质
    一种语音数据获取方法、装置、电子设备和存储介质

    本发明公开了一种语音数据获取方法、装置、电子设备和存储介质,方法包括:获取多个说话人的录音数据;将所述多个说话人的录音数据作为训练数据,训练获得每个说话人对应的声音克隆合成模型;获取语音任务所需语音数据的文本信息;利用所述每个说话人的声音克隆合成模型生成所述文本信息对应的语音数据;保存生成的全部语音数据,作为所述语音任务所需的语音数据。本发明提升了语音数据获取效率、减少了传统数据获取方法带来的高昂成本。

    2023-11-30
  • 一种采用级联掩蔽估计的语音分离方法
    一种采用级联掩蔽估计的语音分离方法

    本发明公开了一种采用级联掩蔽估计的语音分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;所述声源分离器采用级联掩蔽估计分离器;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形。本发明的方法为了进一步提高多粒度特征融合的质量和效率,以跨粒度特征融合单元为基础,通过多级细化和逐粒度融合,逐步优化多时间粒度的融合特征,从而提高了分离出的目标信号的质量。

    2023-11-28
  • 一种采用核化听觉模型的单通道声源分离方法
    一种采用核化听觉模型的单通道声源分离方法

    本发明公开了一种采用核化听觉模型的单通道声源分离方法,所述方法包括:将混合声源信号输入编码器,输出隐藏空间矩阵;将隐藏空间矩阵输入声源分离器,输出待分离声源信号的掩蔽矩阵;将隐藏空间矩阵和掩蔽矩阵进行点乘,得到待分离声源信号在隐藏空间的估计值;将估计值输入解码器,输出分离后的目标信号波形;其中,所述编码器和解码器均采用核化听觉模型;所述声源分离器采用基于一维时域卷积的源分离模型,所述编码器和解码器的训练过程和所述声源分离器的训练过程是独立的。本发明的方法在编码器和解码器中引入了模型偏置,有效减少了模型参数,极大降低了模型复杂度。

    2023-11-28
  • 唇语识别方法、样本标注方法、模型训练方法及装置、设备、存储介质
    唇语识别方法、样本标注方法、模型训练方法及装置、设备、存储介质

    唇语识别方法、样本标注方法、模型训练方法及装置、设备、存储介质。本申请涉及人工智能领域的唇语识别技术。本申请实施例中,通过用户的语音识别文本标注用户的唇语视频片段,进而自动得到用户的唇语识别样本,使用该唇语识别样本训练唇语识别模型,通过该唇语识别模型对用户进行唇语识别,实现了唇语识别样本的自动标注、唇语识别模型的自监督主动学习和个性化,有效提高了唇语识别准确率,并且整个过程无需用户参与,提升了用户体验。

    2023-11-28
  • 一种基于常数Q变换的音频特征压缩方法
    一种基于常数Q变换的音频特征压缩方法

    本发明提出了一种基于常数Q变换的音频特征压缩方法用于重放攻击检测,在保证重放攻击检测高性能的同时,大幅度减小数据量、提高模型训练和检测速度、降低设备要求。为了保证检测的高性能,根据CQT变换中分帧特点,选择在时间帧上用求和的方式实现最终的压缩目的,以期不会丢失有效信息。同时对应设计的一维模块的残差网络模型,通过减少网络各层的输出通道数以减少数据量,从而进一步提高训练和检测速度。本发明模型在ASVspoof2019挑战赛的PA数据集上进行实验,在测试集上展现了良好的重放攻击检测性能,并且,与未压缩的特征‑模型相比,模型训练和测试耗时锐减、设备要求较低。

    2023-11-28
  • 降噪组件、降噪模组和家电设备
    降噪组件、降噪模组和家电设备

    本发明提供了一种降噪组件、降噪模组和家电设备,其中,降噪组件包括壳体和降噪口,其中,壳体具有至少两个连通的子腔体。降噪口设于壳体并与至少两个子腔体中的一个子腔体连通。本申请通过令壳体形成多个子腔体,降噪口和多个子腔体形成多腔室噪音吸收结构,从而可以对令噪音与多腔室结构充分作用以吸收声波的振动能量,致使很少的声波能够通过壳体反射或者透射出去,最终达到减少噪声的目的。

    2023-11-28
  • 音频处理方法及音频处理装置以及非暂态计算机可读取媒体
    音频处理方法及音频处理装置以及非暂态计算机可读取媒体

    本发明涉及音频处理方法及装置。所述音频处理方法可包括:利用第一卷积层电路及第二卷积层电路分别对一音频混合信号进行卷积处理,以产生一输入特征图;对所述输入特征图进行对应于一预定神经网络模型的分离处理,以取得分别对应于第一类型及第二类型的第一输出特征图及第二输出特征图;以及利用第一去卷积层电路及第二去卷积层电路分别对所述第一输出特征图的不同部分进行去卷积处理,且利用所述第一去卷积层电路及所述第二去卷积层电路分别对所述第二输出特征图的不同部分进行去卷积处理,以产生对应的处理结果,以供产生多个音频输出信号。

    2023-11-28
  • 车辆语音交互方法、服务器和存储介质
    车辆语音交互方法、服务器和存储介质

    本发明公开了一种车辆语音交互方法、服务器和存储介质。该方法包括:接收车辆发送的用户语音数据以实时进行语音识别得到用户语音请求;在实时识别到的用户语音请求为中间态语音请求的情况下,对中间态语音请求进行补全预测并添加请求头信息得到中间态预测语音请求;对中间态预测语音请求进行预处理得到中间态预处理结果;根据请求头信息对中间态预处理结果进行存储;在实时识别到的用户语音请求为最终态语音请求且与中间态预测语音请求相匹配的情况下,根据对应的中间态预处理结果完成语音交互。本发明通过添加请求头信息区分中间态预测语音请求和最终语音请求,及区分第几次中间态预测语音请求,实现全链路服务识别中间态语音请求。

    2023-11-28
  • 音频数据的处理方法、装置、电子设备及存储介质
    音频数据的处理方法、装置、电子设备及存储介质

    本申请提供了一种音频数据的处理方法、装置、电子设备及存储介质;涉及人工智能领域,方法包括:对音频数据进行信源分离处理,得到至少一种信源类型分别对应的音轨数据;基于每个音轨数据中与信源类型相关的至少一个时间段落,对音频数据中的每个片段分配权重值,并将每个权重值组合形成权重值序列;将从每个片段提取的音频特征组合成音频数据的音频特征序列,对音频特征序列进行编码处理,得到注意力参数序列;对注意力参数序列与权重值序列进行融合处理,得到每个片段的融合参数,并基于每个融合参数确定每个片段的目标参数;基于每个目标参数,确定音频数据中的目标片段。通过本申请,能够从音频数据中准确识别出目标片段。

    2023-11-28
  • 演奏数据识别方法及系统
    演奏数据识别方法及系统

    本申请提供一种演奏数据识别方法及系统,通过采集至少一个演奏事件演奏活动音频数据及音位类别分布概率信息,并基于每个演奏事件的演奏活动音频数据,确定该演奏事件在其所基于的演奏时序图谱下的多种目标指法数据分别对应的目标演奏特征向量,将目标演奏特征向量传递至初始演奏数据识别模型中进行游走训练,获取该演奏事件的预测音位类别信息,基于预测音位类别信息以及音位类别分布概率信息对初始演奏数据识别模型进行模型训练和优化,获取目标演奏数据识别模型。本申请能够训练学习多种不同演奏时序图谱的演奏音位向量,基于这种目标演奏数据识别模型进行目标演奏数据的音位类别识别可以提高演奏数据识别精度。

    2023-11-28
  • 一种无唤醒词的语音控制方法和器件
    一种无唤醒词的语音控制方法和器件

    本发明涉及一种无唤醒词的语音控制方法和器件,涉及语音智能控制领域。所述方法解决了通过局域网语音识别人声指令从而发射红外和射频控制信号;还可以连接因特网,接收由智能终端设备发出的控制指令并通过信号发射模块转化为红外和射频控制信号。信号处理模块可以根据采集到的环境中的声音信息和光线信息,判断环境中是否有人体存在,从而控制语音处理模块启动语音识别功能。所述方法实现了不需要固定唤醒词即可启动语音识别功能,较目前通用的通过固定唤醒词启动语音识别功能的方法,可以有效的提升人机交互的体验和效率。所述方法还实现远程发射红外和射频控制信号,具有智能化程度高,操作简单等优势。

    2023-11-27
  • 声学特征预测模型训练方法、装置、电子设备和计算机可读存储介质
    声学特征预测模型训练方法、装置、电子设备和计算机可读存储介质

    本发明的实施例提供了一种声学特征预测模型训练方法、装置、电子设备和计算机可读存储介质,涉及数据处理技术领域,方法包括:获得待输出文本信息和家居场景对应的训练风格嵌入信息,将待输出文本信息和训练风格嵌入信息输入声学特征预测网络,获得与家居场景对应的待合成声音预测特征,从而实现对家居场景对应的声学特征的可靠预测。

    2023-11-27
  • 一种声纹的特征提取方法及装置
    一种声纹的特征提取方法及装置

    本申请公开了一种声纹的特征提取方法及装置,方法包括:通过语音预处理的方式获取预置语音数据集;将预置语音数据集进行傅里叶变换,得到语音复频谱集,预置语音数据集包括干净语音、噪声和混音;将语音复频谱集中的语音复频谱输入优化神经网络模型中进行特征优化提取,得到目标优化语音特征,优化神经网络模型包括过滤网络层和修复网络层,修复网络层包括残差连接结构。本申请能解决现有声纹处理系统中的语音数据受环境噪声影响较大,导致识别结果的准确性较低的技术问题。

    2023-11-27
  • 数据增强方法、装置、设备及存储介质
    数据增强方法、装置、设备及存储介质

    本申请提供一种数据增强方法、装置、设备及存储介质,涉及计算机技术领域。该方法包括:获取待训练语料,所述待训练语料中每个字预先标注有对应的发音信息;确定所述待训练语料中不同发音信息的评分;根据所述不同发音信息的评分,计算所述待训练语料中每个句子的上采样次数;根据所述上采样次数,对所述每个句子的语音进行多次上采样,得到所述每个句子的上采样语音,所述每个句子的上采样语音包括:所述每个句子对应的所述上采样次数个的语音;输出目标语音集合,所述目标语音集合包括:所述待训练语料中各个句子的上采样语音。本发明可使语音合成训练语料集中发音分布更加均衡,从而达到训练收敛速度更快,语音质量更好和更加稳定的目的。

    2023-11-27
  • 电动作业机及控制由电动作业机产生的噪音的方法
    电动作业机及控制由电动作业机产生的噪音的方法

    本发明涉及一种电动作业机及抑制由电动作业机产生的噪音的方法,其课题在于,能够抑制:用于电动作业机的噪音抑制所需要的计算处理量。本发明的一个方面中的电动作业机具备:马达、参考取得部、噪音控制滤波器、控制音源、误差传感器、二阶滤波器、以及特性调整部。噪音控制滤波器为:包括一系列抽头且能够调整特性的数字滤波器。二阶滤波器为:将控制音源至误差传感器为止的路径亦即二阶系统事先进行建模得到的包括N个抽头的数字滤波器。特性调整部对噪音控制滤波器所具有的一系列抽头中的M个抽头的系数进行更新。M个抽头与一系列抽头的一部分或全部相对应。M、N为:满足M<N的正整数。

    2023-11-27
  • 一种音乐智能拾音方法及装置
    一种音乐智能拾音方法及装置

    本发明涉及一种音乐智能拾音方法,所述方法包括通过模拟信号采集器实时采集模拟信号,并将采集的模拟信号进行滤波;将滤波后的模拟信号进行模拟数字转换;将转换后的数字信号进行滤波并提取。本发明提供的一种音乐智能拾音方法及装置可实现对音乐声音的信号提取,且利用本发明提取到的信号完整可靠,提取方式简单,大大提高了对音乐声音的提取效率,对复杂噪声环境及回声有着很强的适应性。

    2023-11-26
  • 报警方法、装置、设备和存储介质
    报警方法、装置、设备和存储介质

    本公开提供了一种报警方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及语音识别、智能搜索等技术领域。报警方法包括:接收客户端发送的语音数据,所述语音数据为所述客户端检测到用户所在环境的语音数据的语音内容与客户端预设的第一预设语音内容的相似度大于第一预设阈值后发送的;提取所述语音数据的语音内容,以及所述语音数据的声纹特征;若所述提取的语音内容与服务端预设的第二预设语音内容的相似度大于第二预设阈值,且所述提取的声纹特征与所述用户的预设声纹特征一致,生成报警信息,以及,将所述报警信息发送给所述用户的预设求助对象。本公开可以提高报警效果。

    2023-11-26
  • 唤醒词辨识训练系统及其训练方法
    唤醒词辨识训练系统及其训练方法

    本发明实施例公开的一种唤醒词辨识训练系统,包括:语句数据库,储存多笔语句及其中每一笔语句对应的音素序列及语音讯号;音素拆解模块,用于拆解外部输入的唤醒词以取得唤醒词音素序列;音素分析模块,用于将唤醒词音素序列匹配该等语句和/或其音素序列,获取唤醒词类语句和非唤醒词类语句;以及唤醒词辨识模块用于依据该唤醒词类语句和该非唤醒词类语句的音素组合建构一深层神经网络模型,并依据该唤醒词类语句、该非唤醒词类语句的音素序列及语音讯号训练该深层神经网络模型,以建立一唤醒词辨识模型。

    2023-11-26
  • 语音合成配音系统
    语音合成配音系统

    本发明实施例公开了一种语音合成配音系统,包括:一语音输入单元,用于取得一语音信息;一输入单元,用于取得一目标文字信息及一参数调整指令;一处理单元,包括:一声学模块,用于取得该语音信息的一语音特征向量及一声学参数;一文字音素分析模块,用于依据该目标文字信息分析对应该目标文字信息的一音素序列;一音频合成单元,用于依据该参数调整指令调整该语音信息的该声学参数,并将调整该声学参数后的该语音信息结合该目标文字信息形成一合成音频。

    2023-11-26
  • 场景声学风格提取器训练方法、装置、电子设备和计算机可读存储介质
    场景声学风格提取器训练方法、装置、电子设备和计算机可读存储介质

    本发明的实施例提供了一种场景声学风格提取器训练方法、装置、电子设备和计算机可读存储介质,涉及数据处理技术领域,方法包括:获得家居场景在嘈杂声学环境下的声学特征,将家居场景在嘈杂声学环境下的声学特征输入场景声学风格提取器,获得家居场景对应的训练风格嵌入信息。从而实现对家居场景对应的场景声学风格的可靠获取。

    2023-11-26
  • 数据处理方法
    数据处理方法

    本申请涉及语音识别技术领域,公开一种数据处理方法,包括:服务端获得至少一个客户端各自提交的未收敛的训练模型,训练模型由至少一个客户端采用各自的本地语音数据,对用于语音识别的预设模型进行模型训练而得到;以预设模型为基础模型,以训练模型为目标模型,对基础模型和目标模型进行融合,得到融合模型;将融合模型发送至训练模型对应的客户端,以便训练模型对应的客户端继续采用本地语音数据,对融合模型进行模型训练。这样,可以在保证用户的隐私安全的同时,保证模型训练的进度。

    2023-11-26
  • 语音信号基频估计方法和装置
    语音信号基频估计方法和装置

    本发明公开了一种语音信号基频估计方法和装置。所述方法包括:对含噪语音信号进行降噪处理,得到语音短时频谱;根据所述语音短时频谱及其谱包络,提取声源激励短时幅度谱;根据所述声源激励短时幅度谱,提取基频参数。本发明通过对含噪语音信号进行降噪处理,实现运行环境的平稳与非平稳以及相干与非相干噪声的抑制,增强基频估计的鲁棒性;基于声源激励短时幅度谱提取基频参数,提高基频估计的准确度和抗噪能力。

    2023-11-25
  • 一种智能乐器演奏方法及智能乐器
    一种智能乐器演奏方法及智能乐器

    本发明公开了一种智能乐器演奏方法,包括:接收由触控屏上不同按键区域输入的第一信号;接收在第一信号生成同时所述触控屏由于受到不同的按压压力所产生的第二信号,将第一信号和第二信号发送到终端;根据第一信号和第二信号生成对应的乐音并进行播放。本发明还公开了一种智能乐器,包括信号输入装置以及终端,所述信号输入装置至少包括:触控屏、第一处理器以及压力检测模块,所述触控屏以及所述压力检测装置均与所述第一处理器连接,所述终端至少包括第二处理器以及扬声器,所述信号输入装置与所述终端通讯连接。本发明可识别用户的演奏力度,根据不同的演奏力度发出不同的乐音。

    2023-11-25
  • 音频信号处理方法、装置、设备及计算机可读存储介质
    音频信号处理方法、装置、设备及计算机可读存储介质

    本申请提供了一种音频信号处理方法、装置、设备及计算机可读存储介质;方法包括:获取待处理的音频信号;对所述音频信号进行频带分解,得到第一频带信号和第二频带信号,所述第一频带信号的频率低于所述第二频带信号的频率;确定第一频带信号对应的第一信号增益,基于所述第一信号增益确定第二频带信号对应的第二信号增益;基于所述第一信号增益和所述第一频带信号确定处理后的第一频带信号,基于所述第二信号增益和所述第二频带信号确定处理后的第二频带信号;对所述处理后的第一频带信号和所述处理后的第二频带信号进行频带合成,得到处理后的音频信号。通过本申请,能够提高语音处理效率。

    2023-11-25
  • 一种自动与手动自由伴奏和弦琴
    一种自动与手动自由伴奏和弦琴

    目前,乐器之王是钢琴和吉他。它们的演奏难度非常大,要想达到自弹自唱的水准,需要花费很长的时间和很多的精力勤加练习才行。为了使儿童、音乐爱好者、以及专业歌手在很短的时间内,很轻松地学会自弹自唱,本发明提供一种自动与手动自由伴奏和弦琴。它主要由电子音源、MCU、或非逻辑门电路、模拟开关、及其按键和扫弦开关等组成。事先将歌曲的伴奏和弦及旋律的控制代码写入MCU,通过操作自动与手动切换按键切换到手动模式,再通过操作一个自由节拍按键将歌曲的伴奏和弦及旋律的控制代码手动导出,去控制电子音源奏响需要的音符,使演唱者很轻松地完成自弹自唱。

    2023-11-25
  • 一种基于能量算子的病理嗓音频谱重构方法
    一种基于能量算子的病理嗓音频谱重构方法

    本发明提供了一种基于能量算子的病理嗓音频谱重构方法,包括病理嗓音信号基频自适应加窗、计算功率谱、重构功率谱、功率谱的频域平滑处理、计算功率倒频谱、同态滤波以及计算频谱包络。本发明公开的一种基于能量算子的病理嗓音频谱重构方法,改善了病理嗓音频谱分量过于分散的问题,能够有效提取嗓音的主要信息、频谱分量和峰值,获得重构的病理嗓音频谱包络,解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

    2023-11-25
  • 音频对象的比特分配方法和装置
    音频对象的比特分配方法和装置

    公开了音频对象的比特分配方法和装置,涉及音频编解码技术领域,有助于提高重建音频对象的整体质量和编码效率。方法包括:对音频帧中的多个待预渲染音频对象分别进行预渲染,以得到多个预渲染音频对象;获取该多个预渲染音频对象各自的感知重要性参数值,当前预渲染音频对象的感知重要性参数值用于指示当前预渲染音频对象在该多个预渲染音频对象中的感知重要性程度;基于该多个预渲染音频对象各自的感知重要性参数值,获取当前待预渲染音频对象的比特分配参数值;基于当前待预渲染音频对象的比特分配参数值和该多个待预渲染音频对象对应的待分配总比特数,确定为当前待预渲染音频对象分配的目标比特数。方法可应用于立体声编码器或多声道编码器。

    2023-11-24
  • 一种燃油晃动噪声风险识别控制方法、系统和计算机设备
    一种燃油晃动噪声风险识别控制方法、系统和计算机设备

    本发明实施例提供的一种燃油晃动噪声风险识别控制方法、系统和计算机设备,所述方法包括获取燃油箱数据和燃油箱额定容积;根据所述燃油箱数据和所述燃油箱额定容积得到燃油箱最高液位面;根据所述燃油箱数据确定燃油箱上表面,并计算所述燃油箱上表面与所述燃油箱最高液位面的风险识别距离;根据所述风险识别距离判断是否存在燃油晃动噪声风险;当存在燃油晃动噪声风险时,进行风险控制。该方法在燃油晃动噪声风险的识别控制的实际应用中,显著降低了由于车身数据频繁变更导致反复仿真的人力、物力和计算资源大量投入的同时,还降低了研发成本,缩短了研发周期,规避了新车型上市后发生燃油晃动噪声商品性问题的风险。

    2023-11-23
  • 有源噪声控制装置以及车辆
    有源噪声控制装置以及车辆

    一种有源噪声控制装置以及车辆。有源噪声控制装置(10)具有判定部(26)和控制部(28),其中,判定部(26)根据参考信号(rx~rz)的直流分量来判定加速度传感器是否发生了异常,参考信号(rx~rz)由被安装于车辆(12)的加速度传感器(18)获取;控制部(28)在由判定部判定为多个加速度传感器中的任一个发生了异常的情况下,中止根据被判定为发生了异常的加速度传感器所获取的参考信号来生成控制信号(u),并且中止更新对由被判定为未发生异常的加速度传感器获取的参考信号进行滤波处理的自适应滤波器(36)的滤波器系数(W)。据此,能够良好地降低噪声。

    2023-11-23
  • 基于网络电话系统的机器人调度方法、装置、设备及介质
    基于网络电话系统的机器人调度方法、装置、设备及介质

    本公开提供一种基于网络电话系统的机器人调度方法、装置、设备及介质。该方法包括:对语音网关的状态进行持续监测,判断语音网关为正常状态或异常状态;基于语音信号生成语音业务请求,当语音网关为正常状态时,语音网关对语音业务请求进行处理,得到业务请求数据;利用语音识别模块对业务请求数据进行处理,确定用户意图信息;当语音网关为异常状态时,利用网络电话系统将语音信号转发给前台电话机,前台电话机生成语音业务请求并发送给调度网关,调度网关将业务请求数据发送至云管理平台,调度系统基于业务请求数据生成调度指令,并将调度指令下发给目标机器人。本公开实现系统设备故障时,继续调度机器人为用户提供服务,提升机器人调度效率。

    2023-11-23
  • 有源噪声控制装置以及车辆
    有源噪声控制装置以及车辆

    一种有源噪声控制装置及车辆。有源噪声控制装置(10)具有第1自适应滤波器(36C)和第1滤波器系数更新部(40C),其中,所述第1自适应滤波器(36C)通过对与噪声相对应的参考信号(r)进行滤波处理来生成控制信号(uC);所述第1滤波器系数更新部(40C)根据加法误差信号(eC)和参考信号(r)来更新第1自适应滤波器的滤波器系数(W2),其中,所述加法误差信号(eC)是将第1误差信号(eL)和第2误差信号(eR)相加得到的信号,所述第1误差信号(eL)通过第1麦克风(20L)检测残留噪声而得到,所述第2误差信号(eR)通过第2麦克风(20R)检测残留噪声而得到。据此,能良好地降低噪声并且能够实现低成本化。

    2023-11-23
  • 语音控制方法和电子设备
    语音控制方法和电子设备

    本申请提供了一种语音控制方法和电子设备。语音控制方法,应用于语音控制系统,所述语音控制系统至少包括具备语音控制功能的第一电子设备和第二电子设备,所述方法包括:第一电子设备和第二电子设备分别接收用户输入的第一语音指令,所述第一电子设备应答所述第一语音指令;所述第二电子设备录音,并保存录音数据,所述录音用于录制用户输入的第二语音指令;所述第二电子设备向所述第一电子设备发送所述第二电子设备的录音数据;所述第一电子设备根据所述第一电子设备的录音数据和/或所述第二电子设备的录音数据,应答所述第二语音指令;其中,所述第一电子设备的录音数据包括所述第一电子设备录制用户输入的所述第二语音指令的录音数据。本申请实施例可以解决多设备场景中语音控制的误识别问题,提升语音控制的准确率。

    2023-11-23
  • 有源噪声控制装置以及车辆
    有源噪声控制装置以及车辆

    一种有源噪声控制装置以及车辆。有源噪声控制装置(10)具有:基准信号生成部(28X~28Z),其生成与振动传感器(18)的共振频率(f0x~f0z)对应的基准信号(sx~sz);第一自适应滤波器(30X~30Z),其通过对基准信号进行滤波处理来生成模拟在振动传感器共振时得到的信号的传感器共振模拟信号(mx~mz);运算部(32X~32Z),其计算第二参考信号(rx2~rz2),该第二参考信号(rx2~rz2)是由振动传感器获取的第一参考信号(rx1~rz1)与传感器共振模拟信号的差分;和第二自适应滤波器(36X~36Z),其通过对第二参考信号进行滤波处理来生成控制信号(u0x~u0z)。据此,能够良好地降低噪声。

    2023-11-23
技术分类