乐器、声学

  • 一种单弦琴
    一种单弦琴

    京族单弦琴,历史悠久,流传至今,成为京族人家珍爱的传统乐器,宗族长辈,用单弦琴演奏具有民族风格的乐曲,庆祝节日,拜祭先祖;年轻人,用单弦琴演奏具有民族特色的情歌,隔岸交流,风情独特。单弦琴构造简单,音色独特,低音部分发音悠扬深远,高音部分发音婉转动人,还可以用演奏技巧模仿鸟鸣,人讲话的声音等。但,存在原声音量小;泛音多,基音少;演奏技巧复杂等缺陷。为解决以上问题,本发明提供了一种,通过叠加共鸣的方式,使琴发音洪亮;按照十二平均律的比例在琴体上,设置琴弦发音点相对应的音阶标识,方便演奏;演奏者,以手柄控制定音嘴按压琴弦,使琴发音。可用手指弹拨、拨子碰撞,或者琴弓摩擦琴弦等多种方式演奏的单弦琴。

    2023-08-21
  • 一种智能化语音识别装置
    一种智能化语音识别装置

    本发明公开了一种智能化语音识别装置,包括电源开关、固定盒、固定结构、电源灯、安装罩、控制总成、储备电池、滤波器、散热孔、固定架、喇叭型听筒、放大器和声音接收器,所述固定盒的外侧顶部侧面安装有电源开关,通过将把安装罩和固定架设置为球型,通过在安装架内安装有喇叭型听筒,能够达到多方位采集声音,同时达到提升采集音量的效果,能够扩大识别范围;通过固定结构,可以通过吸盘固定,也可以通过上挤压板与下固定板配合卡接固定,能够随意移动,安装方便,操作简单,通过在固定盒内设置有滤波器和放大器,能够实现对采集音量的处理,去除噪音,扩大音效,能够提高识别的准确度。

    2023-08-21
  • 语音信号处理方法、装置、电子设备及存储介质
    语音信号处理方法、装置、电子设备及存储介质

    本发明涉及人工智能技术领域,公开了一种语音信号处理方法、装置、电子设备及存储介质,所述方法包括:对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;根据至少一次临时识别结果,确定对应的语料集合,所述语料集合包括至少一个语料;若之后的任一次临时识别结果与所述语料集合中的任一语料匹配,将所匹配的语料确定为所述临时识别结果的预测文本。本发明实施例提供的技术方案,提高了文本预测的效率,缩短了智能设备的响应时间。

    2023-08-21
  • 一种同时识别人声和非人声的装置及方法
    一种同时识别人声和非人声的装置及方法

    一种同时识别人声和非人声的装置,包括声源输入单元及与其连接的特征提取单元,所述装置还包括N个识别模型和N个识别结果处理单元,每个识别模型连接有一个识别结果处理单元;所述N个识别模型由人声识别模型和非人声识别模型两种识别模型组成;所述识别结果处理单元对全部识别模型的输出结果进行判断识别为人声或非人声;所述装置还包括识别结果融合单元,所述融合单元的作用是根据人声非人声识别结果处理单元的结果触发上层应用。本发明还公开了一种同时识别人声和非人声的方法。本发明可以解决声源中的多源复杂信号同时分别识别;在保证两者识别效果的情况下,识别响应速度快,反应灵敏。

    2023-08-21
  • 音频处理方法和装置
    音频处理方法和装置

    本申请提供了一种音频处理方法和装置,该方法包括:获得待处理的目标音频以及待识别用户的基准音频;基于目标音频中具有的音频间隔端点,将目标音频划分为至少一个音频段;针对每个音频段,将音频段切分为多个第一音频切片,从多个第一音频切片中确定出第一参照音频切片,并基于第一参照音频切片确定出多个第一音频切片中的第一主音频切片集;基于音频段对应的第一主音频切片集的音频特征以及基准音频的音频特征,从至少一个音频段中确定出属于待识别用户的音频段。本申请的方案可以提高从音频中识别属于特定用户的音频段的准确度。

    2023-08-21
  • 隔音装置及隔音检测单元体和隔音检测流水作业线
    隔音装置及隔音检测单元体和隔音检测流水作业线

    本发明提供一种隔音装置及隔音检测单元体和隔音检测流水作业线,其隔音装置包括隔振密封底板、隔振密封垫板、隔音内罩和隔音外罩,隔音内罩和隔音外罩皆为底部开口的筒体或箱体,隔音内罩以底部开口扣合在隔振密封垫板上,隔音外罩套装在隔音内罩的外部且其内壁与隔音内罩的外壁保持一定的间隙,隔音外罩的开口底部扣合在隔振密封底板上且其底部开口的内缘与隔振密封垫板的外缘密合。本发明提供的隔音装置具有隔音外罩+间隙空腔+隔音内罩的复合隔声结构,使得隔声结构层在整体厚度小于200mm的情况下,可以轻易阻隔55db以上的声音,达到了高效隔音的目的;在隔音装置的基础上可以拓展成为隔音检测单元体并运用于隔音检测流水作业线上。

    2023-08-21
  • 语音合成方法、语音合成装置、存储介质与电子设备
    语音合成方法、语音合成装置、存储介质与电子设备

    本公开提供了一种语音合成方法、语音合成装置、计算机可读存储介质与电子设备,属于语音合成技术领域。所述方法包括:获取其他说话人的多语言语音数据和目标说话人的中文语音文本数据;根据所述多语言语音数据中是否包括文本标签数据确定所述多语言语音数据和所述中文语音文本数据的训练策略;按照所述训练策略训练所述多语言语音数据和所述中文语音文本数据,得到目标说话人的多语言合成模型;获取待合成文本,通过所述多语言合成模型生成待合成文本的预测声学特征;通过声码器将所述预测声学特征转换为所述目标说话人的混合语音数据,以进行播放。本公开可以降低混合语音生成对数据的依赖性,提高合成语音的流利度和自然度。

    2023-08-21
  • 一种民间架子鼓
    一种民间架子鼓

    本发明公开了一种民间架子鼓,包括固定框、挂在所述固定框一端的移动框,所述固定框内部设置有第一镲、第二檫、第三檫,所述固定框顶部设置有与其固定连接的第一锣,与其旋转连接的旋转架、旋转盖,所述移动框一侧设置有用于挂在所述固定框上的挂钩,另一侧设置有与其旋转连接的翻转架,所述移动框内部挂设有第一鼓、第二鼓,所述固定框上端面一侧固定设置有第四镲、第五镲,所述移动框上端面一侧固定设置有第六镲。本发明通过合理的布置实现了一人即可同时操作多种乐器完成演奏的有益效果。本发明构思巧妙,布局合理,操作方便,实用性强,具有较高的推广意义。

    2023-08-21
  • 一种轻质薄膜低频降噪结构
    一种轻质薄膜低频降噪结构

    本发明一种轻质薄膜低频降噪结构,属于降噪结构领域;包括纯聚酰亚胺(PI)膜以及附着在纯聚酰亚胺(PI)膜上的十字型铝合金振子和中心十字振子,所述纯聚酰亚胺(PI)膜外圆周均匀设置一个乙烯乙酸乙烯酯共聚物(EVA)圆环,所述中心十字振子位于纯聚酰亚胺(PI)膜中心位置,十字型铝合金振子分别对称设置在中心十字振子的四周。本发明的降噪结构不仅具有良好的降噪效能,而且可以大幅降低结构重量,实现降噪结构轻质化、小型化要求。

    2023-08-21
  • 人工合成语音检测方法、装置、计算机设备及存储介质
    人工合成语音检测方法、装置、计算机设备及存储介质

    本发明公开了一种人工合成语音检测方法、装置、计算机设备及存储介质,该人工合成语音检测方法包括:采集用户接收到的语音数据;将语音数据输入预训练深度卷积对抗生成网络中,对语音数据进行分帧、加窗处理并提取语音数据的音频特征;对音频特征进行识别分析并获得语音数据的可信度;根据可信度判别语音数据的真实性。通过上述方式,本发明能够通过对抗生成网络对用户接收到的语音数据的真实性进行识别,帮助用户更好地提高对语音诈骗的防范意识。

    2023-08-21
  • 音频处理方法及装置
    音频处理方法及装置

    本说明书提供音频处理方法及装置,其中所述音频处理方法包括:获取携带有原始音频信号的降噪指令;对所述原始音频信号进行降噪处理获得降噪音频信号,并基于所述降噪音频信号确定所述原始音频信号中的噪声音频信号;基于所述降噪音频信号的降噪音频特征以及所述噪声音频信号的噪声音频特征,计算所述原始音频信号的信噪比;根据所述信噪比在所述原始音频信号中筛选出目标音频片段,并根据所述目标音频片段确定响应所述降噪指令的目标音频信号。

    2023-08-21
  • 音频处理方法及装置
    音频处理方法及装置

    本说明书提供音频处理方法及装置,其中所述音频处理方法包括:获取包含至少两个语种的音频文件;确定所述音频文件对应的特征矩阵,并将所述特征矩阵输入至语音识别模型进行处理,获得包含语种识别符的目标文本;根据所述语种识别符确定所述目标文本中包含的至少两个语种分别对应的目标字符,并确定所述音频文件的音频时长;基于所述至少两个语种分别对应的目标字符和所述音频时长计算所述音频文件中声源的语速;实现对存在混合语种的语音语速进行精准的确定,进一步满足不同业务场景的使用需求。

    2023-08-21
  • 语音交互的方法、装置、设备和计算机存储介质
    语音交互的方法、装置、设备和计算机存储介质

    本发明提供一种语音交互的方法、装置、设备和计算机存储介质,所述方法包括:智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果;分别利用本地命令词列表以及云端服务器对所述文本识别结果进行指令解析,并从中选取满足预设选取条件的解析结果作为指令;结束所述录音,执行与所述指令相对应的操作。本发明能够缩短用户与智能设备进行语音交互所需的时间,提升语音交互的效率。

    2023-08-21
  • 音频信号处理方法、装置、设备及存储介质
    音频信号处理方法、装置、设备及存储介质

    本发明实施例提供一种音频信号处理方法、装置、设备及存储介质,该方法包括:首先,在已唤醒语音端点检测VAD的情况下,确定接收到的音频信息中的语音特征;其次,识别已播放的语音合成音频是否包括语音特征;然后,在语音合成音频包括语音特征的情况下,确定语音特征为错误唤醒VAD。由此,解决了设备端“自己跟自己对话”的问题,提高智能语音交流的准确率。

    2023-08-21
  • 语音交互的方法、装置、设备和计算机存储介质
    语音交互的方法、装置、设备和计算机存储介质

    本发明提供一种语音交互的方法、装置、设备和计算机存储介质,所述方法包括:智能设备在进行语音交互时开启录音,获取用户所输入的语音内容及其对应的文本识别结果;将所述文本识别结果在命令词列表中进行匹配后,获取与所匹配的命令词相对应的指令;结束所述录音,执行与所述指令相对应的操作。本发明能够缩短语音交互所需的时间,提升语音交互的效率。

    2023-08-21
  • 一种基于子带信噪比估计的低复杂度双端检测方法
    一种基于子带信噪比估计的低复杂度双端检测方法

    本发明公开了一种基于子带信噪比估计的低复杂度双端检测方法,包括以下步骤。首先将一帧信号通过分解滤波器得到子带信号,并进行降采样处理;其次在每个子带信号的每帧内找最大值,再将其转到对数域,得到阶梯包络;然后分别估计语音包络和噪声包络,得到当前帧的信噪比估计值;最后将子带信噪比映射为双端判决阈值,将自适应判决阈值应用到相关性判决因子上。使系统进入双讲状态时,及时冻结自适应滤波器的更新步长。本发明在复杂的噪声环境下,能有效提高回声抵消器的双端检测的准确率,在音频会议系统中具有良好的应用前景。

    2023-08-21
  • 一种基于语音控制的音量调节方法、装置、设备和介质
    一种基于语音控制的音量调节方法、装置、设备和介质

    本发明实施例公开了一种基于语音控制的音量调节方法、装置、设备和介质。该方法包括:获取用户向智能设备发出的语音指令;对所述语音指令进行语义识别,以确定语义指令;根据所述语义指令确定音量调整策略,其中,相同调整趋势的音量调整策略的数量至少为两种;根据所述音量调整策略对所述智能设备的音量进行调整。该方法强化了基于语音指令进行音量调节的智能化程度,满足了用户的个性化、智能化交互体验需求。

    2023-08-21
  • 自适应的人机语音对话装置和设备、交互系统和车辆
    自适应的人机语音对话装置和设备、交互系统和车辆

    本发明涉及一种自适应的人机语音对话装置,包括:语音获取模块,用于获取语音信;语音识别模块,用于生成语音信息对应的文本信息;语义理解模块,用于分析语音信息对应的语义信息;对话管理模块;用于根据语义信息决定对话过程;对话生成模块,用于基于对话过程生成对话文本;其特征在于,所述人机语音对话装置进一步包括:语音片段形成模块,用于从由语音获取模块所获取的语音信息和由语音识别模块所生成的文本信息形成语音片段组;语音合成模块,用于基于所形成的语音片段组和所生成的对话文本合成语音对话。此外,本发明还包括一种人机语音交互系统、一种车辆以及一种自适应的人机语音对话设备。

    2023-08-21
  • 语音分离方法、装置、介质和电子设备
    语音分离方法、装置、介质和电子设备

    公开了一种语音分离方法、装置、介质和电子设备。其中的语音分离方法包括:获取待处理的时频域混合信号;根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数,获得所述时频域混合信号的分离矩阵;根据所述分离矩阵,从所述时频域混合信号中获得每个声源的时频域信号。本公开提供的技术方案有利于提高语音分离技术的可实施性,从而有利于提高语音分离技术的适用范围。

    2023-08-21
  • 语音识别模块的控制方法、语音识别模块及家用电器
    语音识别模块的控制方法、语音识别模块及家用电器

    一种语音识别模块的控制方法、语音识别模块和家用电器,其中语音识别模块处于休眠状态,且语音识别模块包括麦克风阵列和扬声器,所述方法步骤包括:至少一个麦克风处于唤醒状态,当所述至少一个麦克风接收声音后,控制扬声器发送声波信号;所述至少一个麦克风接收所述声波信号的回声并获取语音识别模块所在空间内的当前回声图谱;对比当前回声图谱和预设回声图谱,以控制语音识别模块。通过该方案,能够实现在检测到用户需要使用语音识别功能时再唤醒语音识别模块,从而节约能耗,降低成本。

    2023-08-21
  • 一种设备组的播放方法、装置和播放系统
    一种设备组的播放方法、装置和播放系统

    本发明公开一种设备组的播放方法、装置和播放系统。本发明的方法包括:从构成设备组的多个播放设备中确定主设备和一个或多个从设备,其中所述主设备与服务器端具有网络连接;建立所述主设备与所述一个或多个从设备之间的组内连接关系;在所述一个或多个从设备获取到用户数据时,基于所述组内连接关系,将所述用户数据传输给所述主设备,所述主设备根据所述用户数据与所述服务器端交互。本发明通过构建设备组中播放设备的主从关系,由主设备与服务器端进行统一的交互,即可实现整个设备组的上下文一致。

    2023-08-21
  • 多语言神经文本到语音合成
    多语言神经文本到语音合成

    本公开提供了用于通过多语言神经文本到语音(TTS)合成来生成语音的方法和装置。可以接收采用至少第一语言的文本输入。可以通过讲话者编码器来提供目标讲话者的讲话者潜在空间信息。可以通过语言编码器来提供第二语言的语言潜在空间信息。可以通过声学特征预测器,基于所述文本输入、所述讲话者潜在空间信息和所述第二语言的语言潜在空间信息来生成至少一个声学特征。可以通过神经声码器,基于所述至少一个声学特征来生成与所述文本输入对应的语音波形。

    2023-08-21
  • 一种动态控制器
    一种动态控制器

    本发明公开了一种动态控制器,属于乐器领域,包括依次电连接的信号缓冲电路、信号放大电路、信号电平检测电路、直流电平保持与缓慢释放电路及执行元件,信号缓冲电路用于对输入的音频信号进行稳定化处理并降低阻抗;放大电路用于对信号缓冲电路处理后的音频信号进行放大,其中设有可调节本电路放大量的电位器;信号电平检测电路用于检测直流电平;直流电平保持与缓慢释放电路中包括实现电流缓慢释放的电容和光耦的发光管,该发光管接收到足够大的直流电流后才在光耦内发光;执行元件为光电阻,其根据接受的光照情况来改变自身电阻值。本发明实现了效果音的动态触发和延时启动,乐音转换衔接自然,且效果音不会影响到弹奏的乐音,音符清晰。

    2023-08-21
  • 关键词检测方法和装置、计算机可读存储介质、电子设备
    关键词检测方法和装置、计算机可读存储介质、电子设备

    公开了一种关键词检测方法和装置、计算机可读存储介质和电子设备,其中,方法包括:对音频信息进行语音识别处理,得到音频信息的至少一个候选关键词;针对至少一个候选关键词的每一候选关键词,确定每一候选关键词对应的两个以上置信度;基于每一候选关键词对应的两个以上置信度,确定每一候选关键词对应的综合置信度;根据每一候选关键词的综合置信度,确定音频信息的目标关键词,当以该目标关键词进行语音唤醒时,由于是基于综合置信度确定的目标关键词,并且综合置信度体现了多个置信度的特点,因此可以实现在提升关键词的识别率的同时,有效降低关键词的误报率,同时兼顾关键词的识别率和误报率,从而获得较好的语音唤醒效果。

    2023-08-21
  • 歌曲生成
    歌曲生成

    本公开内容提供了用于生成歌曲的方法和装置。可以接收文本输入。可以从文本输入中提取主题和情感。可以根据主题和情感来确定旋律。可以根据旋律和文本输入来生成歌词。可以至少根据旋律和歌词来生成歌曲。

    2023-08-21
  • 确定显示的识别文本的方法、装置、设备以及存储介质
    确定显示的识别文本的方法、装置、设备以及存储介质

    本申请实施例公开了确定显示的识别文本的方法、装置、设备以及存储介质,涉及语音识别、自然语言处理等人工智能技术领域。该方法包括:根据采集的用户录音数据流,确定待识别数据流;对待识别数据流进行本地识别,得到离线识别文本;对待识别数据流进行在线识别,得到在线识别文本;基于在线识别文本与离线识别文本的比对结果,确定在线识别文本与离线识别文本中优于表征用户意图的识别文本为显示的识别文本,通过采用在线识别与离线识别并行的方案,既充分发挥了离线识别的速度,又兼有在线识别的准确度,从而既解决了识别文本上屏慢的问题,又能保证识别效果。

    2023-08-21
  • 语音设备及其唤醒方法、装置以及存储介质
    语音设备及其唤醒方法、装置以及存储介质

    本发明公开了一种语音设备及其唤醒方法、装置以及存储介质,所述唤醒方法包括以下步骤:获取多个语音设备发出的唤醒信息,其中,语音设备发出的唤醒信息由该语音设备根据得到的语种信息发出,语种信息和唤醒能量值均由对应的语音设备根据接收到的语音唤醒指令得到;根据唤醒信息,确定待唤醒的语音设备,并生成唤醒指令;将唤醒指令发送至待唤醒语音设备,以唤醒待唤醒语音设备。该唤醒方法,可实现多个语音设备同时对语音唤醒指令进行识别分析,以获取语种信息和唤醒信息,并根据语种信息和唤醒信息确定需要唤醒的待唤醒语音设备,通过向其发送唤醒指令以将该待唤醒设备唤醒,从而实现多个语音设备的唯一唤醒。

    2023-08-21
  • 语音设备及其唤醒方法、装置以及存储介质
    语音设备及其唤醒方法、装置以及存储介质

    本发明公开了一种语音设备及其唤醒方法、装置以及存储介质。其中,语音设备的唤醒方法包括:第一语音设备在接收到语音唤醒指令后,根据语音唤醒指令得到用户信息;第一语音设备将用户信息与自身的能力值进行匹配,得到匹配度;第一语音设备获取至少一个第二语音设备得到的匹配度,并根据多个匹配度确定第一语音设备自身是否进入交互环节;第一语音设备确定自身进入交互环节时,发出提示信息,以进行被唤醒提醒。该语音设备的唤醒方法,可以根据语音唤醒指令提取得到用户信息,进而根据用户信息实现对响应语音唤醒指令的语音设备进行识别,从而实现在有多个语音设备响应语音唤醒指令时唯一唤醒语音设备。

    2023-08-21
  • 语音设备及其唤醒方法、装置以及存储介质
    语音设备及其唤醒方法、装置以及存储介质

    本发明公开了一种语音设备及其唤醒方法、装置以及存储介质,语音设备的唤醒方法,包括以下步骤:第一语音设备响应语音唤醒指令时,播报预设语音信息,并接收至少一个第二语音设备播报的预设语音信息;所述第一语音设备根据至少一个第二语音设备播报的预设语音信息确定至少一个第二语音设备中是否存在与第一语音设备同类型的语音设备;如果至少一个第二语音设备中存在与第一语音设备同类型的语音设备,第一语音设备则根据预设规则确定是否进入交互环节。由此,该唤醒方法可以在多个语音设备均响应语音唤醒指令时,进一步进行唤醒修正,以便实现唯一唤醒功能,提升用户使用体验。

    2023-08-21
  • 语音设备及其交互控制方法、装置以及存储介质
    语音设备及其交互控制方法、装置以及存储介质

    本发明公开了一种语音设备及其交互控制方法、装置以及存储介质。其中,交互控制方法包括:第一语音设备响应语音唤醒指令后,根据预设条件确定自身是否进入交互环节;如果根据预设条件确定自身进入交互环节,则第一语音设备进行交互操作;在第一语音设备进行交互操作过程中,如果不满足交互需求,则广播帮助请求信息,以使至少一个第二语音设备根据接收到的帮助请求信息,确定自身是否进入交互环节。该交互控制方法,可以实现当与用户进行交互的语音设备无法满足用户的交互需求时,可以将与用户进行交互的语音设备切换为其他语音设备,进而通过其他语音设备与用户进行交互,从而满足用户的交互需求。

    2023-08-21
  • 床上耳机导音装置
    床上耳机导音装置

    床上耳机导音装置,解决了耳机在睡眠时与身体接触引起不适,音量调节时要动手会让神经活跃不利于入睡,对听力保护不佳,人会担心辐射或触电等等影响入睡的问题。包括:支持部件和转动导音管,转动导音管上设计有出音口,将该装置固定在床头,将市面上的耳机头放入其上进音口,其上出音口可非接触定位于躺床人的耳朵附近,不会刺激皮肤导致不适,转动导音管与支持部件之间是转动连接的,通过转动,该出音口可调节离耳距离,从而调节输入耳朵的音量,加大该出音口的离耳距离只需通过转动人自身的头部来推动调节,这比动手去找音量调节按钮来调节的神经活跃度更低,人更易入睡,快睡着或睡着后人头部的转动会使出音口远离耳朵,从而更加保护听力。

    2023-08-21
  • 一种基于声纹识别技术的远程身份认证方法及系统
    一种基于声纹识别技术的远程身份认证方法及系统

    本发明公开了一种基于声纹识别技术的远程身份认证方法及系统,远程身份认证方法包括:采集相关人员的个人语音样本和个人身份信息;利用个人语音样本,生成个人识别模型;关联个人识别模型与个人身份信息;集合多个个人识别模型和多个个人身份信息,生成相关人员识别模型库;采集识别人员的个人声纹信息;利用个人声纹信息,采用声纹辨认方法,在相关人员识别模型库中初步确认识别人员的个人身份信息;利用个人声纹信息,采用声纹确认方法,二次确认识别人员的个人身份信息;匹配校验识别人员的个人身份信息与合格人员名单。在本发明实施例中,采用远程身份认证方法及系统能百分百确保对方是合格人员,确保对方业务技能达标,避免造成安全隐患。

    2023-08-21
  • 基于深度学习的猪咳嗽声监测与预警系统
    基于深度学习的猪咳嗽声监测与预警系统

    本发明公开了一种基于深度学习的猪咳嗽声监测与预警系统,它包括数据采集模块、路由、深度学习服务器、云服务器和预警客户端,该系统通过拾音器获取、存储猪舍内采集的音频信息,利用Socket无线通信技术实现本地音频数据实时上传至深度学习服务器,利用声学分析技术对复杂环境下的猪舍声音信号进行预处理与特征获取;研究对比基于双向长短时记忆网络(BLSTM)和深层前馈序列记忆神经网络(DFSMN)的猪咳嗽声变化规律,建立端对端的咳嗽声识别模型;最终形成猪呼吸系统疾病预警平台,高效、精准地实现猪呼吸系统疾病早期预警。

    2023-08-21
  • 音频文件生成方法、装置、设备及计算机可读存储介质
    音频文件生成方法、装置、设备及计算机可读存储介质

    本申请实施例提供一种音频文件生成方法、装置、设备及计算机可读存储介质,涉及人工智能技术领域。方法包括:对接收到的文本和目标对象分别进行特征提取,对应得到文本的第一特征向量和目标对象的第二特征向量;对所述第一特征向量和所述第二特征向量进行拼接,形成拼接特征向量;对所述拼接特征向量进行音频属性特征的预测,得到至少两个具有不同类型的音频属性特征;根据至少两个所述音频属性特征,生成包含有所述文本且具有所述目标对象的声音特性的音频文件。通过本申请实施例,能够提高音频文件生成方法的实际使用范围,提高方法的泛化性。

    2023-08-21
  • 语句处理方法、装置、电子设备及存储介质
    语句处理方法、装置、电子设备及存储介质

    本申请涉及人工智能及语义识别技术领域,公开了一种语句处理方法、装置、电子设备及存储介质,其中,该语句处理方法包括:获取待处理语句;获取待处理语句所包含各词的词向量;将各词的词向量输入至语义识别模型中,通过语义识别模型得到待处理语句对应的语义特征;通过语义识别模型确定语义特征和各候选语义识别结果之间的相似度,并基于各相似度和各所述候选语义识别结果,确定待处理语句对应的语义识别结果。本申请提供的语句处理方法,能够挖掘待处理语句的深层特征,获得待处理语句的准确语义信息。

    2023-08-21
  • 一种基于数据匹配的通信建立方法及装置
    一种基于数据匹配的通信建立方法及装置

    本申请公开了一种基于数据匹配的通信建立方法及装置,所述方法包括获取麦克风接收的语音,判断所述语音中是否存在匹配指令;若存在匹配指令,则获取多条待匹配数据,每条所述待匹配数据都由多个子字符串串联得到;对所述多条待匹配数据进行匹配操作,得到匹配结果;为各个簇生成通信建立请求,所述通信建立请求包括所述各个簇中的数据指向的数据对象,向所述数据对象发送所述通信建立请求;根据所述各个数据对象的反馈结果建立通信连接。本发明可以显著提升复杂对象匹配成功率。

    2023-08-21
  • 一种室内噪音处理系统
    一种室内噪音处理系统

    本申请涉及室内降噪的领域,尤其是涉及一种室内噪音处理系统,其包括噪音接收装置和噪音转换装置,噪音接收装置包括噪音接收器,噪音转换装置包括依次连接的感声单元、处理单元和储能单元;感声单元包括铺设于噪音接收器靠近室内一侧的压电陶瓷片,噪音接收器收集的噪音造成的空气振动挤压压电陶瓷片产生交流电压;处理单元包括滤波电容和变压模块,压电陶瓷片的输出端与滤波电容的输入端连接,滤波电容的输出端与变压模块的输入端连接;储能单元的输入端与变压模块的输出端连接,储能单元用于存储变压模块输出的电能。本申请具有将噪音转化为电能进行储存,能将噪音有效利用起来,从而减小噪音浪费的效果。

    2023-08-21
  • 噪声降低控制方法、烹饪器具和可读存储介质
    噪声降低控制方法、烹饪器具和可读存储介质

    本发明提出了一种噪声降低控制方法、烹饪器具和可读存储介质。其中,噪声降低控制方法,用于烹饪器具,烹饪器具包括音频获取装置,包括:通过音频获取装置获取烹饪器具运行过程中的第一音频信号集合;通过第一音频信号集合训练声学模型,以得到目标声学模型;采集第二音频信号,通过目标声学模型滤除第二音频信号中的第一音频信号。实现了能够将接收到的音频信号中的噪声信号过滤掉,从而达到了对接收到的音频进行降噪的作用,进而提高了烹饪器具中语音识别功能的触发率,避免用户在烹饪器具运行的过程中无法成功唤出语音识别功能。

    2023-08-21
  • 语音控制方法、装置、电子设备及存储介质
    语音控制方法、装置、电子设备及存储介质

    本申请公开了语音控制方法、装置、电子设备及存储介质,涉及自动驾驶、语音交互、语音技术和信息流领域。具体实现方案为:通过对获取到的音频信号流进行能量估计,可以确定出音频信号流中每帧音频信号的能量值,进而可以根据音频信号流中每帧音频信号的能量值,在语音交互界面上动态显示该音频信号流的能量值,解决了用户与电子设备的交互效率低,用户体验差的问题。

    2023-08-21
  • 基于发送无关的表示的节目响度
    基于发送无关的表示的节目响度

    公开了基于发送无关的表示的节目响度。本公开落入音频编码领域中,具体地,本公开涉及提供用于在不同音频输出信号之间提供响度一致性的框架的领域。具体地说,本公开涉及用于对音频数据位流进行编码和解码以便达到输出音频信号的期望响度水平的方法、计算机程序产品和装置。

    2023-08-21
  • 一种基于人工智能的自然语言处理系统
    一种基于人工智能的自然语言处理系统

    本发明属于自然语言处理技术领域,公开了一种基于人工智能的自然语言处理系统,包括:语音识别模块,用于采集、识别语音资料,并将所述语音资料转换为拼音字符所组成的目标文本;语音处理模块,用于对所述目标文本进行纠错及修正处理,并以处理后的目标修正方案作为输出结果进行输出;其中,所述语音处理模块包括:分词单元,用于对所述目标文本进行拼音分词,获得拼音序列;文本分析单元,识别所述拼音序列的错误,并分析所述错误的类型;修正单元,根据所述文本分析单元的分析结果给出至少一个修正方案;优选单元,对至少一个修正方案进行优化筛选,并以优化筛选后的目标修正方案作为输出结果进行输出。

    2023-08-21
  • 音频合成方法、装置及电子设备和计算机可读存储介质
    音频合成方法、装置及电子设备和计算机可读存储介质

    本申请公开了一种音频合成方法、装置及一种电子设备和计算机可读存储介质,该方法包括:获取目标干声音频,并生成目标干声音频对应的音素信息;从目标干声音频中提取音频特征;其中,音频特征包括基频特征、能量特征和感知线性预测特征中任一项或任几项的组合;将目标干声音频、音素信息和音频特征输入训练完成的神经网络模型中得到合成干声音频。由此可见,本申请提供的音频合成方法,将音频特征嵌入到神经网络模型的合成过程中,提升神经网络模型合成干声音频的效率和精准程度,能够增强神经网络模型对目标干声音频的刻画能力,使得训练完成的神经网络模型能够生成音质更好、声音细节更丰富的合成干声音频,从而提高了最终合成歌曲的音质。

    2023-08-21
  • 音色转换方法及装置
    音色转换方法及装置

    本公开提供了一种音色转换方法及装置。通过接收音色转换指令,该音色转换指令包括原始角色输出的第一语音数据和目标角色的音色转换模型标识;加载目标角色的音色转换模型标识对应的音色转换模型,音色转换模型由目标角色对应的音色序列以及至少一个原始训练角色的第三语音数据训练得到;以及根据音色转换指令,通过该音色转换模型将原始角色输出的第一语音数据转换为目标角色输出的第二语音数据,从而可以将用户输出的声音转换为用户希望的任意的目标角色输出的声音,满足不同用户的音色转换需求。

    2023-08-21
  • 室内可调节式消噪设备
    室内可调节式消噪设备

    本申请涉及室内可调节式消噪设备,属于室内消噪设备技术领域,其包括:座体;安装在所述座体顶部承载面上的安装架;以及可调节式设置在所述安装架上的消噪装置,所述安装架与所述座体之间相活动进行连接,其中,所述消噪装置包括:竖直开设在所述安装架侧壁位置处的竖槽;滑移连接在所述竖槽中的竖块;以及安装在所述竖块远离所述竖槽一侧部位处的消噪组件,另外,在所述竖槽位置处设置有用于驱动所述竖块沿着所述竖槽进行竖直方向上位移的驱动部。为了能够更准确地、更灵活地对室内环境进行降噪处理,本申请提供室内可调节式消噪设备,能够根据多个方向的噪音源对收声以及发声设备进行位置调节,有效地将室内环境进行有源消声。

    2023-08-21
  • 车辆语音交互方法、装置、服务器和计算机可读存储介质
    车辆语音交互方法、装置、服务器和计算机可读存储介质

    本申请公开了一种语音交互方法。包括:对接收到的语音请求进行分层处理以得到第一层语音请求信息和第二层语音请求信息;根据预定的策略分别匹配第一层语音请求信息和第二层语音请求信息的策略并得到对应的优先级;对第一层语音请求信息的优先级和第二层语音请求信息的优先级进行融合处理以确定语音请求的执行策略。本申请实施方式的语音交互方法中,将接收到的语音请求进行分层处理,分别判断分层语音请求信息对应的执行策略的优先级,并将各分层的执行策略的优先级进行融合,得到语音请求的最终执行策略。如此,将原本复杂度较高的语音请求的复杂度较低,语音请求具有明确的执行引导策略。本申请还公开了一种语音交互装置、服务器及存储介质。

    2023-08-21
  • 车载语音启动方法、装置、电子设备和存储介质
    车载语音启动方法、装置、电子设备和存储介质

    本申请公开了车载语音启动方法、装置、电子设备和存储介质,涉及智能交通技术领域。具体实现方案为:通过图像采集装置采集车内人员的图像信息;若根据所述车内人员的图像信息确定所述车内人员为车辆的合法人员之外的其他人员,则对监听到的语音信息进行识别;若所述语音信息中包括语音唤醒指令,则启动车载语音助手,用于与所述车内人员进行语音交互。本申请能够提高车载语音启动的安全性。

    2023-08-21
  • 语音交互方法、服务器和计算机可读存储介质
    语音交互方法、服务器和计算机可读存储介质

    本申请公开了一种语音交互方法。包括:对语音请求进行语义理解的结果进行融合处理;对融合处理的结果进行校验以对对话状态信息进行更新从而确定对应语音请求的任务动作;根据预定规则进行决策以确定对应任务动作的任务。本申请实施方式的语音交互方法中,在用户与车辆进行语音交互过程中,在语义理解时融合不同的理解结果,同时结合对话历史,来确定任务和任务的执行动作,利用多维度信息准确理解用户的真实意图,语音交互的智能性和用户体验更佳。本申请还公开了一种服务器及存储介质。

    2023-08-21
  • 语音交互方法、服务器和计算机可读存储介质
    语音交互方法、服务器和计算机可读存储介质

    本申请公开了一种车辆的语音交互方法。语音交互方法包括:对接收的当前轮次语音信息进行场景任务校验;根据所述场景任务校验的结果对在先轮次语音信息对应的场景任务数据进行更新;根据更新后的场景任务数据确定对应当前轮次语音信息的对话动作以与用户进行交互。本申请实施方式的车辆的语音交互方法中,在用户与车辆进行语音交互过程中,通过对当前轮次语音进行校验,从而结合用户语音对当前图形用户界面进行对话状态追踪,使多轮交互过程中的对话更连贯,根据图形用户界面中场景任务数据的变化引导用户准确完整地表达操作意图,语音交互的智能性和用户体验更佳。本申请还公开了一种服务器及存储介质。

    2023-08-21
  • 一种多模式语音识别送话装置及其控制方法
    一种多模式语音识别送话装置及其控制方法

    本发明涉及多模式语音识别及送话领域,具体是一种多模式语音识别送话装置及其控制方法,包括电源模块,还包括:FPGA中央处理模块、2DSP运算处理模块、音视频输入输出模块、人机通信控制模块、软件程序模块,其具体控制方法步骤如下:步骤8.1:初始化及自检测;步骤8.2;判断装置是否正常;步骤8.3;判断装置是否更新;步骤8.4;判断是否为自动设置方式;步骤8.5;环境步骤噪音及光亮;步骤8.6;设置工作模式;步骤8.7;判断是否为模式“X”步骤X值取1至5;步骤8.8;执行送话语音模式;步骤8.9;语音信息输出;步骤8.10;判断是否中断;步骤8.11;判断是否退出;步骤8.12:退出;本发明实现多模式语音识别的送话,提高了语音送话的实时性、准确性。

    2023-08-21
  • 一种设备故障识别方法及系统
    一种设备故障识别方法及系统

    本申请涉及一种设备故障识别方法及系统,其中方法包括:获取目标装置的异常声音信号;确定所述异常声音信号对应的目标声音信号;确定所述目标声音信号对应的目标语义信息;根据所述目标语义信息确定所述目标装置的故障信息。通过本实施例中的方法,在各个位置的目标装置发生故障的时候,无需维修人员到现场进行故障的诊断即可判断得到故障信息;相比于现有技术中的故障排除方法,可以免于报修人员进行的专业性不强的故障情况描述,导致维修人员无法准确获知故障信息的情况;通过对异常声音信号进行分析后获得地准确的故障信息,可以提高后期维修的效率,降低维修周期,提升用户使用体验。

    2023-08-21
技术分类