乐器、声学

一种语义分析方法、装置、电子设备及存储介质

本发明实施例涉及语音识别领域，公开了一种语义分析方法、装置、电子设备及存储介质。语义分析方法包括：对文字信息实时识别，得到相关的意图领域；实时识别为由语音指令每新转化一个单位文字信息，对已转化的所有的文字信息进行一次识别，保留每次识别得到的相关的意图领域；判断相关的意图领域的个数；若相关的意图领域的个数大于N，确定有效意图领域；根据有效意图领域进行语义解析。本发明实施例中，对文字信息实时识别，能够提高语义识别过程中的对多意图的识别效率，更完整的收集到用户意图领域；对于识别出的意图领域数量过多的情况，通过对意图领域进行判断，确定有效意图领域，使得语义解析更集中于用户意图。

2023-08-21
一种声音处理方法及装置

本发明提供了一种声音处理方法及装置，解决了目前市面上非专业声音处理设备功能简单、处理效果单一，且处理时间过长的问题。所述声音处理方法包括：采集初始声音信号，将所述初始声音信号分离出进行声音处理的部分；将所述声音处理的部分输入深度学习模型，对所述声音处理的部分卷积混响函数得到美化后的声音信号；将所述美化后的声音信号转换成音频并输出。

2023-08-21
音频数据降噪的方法、装置、设备及存储介质

本申请公开了一种音频数据降噪的方法、装置、设备及存储介质，属于计算机技术领域。所述方法包括：获取待降噪的音频数据的频谱数据，提取所述频谱数据的实部数据和虚部数据；将所述频谱数据的实部数据和虚部数据，输入噪音修正模型，得到所述实部数据对应的第一修正数据和所述虚部数据对应的第二修正数据；基于所述第一修正数据和所述第二修正数据，得到复数修正数据；基于所述复数修正数据，对所述待降噪的音频数据进行降噪处理，得到降噪后的音频数据。通过本申请可以减小降噪对音质的影响。

2023-08-21
人机交互设备以及相应的可移动的用户终端

本发明涉及人机交互领域。更具体涉及一种人机交互设备(100)，其包括控制装置(10)和与控制装置(10)通信连接以能被控制装置(10)操控的至少一个被控装置(30)，控制装置(10)配置成能确定可移动的用户终端(200)所处的位置和朝向并基于所确定的位置和朝向来识别用户终端(200)所朝向或指向的被控装置(30)以作为被用户的语音指令所操控的对象。还涉及一种能与所述人机交互设备通信连接的可移动的用户终端，用户终端包括用于检测用户终端的位置和/或方向的传感器并将所检测的位置和/或方向数据传输给人机交互设备，特别地用户终端还包括用于接收用户的语音输入的语音输入装置。通过本发明能方便且精确地标定想要语音控制的目标智能设备。

2023-08-21
语音应答的方法、装置、及设备及计算机可读存储介质

本申请提供了一种语音应答的方法、装置、设备以及计算机可读存储介质，包括：获取用户语音，依据用户语音的语音特征以及语音内容，确定用户语音对应的语调类型，基于用户语音对应的语调类型，以及语音内容，生成与用户语音对应的应答语音，最后播报应答语音。因为播报的应答语音是根据用户语音的语调类型，以及语音内容得到的，所以只要用户语音的语调类型不同，播报的应答语音可以不同，实现了根据用户语音进行个性化的回应，从而可以提高用户的体验感。另外，用户语音对应的语调类型，是根据用户语音的语音特征以及语音内容两个维度确定的，所以户语音对应的语调类型具有较高的准确度，从而可以提高播报的应答语音的准确性。

2023-08-21
一种语音处理方法、装置、电子设备及存储介质

本公开关于一种语音处理方法、装置、电子设备及存储介质，该方法包括：获取目标语音；将所述目标语音输入至语音处理模型的语音识别网络，根据所述语音识别网络的隐藏层的输出得到语音特征提取结果；所述语音特征提取结果包括所述目标语音的文本特征和高级语义特征；将所述语音特征提取结果输入至所述语音处理模型的语义理解网络，得到所述目标语音的语义理解结果。本公开提高了对输入语音内容理解的准确性，当应用于直播视频内容的异常检测时，可以提高对直播视频内容异常检测的准确性。

2023-08-21
基于声纹识别的信息推荐方法、装置、电子设备及存储介质

本申请公开了基于声纹识别的信息推荐方法、装置、电子设备及存储介质，涉及深度学习、语音识别、车联网等人工智能领域。具体实现方案为：获取第一用户发起的语音请求；响应于语音识别操作，对所述第一用户发起的语音请求根据预设的声纹识别结果进行识别，所述声纹识别结果中包含至少一个用户的声纹信息，其中，所述至少一个用户中的每个用户的声纹信息对应一个用于信息推送的配置信息；根据所述第一用户的声纹信息，获取到与所述第一用户的声纹信息对应的配置信息；为所述第一用户发送基于所述配置信息得到的推荐信息。采用本申请，可以为区别出的不同用户针对性的发送推荐信息，提高与用户互动的便捷性及信息定向推荐的准确性。

2023-08-21
唤醒设备的方法、装置、电子设备及存储介质

本公开实施例公开了一种唤醒设备的方法、装置、电子设备及存储介质，所述方法包括：检测唤醒语音；响应于检测到所述唤醒语音，开启蓝牙扫描功能；基于所述蓝牙扫描功能扫描基于检测到所述唤醒语音发送的广播消息；其中，所述广播消息，至少携带有响应优先级；基于所述广播消息携带的响应优先级和所述电子设备的响应优先级，确定所述电子设备是否开启响应语音指令的语音信号识别功能。本公开实施例中，在检测到唤醒语音后，可以优先让高的所述响应优先级的电子设备开启响应语音指令的语音信号识别功能，减少检测到所述唤醒语音的低的所述响应优先级的电子设备也开启响应语音指令的语音信号识别功能的情况，提升了用户使用电子设备的体验。

2023-08-21
无感语音认证方法、装置、设备及存储介质

本发明实施例公开了一种无感语音认证方法、装置、设备及存储介质。其中，方法包括：在语音交互过程中获取用户的待认证语音指令；根据预设的声纹特征库中当前帐号预留的标准声纹特征，对所述待认证语音指令进行认证；如果所述待认证语音指令认证成功，则执行与所述待认证语音指令对应的操作。本发明实施例基于语音交互过程中用户的语音指令进行用户身份认证，并根据认证成功的语音指令完成业务流程，可以使用户在无需额外操作、业务流程不中断的情况下完成身份认证，优化用户体验，提升用户帐号安全性。

2023-08-21
一种发声方式判别方法及系统

本发明属于声音识别技术领域，具体为一种发声方式判别方法及系统。本发明方法包括：获取各发声方式对应的音频数据；采用滑窗方式在各音频数据上连续截取设定长度的音频作为样本数据，相邻样本数据有设定量的重叠；对各样本数据进行降采样、分帧加窗、傅立叶变换以及梅尔滤波，得到各样本数据的梅尔谱；对样本数据的梅尔谱进行标准化，以样本数据标准化后的梅尔谱为输入，以Adam为优化函数，以交叉熵为损失函数训练神经网络；采用训练好的神经网络对待识别音频数据进行发声方式的判别。本发明简化了发声方式的判别方法，降低了成本。本发明在相关源任务即歌声技巧分类的任务上做了预训练，加快了神经网络的训练速度。

2023-08-21
语音样本生成方法及装置、存储介质、电子装置

本发明实施例提供了一种语音样本生成方法及装置、存储介质、电子装置，其中，语音样本生成方法包括：获取第一语音样本与第二语音样本，其中，第一语音样本为第一对象未佩戴口罩的情形下产生的语音样本，第二语音样本为第一对象佩戴口罩的情形下产生的语音样本；根据第一语音样本与第二语音样本建立样本生成模型；获取第三语音样本，并根据第三语音样本与样本生成模型生成目标语音样本；其中，第三语音样本为第二对象未佩戴口罩的情形下产生的语音样本。因此，本发明实施例可以解决相关技术中对于用户佩戴口罩的情形下产生的语音样本无法有效获取的问题，以达到高效获取用户佩戴口罩的情形下产生的语音样本的效果。

2023-08-21
基于长连接的流式语音识别方法和系统

本公开提供了一种基于长连接的语音识别方法和系统，该语音识别方法应用于语音处理服务器，该语音识别方法包括：接收多个终端设备发送的语音流；对每一个所述语音流进行分片以获取分片语音数据，所述分片语音数据携带有分片标记；通过长连接的方式将所述分片语音数据发送给语音识别服务器以进行识别。本公开的上述语音识别方法使语音处理服务器与语音识别服务器之间能够通过长连接的方式始终保持着通信状态并进行数据传输，避免了频繁创建和销毁短连接，而导致占用语音处理服务器和/或语音识别服务器运行内存的情形，进而提升了语音处理服务器与语音识别服务器之间的通信能力。

2023-08-21
一种语音智能床头柜及其语音处理方法、语音控制系统

本申请涉及智能家具的领域，尤其是涉及一种语音智能床头柜及其语音处理方法、语音控制系统，语音智能床头柜包括柜体内设有智能音箱模块，智能音箱模块包括若干麦克风，柜体上若干个侧面均设有声音接收口，声音接收口的位置分别对应麦克风的位置。本申请具有提高床头柜内的智能音箱的语音接收效果的作用。

2023-08-21
一种基于人工智能的多模态语义识别服务接入方法

本发明公开了一种基于人工智能的多模态语义识别服务接入方法，包括基于多模态对齐的语音情感识别的模型，首先通过语音进行识别，识别时，通过视频设备、录音设备进行语音的收集，收集好的语音信息先进行分类，分类后的语音进行特征标记，然后将收集好的语音进行分析，利用双向长短期记忆模型对音频基于帧进行高维特征表示。本发明利用多模态模型比单一模态训练出的模型更精准，所以即使在实际使用中只使用一个模态输入，由多模态训练得到的模型也会优于单模态训练得到的模型，对不同模态的关联融合进行中间层特征融合和最后层的融合时，每种模态的特征识别产生各自的置信度，从而在互相融合时将置信度作为贡献的权重。

2023-08-21
一种多音字待标语料的筛选方法、装置、设备及存储介质

本发明公开了一种多音字待标语料的筛选方法、装置、设备及存储介质，包括：获取原始文本语料；生成汉字字串字典及字串文本字典，所述汉字字串字典用以记录汉字映射到包含所述汉字的全部字串组成的列表，所述字串文本字典用以记录字串映射到包含所述字串的全部文本组成的列表；循环遍历字典，从所述汉字字串字典中取出多音字汉字，以使文本数量达到预设数值，并生成候选文本列表；选择待标汉字，通过所述候选文本列表，获取待标文本列表；从所述待标文本列表中依次记录每个文本的信息，以得到输出文本列表。本发明能够收集题材类型全面的原始文本语料，确保文本语料对题材类型、语言风格覆盖全面。

2023-08-21
车辆控制方法、车载无屏装置、服务器及可读存储介质

本发明公开了一种车辆控制方法，所述车辆控制方法用于车载无屏设备，所述车辆控制方法包括：接收语音信息，将所述语音信息发送至服务器，以使所述服务器根据所述语音信息生成文本指令，并根据所述服务器中的预设数据库查询与所述文本指令匹配的控制指令，在所述文本指令与所述控制指令匹配的情况下，将所述控制指令发送至与所述车载无屏设备绑定的车辆，以控制该车辆执行与所述控制指令对应的操作。本发明整个车辆控制过程用户只需语音操作即可，无需用户手动操作，还可减少交通事故发生的可能性。此外，无屏车载设备具有语音输出、输入功能，不具备显示功能，还可降低车载无屏设备的生产成本。

2023-08-21
目标设备的确定方法及装置、存储介质、电子装置

本发明实施例提供了一种目标设备的确定方法及装置、存储介质、电子装置，该方法包括：对获取到的第一语音信号进行去噪处理，得到第一目标语音信号；在从第一目标语音信号中检测到唤醒词的情况下，确定唤醒词的长度；基于唤醒词的长度从第一语音信号中获取第二语音信号，其中，第二语音信号的长度小于第一语音信号；对第二语音信号进行去噪处理，得到第二目标语音信号；确定第二目标语音信号的判决量，以确定响应第二目标语音信号的目标设备，其中，判决量用于表示目标语音信号的能量。通过本发明，解决了相关技术中确定的响应设备不准确的问题，达到准确确定响应设备的效果。

2023-08-21
智能问答中语音数据的处理方法、装置及相关设备

本发明公开了一种智能问答中语音数据的处理方法、装置、计算机设备及存储介质方法，应用于人工智能技术领域，用于解决由用户口音导致的难以准确识别到用户意图从而无法向用户提供正确业务答案的技术问题。本发明提供的方法包括：接收到智能终端发送的待识别的语音数据，并将该语音数据转换为文字；通过语意意图识别系统从该文字中提取若干个原始关键字，得到包括若干个该原始关键字的原始意图关键字集；获取到与原始关键字相对应的目标关键字时，用该目标关键字替换该原始意图关键字集中对应的原始关键字，得到包括有目标关键字的目标意图关键字集；获取与目标意图关键字集相关联的业务问题和业务答案；将业务问题和业务答案发送至该智能终端。

2023-08-21
一种具备往复加长与宽弧渐开槽弦勾的提琴拉弦板

本发明提供了乐器技术领域的一种具备往复加长与宽弧渐开槽弦勾的提琴拉弦板，包括：一个主拉弦板，中部设有一滑槽，头部设有四个弦勾通槽，底部设有一主盲孔与两个尾绳通孔；各弦勾通槽与滑槽之间设有螺孔；滑槽内设有一副拉弦板，副拉弦板的两端分别设有顶杆定位孔与副盲孔；一顶杆，一端顶着副盲孔，另一端顶着主盲孔，构成主副拉弦板往复接力加长；四个宽弧渐开槽弦勾，具有渐开槽以及宽弧面，并设于各弦勾通槽内；渐开槽，无损琴弦球头弦勾；宽弧面，滚碾弦勾通槽内壁的降噪音准微调。本发明的优点在于：极大的减轻了因环境湿度变化而导致的音准偏移，琴码弯曲、琴面损伤，避免了琴弦弦芯及球头缠丝的损伤，有效地降低了噪声。

2023-08-21
声源定位方法、装置、设备和计算机存储介质

本申请公开了一种声源定位方法、装置、设备和计算机存储介质，涉及人工智能、深度学习和语音技术领域。具体实现方案为：获取语音信号；将所述语音信号输入声源定位模型，获取所述声源定位模型输出的各帧的唤醒词识别信息和各帧的声源方向信息；利用所述唤醒词识别信息确定唤醒词区间；利用所述唤醒词区间和所述各帧的声源方向信息，确定唤醒词的声源方向；其中，所述声源定位模型基于复数卷积神经网络预先训练得到。本申请能够在远场条件下实现对唤醒词的准确声源定位。

2023-08-21
终端唤醒方法、装置及计算机可读存储介质

本公开涉及一种终端唤醒方法、装置及计算机可读存储介质，所述方法应用于第一终端，所述第一终端为目标声学空间中的任一终端，包括：获取目标声学空间中候选终端的唤醒参数，其中，所述唤醒参数用于表征所述候选终端的唤醒优先级；根据所述第一终端的唤醒参数和所述候选终端的唤醒参数确定目标唤醒终端；若所述目标唤醒终端为所述第一终端，控制所述第一终端对接收到的语音消息进行唤醒词检测；在检测到唤醒词的情况下，唤醒所述第一终端。由此，在同一声学空间中只有目标唤醒终端进行唤醒词检测，因此，可以有效避免多个终端被同时唤醒的情况，提高终端唤醒的准确性和终端唤醒的响应效率。

2023-08-21
一种基于COM口实现语音集中控制指挥大厅多媒体设备的方法

本发明公开了一种基于COM口实现语音集中控制指挥大厅多媒体设备的方法，包括：语音集中控制器从输入通道中获取待下发的控制信息；将所述控制信息输入解析模块，得到控制指令；将所述控制指令输入对象分析模块，得到与所述控制信息对应的控制操作是否有效的判断结果；若所述判断结果为有效，则利用输出通道转发所述控制信息。本发明所公开的方法，在转发控制信息之前，对控制信息本身进行校验，仅转发校验通过的控制信息。如此，便可有效避免转发控制操作无效的控制指令，因而不会将控制指令发送到无法正确响应的多媒体设备，进而避免产生不可预期的多媒体设备响应行为，可提高语音控制的可靠性。

2023-08-21
一种乐器演奏的评判方法、装置和设备

本申请提供一种乐器演奏的评判方法、装置和设备。本申请提供的乐器演奏的评判方法，包括：接收针对目标演奏音频的评判指令；对所述目标演奏音频进行识别，得到所述目标演奏音频对应的演奏乐谱；获取所述目标演奏音频对应的标准乐谱；比较所述演奏乐谱与所述标准乐谱，得到所述演奏乐谱与所述标准乐谱不同的音符，并根据所述不同的音符评判所述目标演奏音频。本申请提供的乐器演奏的评判方法、装置和设备，可为用户提供客观的演奏评价，以便用户了解弹奏的掌握程度。

2023-08-21
游戏终端的控制方法、装置、车载系统和车辆

本发明涉及游戏技术领域，公开了一种游戏终端的控制方法、装置、车载系统和车辆，通过游戏终端的控制装置获取并识别用户的语音信号，得到与所述语音信号对应的语音指令以及发出所述语音信号的用户的位置，并根据当前的游戏设置信息以及所述用户的位置，从已与控制装置连接的至少一个游戏终端中选出满足音区权限要求的游戏终端，在满足音区权限要求的游戏终端中，位于所述用户的位置的用户对游戏具有语音控制权限；再将所述语音指令发送至所述游戏终端上，以使所述游戏终端根据与所述语音指令对应的游戏操控指令控制游戏角色执行对应的动作，从而使得在游戏终端所在位置之外的其他位置的用户可以通过语音操作游戏角色，进而提高了用户体验。

2023-08-21
回声消除方法、回声消除装置及存储介质

本公开是关于一种回声消除方法、回声消除装置及存储介质。回声消除方法包括：获取第一语音信号，第一语音信号为第一拾音设备采集并由第二播放设备播放，并在第一拾音设备采集时按照预设时间间隔添加有两个或两个以上标志位；获取音频信号，音频信号由第二拾音设备采集，音频信号中包括第一语音信号和第二语音信号；按照标志位，消除音频信号中的第一语音信号得到第二语音信号，并将第二语音信号传送至第一播放设备播放，其中，第一拾音设备与第一播放设备对应，第二拾音设备与第二播放设备对应。通过本公开，可准确地消除回声。

2023-08-21
基于线性滤波的频带扩展方法、装置及会议终端系统

本发明实施例公开一种基于线性滤波的频带扩展方法、装置及会议终端系统，所述方法包括：对样本窄带语音信号进行上采样处理，得到采样后的时域语音信号；提取所述时域语音信号的LPC系数和LPC残差；利用所述LPC系数对待扩频的语音信号进行一阶FIR滤波器滤波，得到残差语音信号；根据所述LPC残差和所述LPC系数确定脉冲响应信号；利用所述残差语音信号生成宽带激励信号；对所述脉冲响应信号进行傅里叶变换，得到傅里叶变换结果；将所述宽带激励信号和所述傅里叶变换结果进行相乘，并对相乘结果进行逆傅里叶变换，得到频带扩展后的宽带信号。本发明实施例既能够降低计算开销、占用内存，且相比于传统频带扩展方法，能够提升语音质量、适用于各种编解码场景。

2023-08-21
一种基于声纹识别的变压器运行状态在线检测方法

本发明提供一种基于声纹识别的变压器运行状态在线检测方法，属于变压器故障检测技术领域。所述方法包括：S101，对采集的变压器正常运行时的声纹信号进行分帧处理，并求取每一帧声纹信号的特征向量；S102，对特征向量中的各特征值进行融合得到综合评价指标及各特征值的权重；S103，若综合评价指标服从正态分布，则利用统计学中的3σ准则对综合评价指标求取报警线；S104，对于未知运行状态的变压器，根据得到的各特征值的权重，计算其对应的综合评价指标，若计算得到的综合评价指标连续多次超出报警线，则判定该未知运行状态的变压器出现异常。采用本发明，能够提高异常运行变压器的检出率，降低了误检率，且不需要大量故障样本。

2023-08-21
一种音频处理方法、装置、电子设备及存储介质

本公开关于一种音频处理方法、装置、电子设备及存储介质，该方法包括：获取待处理音频信号；获取待处理音频信号所包括的噪声信号和待处理音频信号的混响时长；根据待处理音频信号和噪声信号，确定待处理音频信号的信噪比和降噪增益因子，并根据待处理音频信号和混响时长，确定待处理音频信号所包括的混响信号；根据信噪比、降噪增益因子以及混响信号对待处理音频信号去混响，得到去混响后的音频信号。通过本公开实施例提供的技术方案，在对待处理音频信号去混响时，考虑到了信噪比、降噪增益因子以及混响信号，从而在待处理音频信号存在噪声信号时，也能够较好地对待处理音频信号去混响。

2023-08-21
基于多资源的语音点播歌曲方法及装置

本发明公开了一种基于多资源的语音点播歌曲方法及装置，所述方法包括如下步骤：步骤S1，接收用户的语音输入；步骤S2，对语音输入信息进行语音识别，得到语音识别结果；步骤S3，根据识别出的语音识别结果，确定其维度信息，获得该语音识别结果对应的维度键值对信息；步骤S4，根据获得的维度键值对信息于本地资源库和/或线上开放平台中获取歌曲资源进行播放。

2023-08-21
一种基音检测方法及装置

本公开涉及一种基音检测方法及装置。该方法包括如下步骤：获取语音采集装置发送的多帧语音数据，并对每一帧语音数据进行解码和预处理；分别计算经预处理的每一帧语音数据的基音检测核心函数，得到相应的基音检测核心函数曲线；根据每一帧语音数据的基音检测核心函数曲线，得到每一帧语音数据的基音周期；根据当前帧语音数据的基音周期阈值，验证该帧语音数据的基音检测是否有效。该方法有效地抑制了共振峰的影响，在低信噪比环境下能有效检测到基音周期，更准确地定位基音周期的位置，从而提高了基音检测精度，并解决传统的时域基音检测方法准确度较差的问题。此外，在实际运用中能够较好地满足语音信号处理对基音检测的要求，从而提高了语音信号处理的性能。

2023-08-21
一种智能家居设备的语音控制方法、系统、设备及计算机存储介质

本发明提供一种智能家居设备的语音控制方法、系统、设备及计算机存储介质，该方法包括：接收语音采集设备发送的用户语音信息；对用户语音信息进行语音识别处理，得到用户的声纹信息、目标设备类型和目标操作；在预存的数据库中查找与目标设备类型匹配的用户习惯信息，将查询到的用户习惯信息与用户的声纹信息进行匹配，得到与用户的声纹信息相对应的目标用户习惯信息；根据目标用户习惯信息和目标操作控制目标智能家居设备执行习惯操作。本发明通过识别用户语音消息中的目标设备类型，通过目标设备类型在预存的数据库中匹配到对应的用户习惯信息，通过识别用户的声纹信息确定目标用户习惯信息，从而为当前用户提供定制化的服务。

2023-08-21
语音输出控制方法、电子装置及计算机可读存储介质

本发明提供一种语音输出控制方法，应用于电子装置中，包括：获取用户语音输入，识别所述输入中的语音指令；执行所述语音指令，并接收反馈的执行结果；检测所述电子装置的声音环境是否正常；若否，则同时调用语音输出设备和显示单元输出所述执行结果；以及若是，则调用语音输出设备输出所述执行结果。本发明还提供一种电子装置和计算机存储介质。利用本发明，可以提高语音输出的效果，提升用户体验。

2023-08-21
回声抑制方法及装置

本申请公开了一种回声抑制方法及装置。该方法包括：采集远端声音信号；确定平稳噪声N(f,t)，并计算远端声音信号的回声残余能量P(f,t)，及利用线性回声消除算法计算远端声音信号经过线性回声消除后的信号P(f,t)。当P(f,t)>P且P(f,t)‑P(f,t)N(f,t)时，将f的取值确定为第一频域值，将t的取值确定为第一时域值。构建方差为N(f,t)的高斯白噪声G(f,t)，在f为第一频域值且t为第一时域值的时频点，用G(f,t)取代P(f,t)。

2023-08-21
一种基于BNEP协议实现蓝牙音频设备语音识别训练的系统及其方法

一种基于BNEP协议实现蓝牙音频设备语音识别训练的系统及其方法，属于通信技术领域。音频设备端与后台服务器通过BNEP协议实现连接，音频设备端接收输入的语音信号后可主动发起训练请求，开启语音训练模式；通过音频设备端传输给移动设备端后连接服务器数据库进行训练结果比对；解析完成后，服务器通过网络下发对比数据返还至移动设备端；移动设备端收到对比数据后可在终端显示训练结果。上述一种基于BNEP协议实现蓝牙音频设备语音识别训练的系统及其方法，简化语音训练的流程，用移动设备端无需下载APP，不占用用户设备的内存资源；直接连接服务器数据库，无需用升级设备端数据库；数据传输效率高；语音训练速度与训练质量提高。

2023-08-21
一种基于极小化极大化的欠定盲源分离方法及系统和装置

本发明公开了一种基于极小化极大化的欠定盲源分离方法及系统和装置，利用短时傅里叶变换将时域瞬时混合信号转化为每个频带上的频域瞬时混合，基于源信号的稀疏性，提取复值混合矩阵实部向量与虚部向量，通过余弦角进行单源点判定与提取，对单源点归一化和取模运算，通过对单源点的层次聚类实现混合矩阵的估计；利用混合矩阵以及源信号的稀疏性假设将源信号恢复问题转化为l范数优化问题，将源信号在时频域恢复后采用短时傅里叶逆变换将时频域的源信号变换回时域从而实现欠定盲源分离。构建非凸罚函数使目标函数的优化逼近l范数优化，避免了传统的l范数正则化的系统性低估及依照稀疏性假设恢复的源信号，并且保证了目标函数的凸性。

2023-08-21
键盘、键盘用配件以及键盘用配件的制造方法

本发明提供键盘、键盘用配件以及键盘用配件的制造方法，容易地制造惯性力矩不同的多个质量体。该键盘具有框架(10)以及多个质量体(HM)，该多个质量体并排配置且各质量体被支承为能够相对于框架(10)以音锤转动支点(15)为中心转动。在质量体(HM)组中从最低音高以上的音高至最高音高的范围内的各质量体形成有缺口部(23)，质量体(HM)组的缺口部(23)的各缺口位置彼此不同、或到音锤转动支点(15)的距离(D1)彼此不同。

2023-08-21
基于跨不同音频流和/或不同水印技术的水印识别媒介的方法和装置

公开了基于跨不同音频流和/或不同水印技术的水印识别媒介的方法和装置。示例性装置包括水印检测器，该水印检测器用于检测嵌入在与媒介相关联的第一音频流中的第一水印并检测嵌入在与所述媒介相关联的第二音频流中的第二水印。第二音频流不同于第一音频流。该示例性装置包括水印分析器，该水印分析器用于将第一水印中的第一媒介标识信息与第二水印中的第二媒介标识信息进行比较。该示例性装置还包括媒介检测事件控制器，该媒介检测事件控制器用于当第一媒介标识信息与第二媒介标识信息一致时，将第一水印和第二水印与媒介检测事件相关联。该示例性装置还包括发送器，该发送器用于将所述媒介检测事件发送到数据收集设施。

2023-08-21
利用提前停止聚类的讲话者分离

本公开提供了用于利用提前停止聚类的讲话者分离的方法和装置。可以将音频流分割为至少一个语音段，所述音频流包括来自至少一个讲话者的语音。可以将所述至少一个语音段聚类为多个簇，所述多个簇的数量大于所述至少一个讲话者的数量。可以从所述多个簇中选择相似度最高的至少一个簇，所选择的至少一个簇的数量等于所述至少一个讲话者的数量。可以基于所选择的至少一个簇来建立讲话者分类模型。可以通过所述讲话者分类模型，将所述音频流中的语音帧与所述至少一个讲话者对准。

2023-08-21
具有减少后处理延迟的高频重建技术的集成

本发明揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低频带音频信号滤波以产生经滤波低频带音频信号。所述方法还包含提取指示是对所述音频数据执行频谱平移还是谐波转置的标记且根据所述标记使用所述经滤波低频带音频信号及所述高频重建元数据来再生所述音频信号的高频带部分。将所述高频再生执行为每个音频频道具有3010个样本的延迟的后处理操作。

2023-08-21
高效对话配置

本发明有关一种在计算机支持的自动化对话系统中用于高效对话配置和对话判读的方法。本发明的优点特别在于：减少了产生对话时的工作复杂度，并且因此降低了错误可能性。此外，可以考虑子对话的语境，并根据所述语境来动态地产生对话。此外，所述方法可以自动启动与人类用户的对话。本发明还有关一种对应地设计的系统设备，并且有关一种具有控制命令的计算机程序产品，所述控制命令执行所述方法或操作所述系统组件。

2023-08-21
用于通过使用应用输出对语音输入的响应的电子装置及其操作方法

提供了一种人工智能(AI)系统。所述AI系统通过利用诸如深度学习等的机器学习算法以及AI系统的应用来模拟人脑的功能(诸如识别和判断)。一种由电子装置执行的通过使用应用来输出对语音输入的响应的方法包括：接收语音输入；通过对所述语音输入执行语音识别来获得与所述语音输入相应的文本；基于获得的所述文本来获得针对所述语音输入的元数据；基于所述元数据从用于输出对所述语音输入的响应的多个应用中选择至少一个应用；以及通过使用选择的所述至少一个应用来输出对所述语音输入的响应。

2023-08-21
用于基于预测的先发式对话内容生成的系统和方法

本示教涉及一种用于管理用户机器对话的方法、系统、介质和实施方式。在装置上接收与对话有关的信息，其中，用户用该装置参与对话。基于与对话有关的信息，驻留在装置上的本地对话管理器关于与存储在装置上的预测对话路径相关联的预测响应，搜索将要给与用户的响应。预测对话路径、预测响应和本地对话管理器是基于驻留在服务器上的对话树先发式地生成的。如果响应被本地对话管理器识别出，响应被发送到装置。如果响应没有被本地对话管理器识别出，装置向服务器发送对于响应的请求。

2023-08-21
用于稳态车辆声音合成的系统和方法

提供了一种具有控制器和扬声器的车辆声音合成系统。控制器被编程为接收指示挡位选择、发动机转速和踏板位置中的至少一个的输入，并生成指示合成的发动机噪声(SEN)的音频信号。控制器还被编程为响应于指示第一车辆条件的挡位选择、发动机转速和踏板位置中的至少一个以第一速率衰减音频信号。扬声器适于响应于接收到衰减的音频信号而在车辆的乘客厢内投射声音。

2023-08-21
电子吹奏乐器

本发明提供一种电子吹奏乐器，能够使水分难以从操作器用的贯通孔渗入至乐器本体内。电子吹奏乐器(1)包括：乐器本体(10)，与内部空间(11)相连的贯通孔(14)在外表面(12)形成开口；操作器(20)，在贯通孔(14)的位置安装于乐器本体(10)，并且被朝向内部空间(11)侧按下；以及电子零件，配置于内部空间(11)，并且，电子零件包括检测操作器(20)的按下状态的按下传感器(6)，乐器本体(10)的外表面(12)包括：外壁(16a)，围绕贯通孔(14)而设置，并朝向贯通孔(14)侧；内壁(16b)，比外壁(16a)更靠贯通孔(14)侧而设置，朝向外壁(16a)侧；以及槽底(16c)，将外壁(16a)与内壁(16b)加以连结。

2023-08-21
电子吹奏乐器

本发明提供一种电子吹奏乐器，能够精度良好地检测传递构件的旋转量。当演奏者演奏电子吹奏乐器1时，外来光(例如，来自照明的光)容易照射至乐器本体2的上表面侧，但由于光传感器S2的受光部朝向乐器本体2的下表面侧，所以能够抑制来自乐器本体2的上表面侧的外来光抵达至光传感器S2的受光部。因此，能够抑制所述外来光被光传感器S2错误检测，因而能够利用光传感器S2精度良好地检测传递构件50传递构件50的旋转量。

2023-08-21
电子吹奏乐器

本发明提供一种电子吹奏乐器，能够精度良好地检测传递构件的旋转量。当传递构件50的后部53伴随着簧片22的位移而旋转时，平坦面53a会朝向与光传感器S2相离的方向旋转，所以即使簧片22被咬入规定以上的程度，也能够抑制后部53的平坦面53a与光传感器S2接触。因此，能够在初始状态下将平坦面53a与光传感器S2的相向间隔设定得比较窄而提高光传感器S2中的检测灵敏度，所以能够精度良好地检测传递构件50的旋转量(簧片22的被咬入量)。

2023-08-21
一种噪声功率谱密度计算方法、系统、设备及介质

一种噪声功率谱密度计算方法，包括：采集时域噪声信号，对时域噪声信号进行处理，得到频域噪声信号；采用自适应滤波器对频域噪声信号进行处理，得到时域误差信号，自适应滤波器算法部分采用归一化最小均方差算法求解误差信号，进一步地，采用分块频域自适应滤波算法求解误差信号；计算时域误差信号的功率谱密度，根据误差信号的功率谱密度计算噪声功率谱密度。本发明还公开了一种噪声功率谱密度计算系统、电子设备及存储介质。本发明使得噪声功率谱密度估计更精确，计算量降低，后续的降噪效果更好。

2023-08-21
语音增强方法和装置、电子设备和存储介质

本公开实施例公开了一种语音增强方法和装置、电子设备和存储介质，其中，语音增强方法包括：获取待处理语音；确认所述待处理语音的来源用户是否注册用户；若所述待处理语音的来源用户是注册用户，获取所述来源用户的语音增强参数；基于所述来源用户的语音增强参数对所述待处理语音进行语音增强。本公开实施例可以提升语音增强效果，能够很好的消除噪声，从而提升语音质量，有助于后续提升语音识别率和通话质量。

2023-08-21
遥控器及其控制方法、装置

本申请涉及通信技术领域，公开一种遥控器，包括：增益可调麦克风，被配置为通过调节增益具有近场语音指令获取能力或远场语音指令获取能力，并获取语音指令；控制器，被配置为根据所述增益可调麦克风获取的语音指令实现语音控制。本公开实施例提供的遥控器包括增益可调麦克风，通过调节麦克风增益能够实现近场语音控制和远场语音控制两种控制模式，在满足多种控制模式需求的基础上，减少了遥控器底座的制作成本。

2023-08-21
语音响应方法、装置、设备以及存储介质

本公开提供一种语音响应方法、装置、设备及计算机可读存储介质，所述方法包括：基于采集的语音信号，获取识别所述语音信号得到的语音信息；获取与所述语音信息相应的一条或多条响应参数；所述响应参数包括待响应的应用和/或待响应的应用页面、以及对应的响应指令；若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面，执行所述响应指令。本公开实施例通过语音来控制应用的具体功能，提高用户的使用体验。

2023-08-21

技术分类

友情链接