乐器、声学

终端唤醒方法、装置及计算机可读存储介质

本公开涉及一种终端唤醒方法、装置及计算机可读存储介质，所述方法应用于第一终端，所述第一终端为目标声学空间中的任一终端，包括：获取目标声学空间中候选终端的唤醒参数，其中，所述唤醒参数用于表征所述候选终端的唤醒优先级；根据所述第一终端的唤醒参数和所述候选终端的唤醒参数确定目标唤醒终端；若所述目标唤醒终端为所述第一终端，控制所述第一终端对接收到的语音消息进行唤醒词检测；在检测到唤醒词的情况下，唤醒所述第一终端。由此，在同一声学空间中只有目标唤醒终端进行唤醒词检测，因此，可以有效避免多个终端被同时唤醒的情况，提高终端唤醒的准确性和终端唤醒的响应效率。

2023-08-21
一种基于COM口实现语音集中控制指挥大厅多媒体设备的方法

本发明公开了一种基于COM口实现语音集中控制指挥大厅多媒体设备的方法，包括：语音集中控制器从输入通道中获取待下发的控制信息；将所述控制信息输入解析模块，得到控制指令；将所述控制指令输入对象分析模块，得到与所述控制信息对应的控制操作是否有效的判断结果；若所述判断结果为有效，则利用输出通道转发所述控制信息。本发明所公开的方法，在转发控制信息之前，对控制信息本身进行校验，仅转发校验通过的控制信息。如此，便可有效避免转发控制操作无效的控制指令，因而不会将控制指令发送到无法正确响应的多媒体设备，进而避免产生不可预期的多媒体设备响应行为，可提高语音控制的可靠性。

2023-08-21
一种乐器演奏的评判方法、装置和设备

本申请提供一种乐器演奏的评判方法、装置和设备。本申请提供的乐器演奏的评判方法，包括：接收针对目标演奏音频的评判指令；对所述目标演奏音频进行识别，得到所述目标演奏音频对应的演奏乐谱；获取所述目标演奏音频对应的标准乐谱；比较所述演奏乐谱与所述标准乐谱，得到所述演奏乐谱与所述标准乐谱不同的音符，并根据所述不同的音符评判所述目标演奏音频。本申请提供的乐器演奏的评判方法、装置和设备，可为用户提供客观的演奏评价，以便用户了解弹奏的掌握程度。

2023-08-21
游戏终端的控制方法、装置、车载系统和车辆

本发明涉及游戏技术领域，公开了一种游戏终端的控制方法、装置、车载系统和车辆，通过游戏终端的控制装置获取并识别用户的语音信号，得到与所述语音信号对应的语音指令以及发出所述语音信号的用户的位置，并根据当前的游戏设置信息以及所述用户的位置，从已与控制装置连接的至少一个游戏终端中选出满足音区权限要求的游戏终端，在满足音区权限要求的游戏终端中，位于所述用户的位置的用户对游戏具有语音控制权限；再将所述语音指令发送至所述游戏终端上，以使所述游戏终端根据与所述语音指令对应的游戏操控指令控制游戏角色执行对应的动作，从而使得在游戏终端所在位置之外的其他位置的用户可以通过语音操作游戏角色，进而提高了用户体验。

2023-08-21
回声消除方法、回声消除装置及存储介质

本公开是关于一种回声消除方法、回声消除装置及存储介质。回声消除方法包括：获取第一语音信号，第一语音信号为第一拾音设备采集并由第二播放设备播放，并在第一拾音设备采集时按照预设时间间隔添加有两个或两个以上标志位；获取音频信号，音频信号由第二拾音设备采集，音频信号中包括第一语音信号和第二语音信号；按照标志位，消除音频信号中的第一语音信号得到第二语音信号，并将第二语音信号传送至第一播放设备播放，其中，第一拾音设备与第一播放设备对应，第二拾音设备与第二播放设备对应。通过本公开，可准确地消除回声。

2023-08-21
基于线性滤波的频带扩展方法、装置及会议终端系统

本发明实施例公开一种基于线性滤波的频带扩展方法、装置及会议终端系统，所述方法包括：对样本窄带语音信号进行上采样处理，得到采样后的时域语音信号；提取所述时域语音信号的LPC系数和LPC残差；利用所述LPC系数对待扩频的语音信号进行一阶FIR滤波器滤波，得到残差语音信号；根据所述LPC残差和所述LPC系数确定脉冲响应信号；利用所述残差语音信号生成宽带激励信号；对所述脉冲响应信号进行傅里叶变换，得到傅里叶变换结果；将所述宽带激励信号和所述傅里叶变换结果进行相乘，并对相乘结果进行逆傅里叶变换，得到频带扩展后的宽带信号。本发明实施例既能够降低计算开销、占用内存，且相比于传统频带扩展方法，能够提升语音质量、适用于各种编解码场景。

2023-08-21
一种基于声纹识别的变压器运行状态在线检测方法

本发明提供一种基于声纹识别的变压器运行状态在线检测方法，属于变压器故障检测技术领域。所述方法包括：S101，对采集的变压器正常运行时的声纹信号进行分帧处理，并求取每一帧声纹信号的特征向量；S102，对特征向量中的各特征值进行融合得到综合评价指标及各特征值的权重；S103，若综合评价指标服从正态分布，则利用统计学中的3σ准则对综合评价指标求取报警线；S104，对于未知运行状态的变压器，根据得到的各特征值的权重，计算其对应的综合评价指标，若计算得到的综合评价指标连续多次超出报警线，则判定该未知运行状态的变压器出现异常。采用本发明，能够提高异常运行变压器的检出率，降低了误检率，且不需要大量故障样本。

2023-08-21
一种音频处理方法、装置、电子设备及存储介质

本公开关于一种音频处理方法、装置、电子设备及存储介质，该方法包括：获取待处理音频信号；获取待处理音频信号所包括的噪声信号和待处理音频信号的混响时长；根据待处理音频信号和噪声信号，确定待处理音频信号的信噪比和降噪增益因子，并根据待处理音频信号和混响时长，确定待处理音频信号所包括的混响信号；根据信噪比、降噪增益因子以及混响信号对待处理音频信号去混响，得到去混响后的音频信号。通过本公开实施例提供的技术方案，在对待处理音频信号去混响时，考虑到了信噪比、降噪增益因子以及混响信号，从而在待处理音频信号存在噪声信号时，也能够较好地对待处理音频信号去混响。

2023-08-21
基于多资源的语音点播歌曲方法及装置

本发明公开了一种基于多资源的语音点播歌曲方法及装置，所述方法包括如下步骤：步骤S1，接收用户的语音输入；步骤S2，对语音输入信息进行语音识别，得到语音识别结果；步骤S3，根据识别出的语音识别结果，确定其维度信息，获得该语音识别结果对应的维度键值对信息；步骤S4，根据获得的维度键值对信息于本地资源库和/或线上开放平台中获取歌曲资源进行播放。

2023-08-21
一种基音检测方法及装置

本公开涉及一种基音检测方法及装置。该方法包括如下步骤：获取语音采集装置发送的多帧语音数据，并对每一帧语音数据进行解码和预处理；分别计算经预处理的每一帧语音数据的基音检测核心函数，得到相应的基音检测核心函数曲线；根据每一帧语音数据的基音检测核心函数曲线，得到每一帧语音数据的基音周期；根据当前帧语音数据的基音周期阈值，验证该帧语音数据的基音检测是否有效。该方法有效地抑制了共振峰的影响，在低信噪比环境下能有效检测到基音周期，更准确地定位基音周期的位置，从而提高了基音检测精度，并解决传统的时域基音检测方法准确度较差的问题。此外，在实际运用中能够较好地满足语音信号处理对基音检测的要求，从而提高了语音信号处理的性能。

2023-08-21
一种智能家居设备的语音控制方法、系统、设备及计算机存储介质

本发明提供一种智能家居设备的语音控制方法、系统、设备及计算机存储介质，该方法包括：接收语音采集设备发送的用户语音信息；对用户语音信息进行语音识别处理，得到用户的声纹信息、目标设备类型和目标操作；在预存的数据库中查找与目标设备类型匹配的用户习惯信息，将查询到的用户习惯信息与用户的声纹信息进行匹配，得到与用户的声纹信息相对应的目标用户习惯信息；根据目标用户习惯信息和目标操作控制目标智能家居设备执行习惯操作。本发明通过识别用户语音消息中的目标设备类型，通过目标设备类型在预存的数据库中匹配到对应的用户习惯信息，通过识别用户的声纹信息确定目标用户习惯信息，从而为当前用户提供定制化的服务。

2023-08-21
语音输出控制方法、电子装置及计算机可读存储介质

本发明提供一种语音输出控制方法，应用于电子装置中，包括：获取用户语音输入，识别所述输入中的语音指令；执行所述语音指令，并接收反馈的执行结果；检测所述电子装置的声音环境是否正常；若否，则同时调用语音输出设备和显示单元输出所述执行结果；以及若是，则调用语音输出设备输出所述执行结果。本发明还提供一种电子装置和计算机存储介质。利用本发明，可以提高语音输出的效果，提升用户体验。

2023-08-21
回声抑制方法及装置

本申请公开了一种回声抑制方法及装置。该方法包括：采集远端声音信号；确定平稳噪声N(f,t)，并计算远端声音信号的回声残余能量P(f,t)，及利用线性回声消除算法计算远端声音信号经过线性回声消除后的信号P(f,t)。当P(f,t)>P且P(f,t)‑P(f,t)N(f,t)时，将f的取值确定为第一频域值，将t的取值确定为第一时域值。构建方差为N(f,t)的高斯白噪声G(f,t)，在f为第一频域值且t为第一时域值的时频点，用G(f,t)取代P(f,t)。

2023-08-21
一种基于BNEP协议实现蓝牙音频设备语音识别训练的系统及其方法

一种基于BNEP协议实现蓝牙音频设备语音识别训练的系统及其方法，属于通信技术领域。音频设备端与后台服务器通过BNEP协议实现连接，音频设备端接收输入的语音信号后可主动发起训练请求，开启语音训练模式；通过音频设备端传输给移动设备端后连接服务器数据库进行训练结果比对；解析完成后，服务器通过网络下发对比数据返还至移动设备端；移动设备端收到对比数据后可在终端显示训练结果。上述一种基于BNEP协议实现蓝牙音频设备语音识别训练的系统及其方法，简化语音训练的流程，用移动设备端无需下载APP，不占用用户设备的内存资源；直接连接服务器数据库，无需用升级设备端数据库；数据传输效率高；语音训练速度与训练质量提高。

2023-08-21
一种基于极小化极大化的欠定盲源分离方法及系统和装置

本发明公开了一种基于极小化极大化的欠定盲源分离方法及系统和装置，利用短时傅里叶变换将时域瞬时混合信号转化为每个频带上的频域瞬时混合，基于源信号的稀疏性，提取复值混合矩阵实部向量与虚部向量，通过余弦角进行单源点判定与提取，对单源点归一化和取模运算，通过对单源点的层次聚类实现混合矩阵的估计；利用混合矩阵以及源信号的稀疏性假设将源信号恢复问题转化为l范数优化问题，将源信号在时频域恢复后采用短时傅里叶逆变换将时频域的源信号变换回时域从而实现欠定盲源分离。构建非凸罚函数使目标函数的优化逼近l范数优化，避免了传统的l范数正则化的系统性低估及依照稀疏性假设恢复的源信号，并且保证了目标函数的凸性。

2023-08-21
键盘、键盘用配件以及键盘用配件的制造方法

本发明提供键盘、键盘用配件以及键盘用配件的制造方法，容易地制造惯性力矩不同的多个质量体。该键盘具有框架(10)以及多个质量体(HM)，该多个质量体并排配置且各质量体被支承为能够相对于框架(10)以音锤转动支点(15)为中心转动。在质量体(HM)组中从最低音高以上的音高至最高音高的范围内的各质量体形成有缺口部(23)，质量体(HM)组的缺口部(23)的各缺口位置彼此不同、或到音锤转动支点(15)的距离(D1)彼此不同。

2023-08-21
基于跨不同音频流和/或不同水印技术的水印识别媒介的方法和装置

公开了基于跨不同音频流和/或不同水印技术的水印识别媒介的方法和装置。示例性装置包括水印检测器，该水印检测器用于检测嵌入在与媒介相关联的第一音频流中的第一水印并检测嵌入在与所述媒介相关联的第二音频流中的第二水印。第二音频流不同于第一音频流。该示例性装置包括水印分析器，该水印分析器用于将第一水印中的第一媒介标识信息与第二水印中的第二媒介标识信息进行比较。该示例性装置还包括媒介检测事件控制器，该媒介检测事件控制器用于当第一媒介标识信息与第二媒介标识信息一致时，将第一水印和第二水印与媒介检测事件相关联。该示例性装置还包括发送器，该发送器用于将所述媒介检测事件发送到数据收集设施。

2023-08-21
利用提前停止聚类的讲话者分离

本公开提供了用于利用提前停止聚类的讲话者分离的方法和装置。可以将音频流分割为至少一个语音段，所述音频流包括来自至少一个讲话者的语音。可以将所述至少一个语音段聚类为多个簇，所述多个簇的数量大于所述至少一个讲话者的数量。可以从所述多个簇中选择相似度最高的至少一个簇，所选择的至少一个簇的数量等于所述至少一个讲话者的数量。可以基于所选择的至少一个簇来建立讲话者分类模型。可以通过所述讲话者分类模型，将所述音频流中的语音帧与所述至少一个讲话者对准。

2023-08-21
具有减少后处理延迟的高频重建技术的集成

本发明揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流且解码音频数据以产生经解码低频带音频信号。所述方法进一步包含提取高频重建元数据且使用分析滤波器组来对所述经解码低频带音频信号滤波以产生经滤波低频带音频信号。所述方法还包含提取指示是对所述音频数据执行频谱平移还是谐波转置的标记且根据所述标记使用所述经滤波低频带音频信号及所述高频重建元数据来再生所述音频信号的高频带部分。将所述高频再生执行为每个音频频道具有3010个样本的延迟的后处理操作。

2023-08-21
高效对话配置

本发明有关一种在计算机支持的自动化对话系统中用于高效对话配置和对话判读的方法。本发明的优点特别在于：减少了产生对话时的工作复杂度，并且因此降低了错误可能性。此外，可以考虑子对话的语境，并根据所述语境来动态地产生对话。此外，所述方法可以自动启动与人类用户的对话。本发明还有关一种对应地设计的系统设备，并且有关一种具有控制命令的计算机程序产品，所述控制命令执行所述方法或操作所述系统组件。

2023-08-21
用于通过使用应用输出对语音输入的响应的电子装置及其操作方法

提供了一种人工智能(AI)系统。所述AI系统通过利用诸如深度学习等的机器学习算法以及AI系统的应用来模拟人脑的功能(诸如识别和判断)。一种由电子装置执行的通过使用应用来输出对语音输入的响应的方法包括：接收语音输入；通过对所述语音输入执行语音识别来获得与所述语音输入相应的文本；基于获得的所述文本来获得针对所述语音输入的元数据；基于所述元数据从用于输出对所述语音输入的响应的多个应用中选择至少一个应用；以及通过使用选择的所述至少一个应用来输出对所述语音输入的响应。

2023-08-21
用于基于预测的先发式对话内容生成的系统和方法

本示教涉及一种用于管理用户机器对话的方法、系统、介质和实施方式。在装置上接收与对话有关的信息，其中，用户用该装置参与对话。基于与对话有关的信息，驻留在装置上的本地对话管理器关于与存储在装置上的预测对话路径相关联的预测响应，搜索将要给与用户的响应。预测对话路径、预测响应和本地对话管理器是基于驻留在服务器上的对话树先发式地生成的。如果响应被本地对话管理器识别出，响应被发送到装置。如果响应没有被本地对话管理器识别出，装置向服务器发送对于响应的请求。

2023-08-21
用于稳态车辆声音合成的系统和方法

提供了一种具有控制器和扬声器的车辆声音合成系统。控制器被编程为接收指示挡位选择、发动机转速和踏板位置中的至少一个的输入，并生成指示合成的发动机噪声(SEN)的音频信号。控制器还被编程为响应于指示第一车辆条件的挡位选择、发动机转速和踏板位置中的至少一个以第一速率衰减音频信号。扬声器适于响应于接收到衰减的音频信号而在车辆的乘客厢内投射声音。

2023-08-21
电子吹奏乐器

本发明提供一种电子吹奏乐器，能够使水分难以从操作器用的贯通孔渗入至乐器本体内。电子吹奏乐器(1)包括：乐器本体(10)，与内部空间(11)相连的贯通孔(14)在外表面(12)形成开口；操作器(20)，在贯通孔(14)的位置安装于乐器本体(10)，并且被朝向内部空间(11)侧按下；以及电子零件，配置于内部空间(11)，并且，电子零件包括检测操作器(20)的按下状态的按下传感器(6)，乐器本体(10)的外表面(12)包括：外壁(16a)，围绕贯通孔(14)而设置，并朝向贯通孔(14)侧；内壁(16b)，比外壁(16a)更靠贯通孔(14)侧而设置，朝向外壁(16a)侧；以及槽底(16c)，将外壁(16a)与内壁(16b)加以连结。

2023-08-21
电子吹奏乐器

本发明提供一种电子吹奏乐器，能够精度良好地检测传递构件的旋转量。当演奏者演奏电子吹奏乐器1时，外来光(例如，来自照明的光)容易照射至乐器本体2的上表面侧，但由于光传感器S2的受光部朝向乐器本体2的下表面侧，所以能够抑制来自乐器本体2的上表面侧的外来光抵达至光传感器S2的受光部。因此，能够抑制所述外来光被光传感器S2错误检测，因而能够利用光传感器S2精度良好地检测传递构件50传递构件50的旋转量。

2023-08-21
电子吹奏乐器

本发明提供一种电子吹奏乐器，能够精度良好地检测传递构件的旋转量。当传递构件50的后部53伴随着簧片22的位移而旋转时，平坦面53a会朝向与光传感器S2相离的方向旋转，所以即使簧片22被咬入规定以上的程度，也能够抑制后部53的平坦面53a与光传感器S2接触。因此，能够在初始状态下将平坦面53a与光传感器S2的相向间隔设定得比较窄而提高光传感器S2中的检测灵敏度，所以能够精度良好地检测传递构件50的旋转量(簧片22的被咬入量)。

2023-08-21
一种噪声功率谱密度计算方法、系统、设备及介质

一种噪声功率谱密度计算方法，包括：采集时域噪声信号，对时域噪声信号进行处理，得到频域噪声信号；采用自适应滤波器对频域噪声信号进行处理，得到时域误差信号，自适应滤波器算法部分采用归一化最小均方差算法求解误差信号，进一步地，采用分块频域自适应滤波算法求解误差信号；计算时域误差信号的功率谱密度，根据误差信号的功率谱密度计算噪声功率谱密度。本发明还公开了一种噪声功率谱密度计算系统、电子设备及存储介质。本发明使得噪声功率谱密度估计更精确，计算量降低，后续的降噪效果更好。

2023-08-21
语音增强方法和装置、电子设备和存储介质

本公开实施例公开了一种语音增强方法和装置、电子设备和存储介质，其中，语音增强方法包括：获取待处理语音；确认所述待处理语音的来源用户是否注册用户；若所述待处理语音的来源用户是注册用户，获取所述来源用户的语音增强参数；基于所述来源用户的语音增强参数对所述待处理语音进行语音增强。本公开实施例可以提升语音增强效果，能够很好的消除噪声，从而提升语音质量，有助于后续提升语音识别率和通话质量。

2023-08-21
遥控器及其控制方法、装置

本申请涉及通信技术领域，公开一种遥控器，包括：增益可调麦克风，被配置为通过调节增益具有近场语音指令获取能力或远场语音指令获取能力，并获取语音指令；控制器，被配置为根据所述增益可调麦克风获取的语音指令实现语音控制。本公开实施例提供的遥控器包括增益可调麦克风，通过调节麦克风增益能够实现近场语音控制和远场语音控制两种控制模式，在满足多种控制模式需求的基础上，减少了遥控器底座的制作成本。

2023-08-21
语音响应方法、装置、设备以及存储介质

本公开提供一种语音响应方法、装置、设备及计算机可读存储介质，所述方法包括：基于采集的语音信号，获取识别所述语音信号得到的语音信息；获取与所述语音信息相应的一条或多条响应参数；所述响应参数包括待响应的应用和/或待响应的应用页面、以及对应的响应指令；若当前运行的应用为所述待响应的应用、和/或当前显示的应用页面为所述待响应的应用页面，执行所述响应指令。本公开实施例通过语音来控制应用的具体功能，提高用户的使用体验。

2023-08-21
多语种语音识别方法、装置及电子设备

本公开涉及语音识别技术领域，揭露一种多语种语音识别方法、装置及电子设备，该多语种语音识别方法包括：获取待识别的目标语音；调用预训练的声学模型以及预训练的多语种语言模型对所述目标语音进行解码，获取所述目标语音的识别结果搜索网格；调用预训练的多个单语种语言模型分别对所述识别结果搜索网格进行重打分，分别筛选出一个对应语种的候选识别结果，并分别确定所述候选识别结果为所述目标语音的目标识别结果的概率；按照所述概率从大到小的顺序将所述候选识别结果进行排序，并从排名前预设位数的候选识别结果中筛选出所述目标识别结果。本公开可以降低多语种语音识别的难度。同样的，本方案可以应用于数字医疗中在线问诊环节中。

2023-08-21
一种双麦克风降噪方法和存储设备

本发明涉及数据处理技术领域，特别涉及一种双麦克风降噪方法和存储设备。所述一种双麦克风降噪方法，包括步骤：设置两个以上的降噪层，预先设置所述降噪层每一层的降噪算法，所述降噪算法存储在数据库；按所述降噪层层级先后顺序输入语音数据逐层进行处理；语音数据每经过一层降噪层处理后，判断经过该层降噪处理后的语音数据的噪声参数是否低于预设阈值，若未低于预设阈值，则对上一层降噪处理后的语音数据继续下一层的降噪处理，直至降噪处理后的语音数据的噪声参数低于预设阈值。通过引入数据库存放所述降噪层每一层的降噪算法，每种算法的关键信息都在数据库中得以保存，即可以有针对性地对语音数据进行处理，又可以重复有效利用。

2023-08-21
用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统

本公开涉及用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统。以比特流(P)为基础，通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X)，此处1≤m＜n。从比特流还导出量化核心信号的编码器侧动态范围限制的预处理动态范围控制参数，即预处理DRC参数(DRC2)。在基于预处理DRC参数消除任何编码器侧动态范围限制的同时通过根据多通道编码参数的参数合成获得n通道音频信号。在特定的实施例中，重构进一步包括量化可能的解码器侧动态范围压缩的经补偿的后处理DRC参数的使用。优选地，由不同解码器侧组件执行编码器侧范围限制消除和范围压缩。消除和压缩可以由DRC预处理器协调。

2023-08-21
用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统

本公开涉及用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统。以比特流(P)为基础，通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X)，此处1≤m＜n。从比特流还导出量化核心信号的编码器侧动态范围限制的预处理动态范围控制参数，即预处理DRC参数(DRC2)。在基于预处理DRC参数消除任何编码器侧动态范围限制的同时通过根据多通道编码参数的参数合成获得n通道音频信号。在特定的实施例中，重构进一步包括量化可能的解码器侧动态范围压缩的经补偿的后处理DRC参数的使用。优选地，由不同解码器侧组件执行编码器侧范围限制消除和范围压缩。消除和压缩可以由DRC预处理器协调。

2023-08-21
用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统

本公开涉及用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统。以比特流(P)为基础，通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X)，此处1≤m＜n。从比特流还导出量化核心信号的编码器侧动态范围限制的预处理动态范围控制参数，即预处理DRC参数(DRC2)。在基于预处理DRC参数消除任何编码器侧动态范围限制的同时通过根据多通道编码参数的参数合成获得n通道音频信号。在特定的实施例中，重构进一步包括量化可能的解码器侧动态范围压缩的经补偿的后处理DRC参数的使用。优选地，由不同解码器侧组件执行编码器侧范围限制消除和范围压缩。消除和压缩可以由DRC预处理器协调。

2023-08-21
用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统

本公开涉及用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统。以比特流(P)为基础，通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X)，此处1≤m＜n。从比特流还导出量化核心信号的编码器侧动态范围限制的预处理动态范围控制参数，即预处理DRC参数(DRC2)。在基于预处理DRC参数消除任何编码器侧动态范围限制的同时通过根据多通道编码参数的参数合成获得n通道音频信号。在特定的实施例中，重构进一步包括量化可能的解码器侧动态范围压缩的经补偿的后处理DRC参数的使用。优选地，由不同解码器侧组件执行编码器侧范围限制消除和范围压缩。消除和压缩可以由DRC预处理器协调。

2023-08-21
音频播放风格调节方法、装置、电子设备及存储介质

本发明公开一种音频播放风格调节方法、装置、电子设备及存储介质，其中方法包括：通过预先解码，获取音频的频率信息，再按照指定的频率段对音频的频率进行归类，接着通过音频在各个频率段中的强弱表现来选择一个播放风格，最后根据选择的播放风格匹配一个预设的均衡方案，使得音频在播放的时候可以自动匹配均衡器，可以避免手动操作均衡器的配置，有效的提高了用户体验。与现有技术相比，有益效果在于：音频在播放的时候可以自动匹配均衡器，可以避免手动操作均衡器的配置，有效的提高了用户体验。

2023-08-21
调音方法、装置、存储介质、智能设备及调音系统

本申请公开了一种调音方法、装置、存储介质、智能设备及调音系统。该方法包括：将当前播放目标音频文件的第一音频信号发送给对端智能设备，以使所述对端智能设备将对应所述第一音频信号的第一频率响应曲线与目标频率响应曲线进行比对；若获取到的第一比对结果为不匹配，则对调音参数进行调整，调整后得到第二频率响应曲线；将当前播放所述目标音频文件的第二音频信号发送给所述对端智能设备，以使所述对端智能设备将对应所述第二音频信号的第三频率响应曲线与所述目标频率响应曲线进行比对；若获取到的第二比对结果为匹配，则写入并储存所述第二频率响应曲线。本申请可以提高智能设备在调音时的智能性。

2023-08-21
音频降噪方法、装置、电子设备以及存储介质

本申请公开了一种音频降噪方法、装置、电子设备以及存储介质，涉及电子设备技术领域。所述方法包括：获取待降噪的音频信号，并获取待降噪的音频信号对应的音频使用场景，基于音频使用场景，选取多个目标音频降噪算法，按指定降噪处理顺序，将待降噪的音频信号依次经过多个目标音频降噪算法中的每个目标音频降噪算法进行降噪处理，获得降噪后的音频信号。本申请实施例提供的音频降噪方法、装置、电子设备以及存储介质，根据待降噪的音频信号对应的音频使用场景选取多个音频降噪算法对待降噪的音频信号进行降噪处理，以实现根据实际的语音质量需求，选择相应数量的音频降噪算法进行降噪处理，提升音频处理效果。

2023-08-21
一种用于供电领域的智能客户处理方法及系统

本发明提供了一种用于供电领域的智能客户处理方法，包括如下步骤：通过供电智能客户系统接收客户的客服请求语音数据；由智能语音客服对接收到的客户的语音数据进行语音识别，根据客户的语义由智能语音客服提供对应的客服服务；在智能语音客户应答过程中，在监测到人工客服触发事件后，转入人工处理流程；确定当前所有转人工处理的语音数据的优先级别，并进行排序；按优先级别的高低顺序转由人工处理。本发明还提供了相应的系统。实施本发明，可以提高客服服务针对性，从而提高服务服务效率。

2023-08-21
一种查账方法、装置和耳机

本发明实施例提供了一种查账方法、装置和耳机，所述方法包括：获取用户语音数据；依据所述用户语音数据查找账目信息，以及依据所述账目信息进行输出。本发明实施例不需要用户用手操作耳机就能完成查账。在用户不便于用手操作的情况下，也能满足用户的查找需求。例如，用户骑行时可以随时说出需要查账的内容，耳机可以在骑行过程中完成查账，不需要用户停下来拿出手机进行查账。

2023-08-21
一种供电智能客户处理方法及系统

本发明提供了一种供电智能客户处理方法，通过供电智能客户系统接收客户的客服请求语音数据；由智能语音客服对接收到的客户的语音数据进行语音识别，根据客户的语义由智能语音客服提供对应的客服服务，包括：选择文本和/或语音的形式进行客服应答；监测到智能语音客服无法解决客户的问题时，或识别客户存在异常情况或检测到客户不满情绪严重；或者统计到智能语音客服与客户的会话交互次数超过预定次数时，转人工客服进行处理。本发明还提供了相应的系统。实施本发明，可以提高客服服务针对性，从而提高用户的使用体验。

2023-08-21
一种用于供电智能客户的语音合成处理方法及系统

本发明提供了一种用于供电智能客户的语音合成处理方法，应用于智能客服业务场景下，由智能语音客服对接收到的用户的语音数据进行语音识别，并进行自然语音处理，根据用户的语义由智能语音客服提供对应的客服服务。根据用户发出的语音数据，从预设的模板资料库中匹配对应的客服语音数据并对用户进行响应。模板资料库中设置语音模板，优先匹配语音模板进行对答，模板匹配不成功时进行合成，并更新模板资料库进行更新。本发明还提供了相应的系统。实施本发明，可以提高语音合成针对性，以及提高合成语音的效果。

2023-08-21
一种用于客服回访的处理方法及系统

本发明提供了一种用于客服回访的处理方法，包括步骤：确定客户回访的业务类型，并获得所述业务类型所对应的会话模板；主动发起与客户的会话沟通，根据所述会话模板中问题向客户进行提问；接收客户的语音回复数据，进行语音识别；对客户回访过程中双方陈述的语音内容实时进行语音识别并转换成文字，形成回访问卷，并存储。本发明还提供了相应的系统。实施本发明，可以提高客户回访的智能化程度，提高了回访效果；同时，可以针对不同客户提供相应服务，其个性化程度高；从而能提高效率以及受访客户的使用体验。

2023-08-21
一种语音处理方法、装置和用于语音处理的装置

本发明实施例提供了一种语音处理方法、装置和用于语音处理的装置。其中的方法包括：获取待处理的语音数据；对所述语音数据进行声源位置估计，检测所述语音数据中的第一跳变点，所述第一跳变点为表示所述语音数据中声源位置发生变化的时间点；基于所述语音数据中说话者表征特征的变化信息以及所述第一跳变点对所述语音数据进行分割，得到分割结果。本发明实施例可以提高说话者分割的准确率。

2023-08-21
音频处理方法、装置、可读存储介质和电子设备

本发明实施例公开了一种音频处理方法、装置、可读存储介质和电子设备，通过确定第一音频数据，对所述第一音频数据进行分割，以确定包括至少一个音频片段的音频片段序列。根据预设扰动规则对所述音频片段序列中各所述音频片段添加扰动，以调整各所述音频片段对应的音频属性确定目标音频片段序列。拼接所述目标音频片段序列中各所述目标音频片段，以确定第二音频数据。本发明实施例通过对音频数据进行分割，获得多个具有对应音频属性的音频片段，对各音频片段添加扰动以调整音调、音量、语速等音频属性，为调整后音频片段确定的音频数据增加情感色彩，提升了合成语音的真实感。

2023-08-21
一种唤醒模型的生成和更新方法、装置、设备及介质

本发明公开了一种唤醒模型的生成和更新方法、装置、设备及介质，用以解决现有无法快速生成适合布局在智能设备上的该自定义唤醒词对应的唤醒模型的问题。由于本发明实施例中只需确定自定义唤醒词对应的唤醒模型中的目标参数的信息，即确定自定义唤醒词对应的唤醒模型中的至少一个可调整的参数的信息，从而减少确定该自定义唤醒词对应的唤醒模型中全部参数的信息所耗费的时间，并在确定目标参数的信息之后，只将该目标参数的信息发送至智能设备，减少用于数据传输所耗费的时间，以及占用的网络资源。

2023-08-21
一种可保护识别器的语音识别接收设备

本发明涉及语音识别技术领域，且公开了一种可保护识别器的语音识别接收设备，包括外壳，所述外壳的内部设置有接收板，所述外壳的内壁固定连接有支撑块，所述支撑块的内部设置有气缸，所述气缸的侧面固定连接有抽气管，所述导管的内部滑动连接有气板，所述气板远离气缸的一侧通过连杆固定连接有铁块，所述惯性轮的表面滑动连接有磁块，所述惯性轮的侧面固定连接有挡风板，所述挡风板的表面固定连接有吸水布，所述吸水布的表面滑动连接有摩擦块。该可保护识别器的语音识别接收设备，通过惯性轮与气缸的配合使用，从而达到了在用户靠近识别器大声说话时，阻止呼出气体内水蒸气与识别器接触的效果。

2023-08-21
一种用于客服笔录自动修改处理方法

本发明提供了一种用于客服笔录自动修改处理方法，应用于智能客服业务场景下，由智能语音客服对接收到的用户的语音数据进行语音识别，并进行自然语音处理，根据用户的语义由智能语音客服提供对应的客服服务。根据用户发出的语音数据，从预设的模板资料库中匹配对应的客服语音数据并对用户进行响应。对响应过程中双方陈述的语音内容实时进行语音识别并转换成文字，形成初步客服服务记录；对初步客服服务记录中不符合记录规范的内容进行自动修正，获得完善的符合客服服务记录规定的客服记录。实施本发明，可以提高客服服务记录的处理效率以及提高客服服务效率。

2023-08-21
一种用于供电智能客户的语音识别处理系统

本发明提供了一种用于供电智能客户的语音识别处理系统，包含有语音输入单元、预处理单元、特征提取单元、语音识别模型构建单元以及语音识别处理单元；通过对客户的语音信号进行预处理、进行特征提取、进行识别，获得文本格式的语音识别结果，并输出。实施本发明，由于对语音信号采用了有效的预处理工作，可以提高语音识别准确度；同时，由于采用了智能打断处理机制，可以提高智能化程度，能实现智能打断响应，从而可以提高客户的使用体验；另外，通过训练语音识别模型，可以提高语音识别的准确度。

2023-08-21

技术分类

友情链接