乐器、声学

  • 将相位值应用于幅度值的下混合器、音频编码器、方法和计算 机程序
    将相位值应用于幅度值的下混合器、音频编码器、方法和计算
机程序

    用于基于多个输入信号提供下混合信号的下混合器被配置为基于输入信号的响度信息来确定下混合信号的频谱域值的幅度值。下混合器被配置为确定下混合信号的频谱域值的相位值,并且下混合器被配置为应用相位值,以便基于下混合信号的频谱域值的幅度值获得下混合信号的频谱域值的复数值表示。音频编码器使用这种下混合器。还描述了用于下混合的方法和计算机程序。

    2023-08-21
  • 前馈不稳定性的实时检测
    前馈不稳定性的实时检测

    本发明提供了用于检测相关联的前馈音频处理系统中的不稳定性的音频设备和方法。麦克风提供前馈信号以供前馈滤波器处理。经处理的信号可提供与周围环境相关联的噪声降低和/或声音增强。经处理的信号有助于提供给声换能器(例如,驱动器)的驱动器信号,以为用户产生声学信号。处理器被配置为检测一个或多个信号中的不稳定性指示,并且响应于检测到该不稳定性指示来调节前馈信号路径的相位响应。

    2023-08-21
  • 用于远程麦克风技术的接近度补偿系统
    用于远程麦克风技术的接近度补偿系统

    一种用于车辆的远程麦克风系统可以包括:至少一个实体麦克风,所述至少一个实体麦克风布置在车厢内并被配置为生成所述车辆内的虚拟麦克风位置处的误差信号;数据库,所述数据库被配置为维持预先测量座椅位置和相关联传递函数的查找表;和处理器。所述处理器可以被配置为:接收指示所述车辆内的座椅位置的座椅位置;并且将与所述预先测量位置相关联的传递函数应用于所述至少一个实体麦克风的初级噪声信号以生成所述误差信号。

    2023-08-21
  • 音频增强听力保护系统
    音频增强听力保护系统

    一种由用户佩戴的音频增强听力保护系统,包括具有主降噪单元和副降噪单元的环境降噪组件。音频增强听力保护系统还包括音频输入组件,该音频输入组件具有用于接收原始环境音频信号的一个或多个环境麦克风。在将原始音频信号传输给用户之前,经由数字信号处理组件将原始音频信号转换为经处理的音频信号。音频增强听力保护系统还包括音频输出组件,该音频输出组件具有用于向用户传送经处理的音频信号的至少一个扬声器。

    2023-08-21
  • 低延迟邻近群组翻译
    低延迟邻近群组翻译

    本地无线网络用于在说两种以上不同语言的用户之间建立多语言翻译群组,使得当一个用户对他或她的计算设备发言时,该用户的计算设备可以执行自动语音识别,在某些情况下,执行到不同语言的翻译,以生成非音频数据,以传送到群组中其他用户的计算设备。然后,其他用户的计算设备使用接收的非音频数据生成适合其相应用户的口头音频输出。在其他用户的计算设备上生成口头音频输出还可以包括执行到相应用户的期望语言的翻译,从而使每个用户都能够响应于来自另一用户的语音输入,以其期望的语言接收口头音频输出,而与语音输入的原始语言无关。

    2023-08-21
  • 通过语音命令的基于位置的语音识别系统
    通过语音命令的基于位置的语音识别系统

    根据本发明,其目的在于,在包括麦克风在内的多个装置通过传感器网络连接的情况下,容易地识别使用者的语音命令。掌握各装置的相对位置,通过语音命令接入的时间差异来追踪使用者的位置及方向。基于使用者的位置及方向,执行该命令的解析。这种方法作为用于传感器网络(Sensor Network)、物物通信(Machine to Machine:M2M)、机器类型通讯(Machine Type Communication:MTC)、物联网(Internet of Things:IoT)的方法,可以用于智能型服务(智能家庭、智能楼宇等)、数字教育、安保及安全相关服务等。

    2023-08-21
  • 用于言语转换系统的分级编码器
    用于言语转换系统的分级编码器

    本公开提供“用于言语转换系统的分级编码器”。描述了一种言语转换系统,其包括分级编码器和解码器。所述系统可以包括处理器和存储可由处理器执行的指令的存储器。指令可以包括:使用第二递归神经网络(RNN)(GRU1)和从谱图得到的第一组编码器向量作为第二RNN的输入,确定第二级联序列;通过将第二级联序列的堆叠高度加倍并且将长度减半来确定第二组编码器向量;使用第二组编码器向量,确定第三组编码器向量;并且使用注意力块对第三组编码器向量进行解码。

    2023-08-21
  • 一种演讲内容提示方法及系统
    一种演讲内容提示方法及系统

    本发明实施例提供了一种演讲内容提示方法及系统,其中,该方法包括:对采集到的演讲者演讲的语音数据进行语音识别,得到演讲者演讲的文本内容,将演讲文稿的当前展示页面的各关键词语与该文本内容进行匹配,得到匹配结果,基于该匹配结果,确定该文本内容中是否存在上述关键词语,存在的关键词语作为待提示的目标关键词语,当存在目标关键词语时,在当前展示页面中,通过改变目标关键词语的展示形式,对目标关键词语进行提示;可以自动提醒听众演讲者演讲的内容在演讲文稿中的位置或者演讲的重点部分,避免了演讲者在演讲过程中需要分出一部分精力不停地提醒听众的现象,有利于提高演讲者的演讲质量,提升演讲效率。

    2023-08-21
  • 一种本地离线智能语音识别模组识别率检测系统及方法
    一种本地离线智能语音识别模组识别率检测系统及方法

    一种本地离线智能语音识别模组识别率检测系统,包括待测语音识别模组的麦克风安放区和语音数据库,所述语音数据库内存储有多个音频数据及与音频数据唯一对应的标准文本;还包括与语音数据库连接的音频数据播放器和比较模块,所述比较模块连接有文本转化串口和统计输出模块。本发明还公开了一种本地离线智能语音识别模组识别率检测方法。采用本发明所述本地离线智能语音识别模组识别率检测系统及方法,通过记录播报命令词文本和收集语音识别模组文本结果,进行匹配后给出结果判定,提高了测试的效率,保证了测试结果的一致性及可复现性。

    2023-08-21
  • 降噪装置及燃气热水器
    降噪装置及燃气热水器

    本发明公开了一种降噪装置及燃气热水器,所述降噪装置包括:本体;消音空间,其位于所述本体内,所述本体上开设有与所述消音空间连通的消音孔。该降噪装置通过设置消音空间,噪声进入消音空间传递衰减实现降噪,本体可以随着机壳的结构相适应变化,不会造成风阻、影响气流流通,且消音空间能够对进入其内任意频段的噪声进行消耗衰减,对能够消除噪声的频率不做限制,可消除200Hz‑2000Hz的宽频噪声,可以包括压缩机、电机振动产生的噪声,也可以包括如燃气热水器的燃烧噪声、气流噪声和水流噪声等。

    2023-08-21
  • 音频分析方法、装置、计算设备和存储介质
    音频分析方法、装置、计算设备和存储介质

    本发明实施例公开了一种音频分析方法、装置、计算设备和存储介质,其中,该方法包括:对目标音频在多个采样周期内的音频片段分别进行强度识别,得到音频重音之间的至少一个重音时间间隔;对于每种重音时间间隔的出现情况进行统计,并根据统计结果确定每种重音时间间隔的权重,其中,每种重音时间间隔对应于时长匹配的至少一个重音时间间隔;将权重满足收敛条件的重音时间间隔,确定为目标音频的节拍间隔。本发明实施例可以提高音频节拍的识别准确性,更好地兼容不同的音乐风格,减小音频实时分析的计算量。

    2023-08-21
  • 一种立体声编码方法、立体声解码方法和装置
    一种立体声编码方法、立体声解码方法和装置

    本申请实施例公开了一种立体声编码方法、立体声解码方法和装置,用于提高立体声的编解码性能。本申请实施例提供一种立体声编码方法包括:对当前帧的左声道信号和所述当前帧的右声道信号进行下混处理,以得到所述当前帧的主要声道信号和所述当前帧的次要声道信号;当确定对所述次要声道信号的基音周期进行差分编码时,使用所述主要声道信号的基音周期估计值对所述次要声道信号的基音周期进行差分编码,以得到所述次要声道信号的基音周期索引值,所述次要声道信号的基音周期索引值用于生成待发送的立体声编码码流。

    2023-08-21
  • 信息处理设备和方法以及计算机可读存储介质
    信息处理设备和方法以及计算机可读存储介质

    本公开提供了一种信息处理设备和方法以及计算机可读存储介质,该信息处理设备包括:处理电路,被配置为:从声音中选择出与发出声音期间的场景特征相关的声音元素;建立对应关系,该对应关系包括场景特征与声音元素之间、以及各个声音元素之间的第一对应关系,并且将场景特征和声音元素以及对应关系相关联地存储在对应关系库中;以及基于再现场景特征和对应关系库,生成待再现的声音。

    2023-08-21
  • 智能交互设备
    智能交互设备

    本申请提供一种智能交互设备,包括采集部件、唤醒处理器、主处理器和通信模块;采集部件用于将采集的环境信号转换为待处理信号;唤醒处理器用于对待处理信号进行指令识别;唤醒处理器还用于在待处理信号包含唤醒指令的情况下,控制待处理信号传输至主处理器;以及,在待处理信号包含休眠指令的情况下,阻断待处理信号向主处理器的传输;主处理器用于对待处理信号进行后续处理,并通过通信模块与远程服务器通信。因为唤醒处理器的功能独立于主处理器,其唤醒功能不会受到主处理器中加载的程序化指令的影响,也不会通过通信模块与远程服务器通信,因此不会出现被远程非法服务器控制的问题。

    2023-08-21
  • 针对安卓手机端VoIP声音小的处理方法、系统、介质及设备
    针对安卓手机端VoIP声音小的处理方法、系统、介质及设备

    本发明提供一种针对安卓手机端VoIP声音小的处理方法、系统、介质及设备。本发明实时检测VoIP声音小问题设备,采用外部音频处理算法,对客户端VoIP声音小的设备有针对性的调整参数,处理效果明显,解决了声音质量变差问题。本发明还采用服务器存储配置音频参数文件,客户端实时动态加载。本发明的方法适用性强、便于更新维护,能有效处理所有客户端设备VoIP声音小问题。

    2023-08-21
  • 基于对数幅度谱和耳间相位差的深度聚类语音分离方法
    基于对数幅度谱和耳间相位差的深度聚类语音分离方法

    本发明公开了一种基于对数幅度谱和耳间相位差的深度聚类语音分离方法,通过提取混合双耳语音信号的对数幅度谱、耳间相位差函数作为输入特征参数,利用深度聚类网络的编码层将特征参数映射为高维特征,实现深度聚类网络编码层的训练。测试时,将测试混合双耳语音信号的特征参数通过训练好的深度聚类网络的编码层映射为高维特征图,再通过K均值聚类方法完成对各频点的分类,得到各频点的二值掩膜矩阵,从而实现混合语音的分离。本发明分离性能良好,且具有较强的鲁棒性。

    2023-08-21
  • 人声伴奏对齐方法及装置
    人声伴奏对齐方法及装置

    提供一种人声伴奏对齐方法及装置。该人声伴奏对齐方法包括:响应于接收到人声音频信号,获取所述人声音频信号的人声音高序列和与所述人声音频信号相应的参考乐器数字接口Midi音高序列;基于参考Midi音高序列和人声音高序列之间的相似性,对人声音频信号进行偏移;并且将偏移后的人声音频信号与伴奏进行混合,得到人声伴奏对齐的混音结果。根据本公开的人声伴奏对齐方法及装置,可使人声音频信号与伴奏自动对齐,从而解决由于外部因素导致人声与伴奏无法对齐的问题,提高用户使用k歌系统的k歌体验。

    2023-08-21
  • 一种数字弦乐器的交互系统及数字弦乐器
    一种数字弦乐器的交互系统及数字弦乐器

    本发明公开了一种数字弦乐器的交互系统及数字弦乐器,包括:功能模块、触屏输入模块、中央处理模块,功能模块包括弦乐演奏模块、弦乐文化模块、弦乐知识模块、琴曲欣赏模块和弦乐名家模块,弦乐演奏模块,用于人机交互演奏虚拟弦乐器;弦乐文化模块,用于介绍古琴的文化内涵;弦乐知识模块,用于介绍古琴的知识;琴曲欣赏模块,用于名曲的介绍和欣赏;弦乐名家模块,用于古琴名家的介绍;触屏输入模块,用于用户信息输入和功能选择,中央处理模块,用于处理数据和根据输入信息选择功能模块。本发明具有弦乐器不再受制于优质材料以及制作工艺,生产成本低,便于弦乐器的传播和学习的优点。

    2023-08-21
  • 大鼓顶座
    大鼓顶座

    本发明公开了一种大鼓顶座,其包括座体、蝴蝶拧手和顶丝片;座体通过螺栓固定在大鼓的鼓腔外壁上,座体的中部贯穿开有一安装孔以供支撑杆插入;蝴蝶拧手螺纹连接在座体的一侧;顶丝片为弹性折弯片,顶丝片的一端开有长圆孔并利用长圆孔套装在蝴蝶拧手上、另一端置入在安装孔内并与蝴蝶拧手的前端相接触;当支撑杆插入至安装孔内后,通过旋转蝴蝶拧手可将顶丝片压紧在支撑杆上,以实现支撑杆和座体之间的锁定。本发明利用蝴蝶拧手和顶丝片的配合使用可将支撑杆更加稳定地连接在大鼓顶座上,而且还设计有记忆环,通过记忆环的使用可快速地将支撑杆调整到上一次使用时的位置,提升了装配的效率。

    2023-08-21
  • 儿童鼓
    儿童鼓

    本发明公开了一种儿童鼓,其包括大鼓、两个耳鼓和吊镲,两个耳鼓和吊镲集成安装在大鼓的鼓腔上方;大鼓的鼓腔上周向均布安装有三个固定座,且三个固定座靠近大鼓的后鼓面设置;其中,两个固定座对称设置在大鼓的鼓腔两侧,且该两个固定座上分别高度可调地安装有一支撑腿,通过调整两个支撑腿来使大鼓向前倾斜,剩余的一个固定座设置在大鼓的鼓腔上部,且该固定座上高度可调地安装有一折弯杆,折弯杆的上端安装有吊镲。本发明设计了一种全新的儿童鼓,将大鼓、两个耳鼓和吊镲集成在一起,结构简单紧凑、设计合理、拆装便捷且可调整性好。

    2023-08-21
  • 耳鼓固定架
    耳鼓固定架

    本发明公开了一种耳鼓固定架,其包括U型滑板、支撑杆和滑座;U型滑板包括底板和两个侧板,两个侧板对称固接在底板的上端两侧,底板固接在支撑杆的上端,且U型滑板相对于支撑杆呈一定角度向前倾斜设置;支撑杆的下部高度可调地插装在大鼓顶座上并可锁定;滑座包括弧形板和两个槽板,弧形板的内壁匹配地贴合在耳鼓的鼓腔外壁上并利用螺栓将弧形板锁定在耳鼓上,两个槽板对称固接在弧形板的外壁上,且两个槽板之间还形成有滑槽;滑座共有两个且两个滑座利用各自的滑槽一一对应地装配在两个侧板上并由底板限位。本发明利用U型滑板和滑座的新型结构方式来实现耳鼓与大鼓之间的连接,可实现快速拆装,有助于提升用户的使用感受。

    2023-08-21
  • 一种针对语音关键词分类网络的对抗样本攻击方法
    一种针对语音关键词分类网络的对抗样本攻击方法

    本发明公开了一种针对语音关键词分类网络的对抗样本攻击方法,包括以下步骤:(1)按照训练策略选择训练数据以及训练的批大小的目标标签;(2)将数据以及标签输入到生成器G中,生成对抗扰动,并且构建相应的对抗样本;(3)将生成的对抗样本分别输入到判别器D和目标受害模型,得到相应的损失,并且计算相应的损失,更新网络的参数;(4)重复步骤(1)至步骤(4),直到满足训练的停止条件,最终得到训练好的模型;(5)模型使用,加载模型参数,输入语音样本以及目标标签,即可快速的生成对抗样本。使用本发明提出的方法,能够实现实时场景下基于语音关键词分类网络应用的对抗样本攻击。

    2023-08-21
  • 声音或声场的压缩HOA声音表示的解码方法和装置
    声音或声场的压缩HOA声音表示的解码方法和装置

    本公开涉及声音或声场的压缩HOA声音表示的解码方法和装置。当对HOA数据帧表示进行压缩时,在每个通道信号被感知地编码(16)之前对其实施增益控制(15,151)。增益值作为边信息以差分的方式被传输。然而,为了开始对这样的流式压缩HOA数据帧表示进行解码,需要绝对增益值,应当以最小数量的比特对该绝对增益值进行编码。为了确定这样的最小整数比特量{βe),在空间域中将HOA数据帧表示(C(k))渲染为位于单位球体上的虚拟扬声器信号,随后对HOA数据帧表示(C(k))进行归一化。然后,将最小整数比特数设置为(AA)。

    2023-08-21
  • 声音或声场的压缩HOA声音表示的解码方法和装置
    声音或声场的压缩HOA声音表示的解码方法和装置

    本公开涉及声音或声场的压缩HOA声音表示的解码方法和装置。当对HOA数据帧表示进行压缩时,在每个通道信号被感知地编码(16)之前对其实施增益控制(15,151)。增益值作为边信息以差分的方式被传输。然而,为了开始对这样的流式压缩HOA数据帧表示进行解码,需要绝对增益值,应当以最小数量的比特对该绝对增益值进行编码。为了确定这样的最小整数比特量{βe),在空间域中将HOA数据帧表示(C(k))渲染为位于单位球体上的虚拟扬声器信号,随后对HOA数据帧表示(C(k))进行归一化。然后,将最小整数比特数设置为(AA)。

    2023-08-21
  • 通用性吉他防脱背带扣
    通用性吉他防脱背带扣

    本发明涉及通用型吉他防脱背带扣,包括有背带扣本体,其特征在于:所述背带扣本体一端设有背带连接端另一端设有背带尾钉连接端,所述背带连接端设有用将背带的背带孔锁紧的第一锁紧装置,所述背带尾钉连接端设有卡槽,卡槽一端设有供背带尾钉进入的开口,背带尾钉连接端在卡槽中设有将背带尾钉锁紧的第二锁紧装置,本发明的有益效果为:适应于各种背带尾钉,壳体强度高,产品轻巧玲珑,外观设计简洁大方,卡口采用U型开口,外八角导向,能够轻巧自如滑扣,防脱件采用高强度钢珠材质,耐磨顺滑不卡顿,回弹卡片采用H59黄铜,回弹性能稳定可靠。

    2023-08-21
  • 用于音频信号的时域数据包丢失隐藏的方法
    用于音频信号的时域数据包丢失隐藏的方法

    一种用于音频信号的时域数据包丢失隐藏的方法包括:将频域信号时频逆变换为与当前帧对应的时域信号;检查当前帧是否对应于至少一个擦失帧之后的好帧;如果当前帧对应于至少一个擦失帧之后的好帧,则基于包括信号特性的多个参数,从包括相位匹配工具和平滑工具的多个工具中选择一个工具;和基于所选择的工具对当前帧执行数据包丢失隐藏处理;其中,如果所选择的工具是所述平滑工具,则基于所述至少一个擦失帧的数目对当前帧执行一个平滑处理或两个平滑处理。

    2023-08-21
  • 用于音频信号的时域数据包丢失隐藏的方法
    用于音频信号的时域数据包丢失隐藏的方法

    一种用于音频信号的时域数据包丢失隐藏的方法包括:将频域信号时频逆变换为与当前帧对应的时域信号;检查当前帧是否对应于擦失帧和至少一个擦失帧之后的好帧中的一者;如果当前帧对应于擦失帧和至少一个擦失帧之后的好帧中的一者,则获取信号特性;基于包括信号特性的多个参数,从包括相位匹配工具和平滑工具的多个工具中选择一个工具;和基于所选择的工具对当前帧执行数据包丢失隐藏处理;如果所选择的工具是平滑工具,当前帧对应于好帧并且至少一个擦失帧的数目是1,则执行第一平滑处理作为数据包丢失隐藏处理;如果所选择的工具是平滑工具,当前帧对应于好帧并且至少一个擦失帧的数目大于1,则执行第二平滑处理作为数据包丢失隐藏处理。

    2023-08-21
  • 一种相控多声道声波定向发射方法及系统
    一种相控多声道声波定向发射方法及系统

    一种相控多声道声波定向发射方法及系统,通过人机交互模块或外部信息接收模块接收虚拟目标信息,并传送给目标检测模块,目标检测模块检测环境中是否存在实际目标,并进一步检测目标类型、目标数量以及各个目标的空间位置,将需要发射的音频信号经过音效变换传送给调制模块,调制模块使用经过音效换号的音频信号对超声载波信号进行调制再传送给发射控制模块,发射控制模块根据目标数量以及各个目标的空间位置将发射阵列划分为对应各个目标的子阵列,并根据相位控制方法计算子阵列中每个超声波发射器需要的发射延时,经过发射延时后,调制好的超声载波信号通过发射子阵列中的各个超声波发射器发射。

    2023-08-21
  • 用于登记用户命令的显示装置和方法
    用于登记用户命令的显示装置和方法

    一种显示装置,包括:输入单元,被配置为接收用户命令;输出单元,被配置为输出针对用户命令的登记合适性确定结果;以及处理器,被配置为生成用户命令的音标,分析生成的音标以确定用户命令的登记合适性,并控制输出单元输出针对用户命令的登记合适性确定结果。因此,显示装置可以登记抗误识别并保证用户定义的用户命令中的高识别率的用户命令。

    2023-08-21
  • 一种超结构水声发射换能器
    一种超结构水声发射换能器

    一种超结构水声发射换能器,包括外壳以及设置在外壳内部密封空间的电动式驱动元件以及超结构辐射盖板,超结构辐射盖板由基板以及固定在基板上的多个附加质量单元组成,电动式驱动元件包括软磁材料底座,软磁材料底座上开设有环形凹槽,环形凹槽当中放置有永磁材料芯体,由软磁材料底座顶部至永磁材料芯体与软磁材料底座之间的缝隙插入安装线圈骨架,线圈骨架上缠绕线圈,软磁材料底座的中心掏空并设置有螺旋弹簧,螺旋弹簧通过连接件与基板相连,所述的连接件具有能够与线圈骨架固定的平板面。本发明水声发射换能器的尺寸小,能够在中低频范围形成连续的声发射宽带。

    2023-08-21
  • 一种电子二胡系统
    一种电子二胡系统

    本发明公开了一种电子二胡系统,属于音乐器械技术领域。该系统包括:同源替换音频流系统、演奏分析系统、播放系统和音色库;同源替换音频流系统,用于建立二胡不同技法对应的模型,并将模型发送给演奏分析系统;演奏分析系统,用于检测二胡琴码的振动信号,根据检测到的振动信号和模型,确定二胡当前的演奏信息,并将演奏信息发送给播放系统;播放系统,用于根据演奏信息,调用音色库中的波表,采用波表合成的方式合成并播放对应的音乐。本发明中通过使用音色库中的声音来替代二胡本身发出的声音,使得其发声方式和材料无关,仅仅和音色库的质量有关,彻底摆脱了二胡对材料的依赖,大大降低了电子二胡的制作成本。

    2023-08-21
  • 一种基于卷积块注意机制的视听双模态语音识别方法
    一种基于卷积块注意机制的视听双模态语音识别方法

    本发明提供一种基于卷积块注意机制的视听双模态语音识别方法,包括如下步骤:(1)对视听双模态信息数据集进行预处理;(2)提出构建CBAM‑AV‑LipNet模型;(3)完成基于卷积块注意机制的视听双模态语音识别任务,实现视听双模态语音识别任务。本发明利用提出构建的CBAM‑AV‑LipNet模型对测试集进行特征提取得到深层融合特征向量,对其进行CTC贪婪搜索解码,获得识别文本信息,完成视听双模态语音识别任务。本发明提出的基于卷积块注意机制的视听双模态语音识别方法较传统的语音识别方法和视觉语音识别模型LipNet具有良好的识别性能和收敛速度,同时具有一定的抗噪能力和有效性。

    2023-08-21
  • 一种智能语音识别辅助电力巡检设备拍摄方法
    一种智能语音识别辅助电力巡检设备拍摄方法

    本发明公开了一种智能语音识别辅助电力巡检设备拍摄方法,所述电力巡检设备拍摄方法包括以下几个步骤:步骤一:制作生成带语音关键字的设备台账数据库S20;步骤二:将设备台账数据库文件导入红外热像装置S21;步骤三:在日常常规检测和例行巡检任务时,点击选择开启任务巡检模式S22,红外热像装置进行任务巡检模式,巡检模式初始默认按顺序进行巡检。该智能语音识别辅助电力巡检设备拍摄方法,能在时间保存的基础上增加根据拍摄者按照设备信息顺序拍摄命名保存的要求,又同时能根据拍摄者随机拍摄通过语音关键字自动匹配正确设备信息进行保存,避免翻找数据库增加工作量,同时根据时间也可以避免同物体多次拍摄引起存储错误和混淆等问题。

    2023-08-21
  • 训练数据更新方法及系统、语音识别方法及系统、设备
    训练数据更新方法及系统、语音识别方法及系统、设备

    本发明公开了一种训练数据更新方法及系统、语音识别方法及系统、设备。其中,语音识别模型的训练数据更新方法包括以下步骤:将目标场景下的目标音频数据输入第一语音识别模型,得到第一文本;将所述目标音频数据输入第二语音识别模型,得到第二文本;比较所述第一文本和所述第二文本,得到目标核心词;根据所述目标核心词在所述目标音频数据中的目标位置,从包括所述目标位置以及所述目标位置附近的部分目标音频数据中选取标注数据;将所述标注数据以及对应的标注文本更新至所述第二语音识别模型的训练数据中。本发明能够实现自动补充核心词,从而提高第二语音识别模型的更新效率,进而提高语音识别的准确率。

    2023-08-21
  • 语音音素的识别方法及系统、电子设备及存储介质
    语音音素的识别方法及系统、电子设备及存储介质

    本发明公开了一种语音音素的识别方法及系统、电子设备及存储介质。语音音素的识别方法包括以下步骤:接收通话语音的音频数据;其中,所述音频数据对应的语言为英文;根据预设的帧移和帧长对所述音频数据进行分帧处理;利用音素识别模型对每帧音频数据的音素进行识别,其中,所述音素识别模型是基于音素对齐的英文训练样本训练得到的。本发明根据预设的帧移对所述音频数据进行分帧处理,充分考虑到英文语音信号的短时平稳性以及上下文特征,提高了后续英文音素识别的准确率。同时,利用基于音素对齐的英文训练样本训练得到的音素识别模型对每帧音频数据的音素进行识别,进一步提高了英文音素识别的准确率。

    2023-08-21
  • 一种办公区用声掩蔽系统
    一种办公区用声掩蔽系统

    本申请涉及一种办公区用声掩蔽系统,属于声音处理系统的领域,包括设置在工位的隔板外侧的声音接收器以及可与声音接收器电连接的掩蔽声发生器;声音接收器包括相连接的声音采集模块和微控制模块;所述声音采集模块用于采集并处理外部环境音,微控制模块接收并存储所述声音采集模块发出的声音电信号并控制该电信号的发送;掩蔽声发生器包括信号处理模块和掩蔽声产生模块,信号处理模块与掩蔽声产生模块电连接,信号处理模块用于接收所述微控制模块发送的声音电信号;信号处理模块根据环境声电信号,信号处理模块使掩蔽声产生模块产生掩蔽声。本申请具有减小工位附近的噪音对工作人员的影响的效果。

    2023-08-21
  • 一种金属弦吉他的发光装置
    一种金属弦吉他的发光装置

    本发明公开了一种金属弦吉他的发光装置,包括有塑料外部壳体,塑料外部壳体内部开设有空腔,空腔水平方向设置有缓冲层,缓冲层将空腔分割为上层空腔与下层空腔,缓冲层靠近上层空腔的一侧设置有磁条,下层空腔设置有电路板与电池座,放大电路板与电池座电性连接;上层空腔外壁嵌有磁柱与LED射灯,磁柱穿出上层空腔外壁,底端与缓冲层相接,位于上层空腔内的磁柱的侧壁缠绕有线圈;LED射灯电性连接电路板,线圈电性连接电路板。本发明相比较以往较为朴素的装饰,可以有更加炫酷的展示效果,使枯燥的学琴过程中增加乐趣。可以辅助拨动琴弦力度的训练,通俗的讲,拨动琴弦的力度越大,LED射灯越亮。

    2023-08-21
  • 一种音频相似度识别方法
    一种音频相似度识别方法

    本发明涉及一种音频相似度识别方法,包括以下步骤:获取参考音频和待识别音频;对待识别音频进行静音抑制处理,得到初始待识别音频;对参考音频和初始待识别音频分别进行预处理,得到预处理参考音频和预处理待识别音频;将预处理参考音频和预处理待识别音频进行听觉转换;利用相似度失真模型去除听觉转换过程中的扰动和失真,继而计算得到相似度。与现有技术相比,可以有效提高相似度的精度。

    2023-08-21
  • 语音传输方法、智能终端及计算机可读存储介质
    语音传输方法、智能终端及计算机可读存储介质

    本发明提供一种语音传输方法,应用于智能终端,所述智能终端与至少一拾音设备低功耗蓝牙(BLE)连接,包括:监测是否接收到拾音器唤醒信号;若是,则接收被唤醒的拾音器所反馈的BLE数据;根据所述BLE数据确认目标拾音器;切换所述智能终端与所述目标拾音器的连接为经典蓝牙连接,以及通过所述经典蓝牙连接,接收所述目标拾音器所采集的语音信号。

    2023-08-21
  • 音乐风格迁移方法、模型训练方法、装置和存储介质
    音乐风格迁移方法、模型训练方法、装置和存储介质

    本发明公开了一种音乐风格迁移方法、模型训练方法、装置和存储介质,模型训练方法包括获取训练样本;根据训练样本和噪声样本获取生成器和鉴别器;将训练样本输入到生成器中,得到伪样本;将训练样本和伪样本输入到鉴别器中,获取生成损失和对比损失;将伪样本输入到生成器中,得到重建样本;计算训练样本和重建样本的重建损失;将干扰域样本和伪样本输入到鉴别器中,获取鉴别损失;利用梯度下降法,通过生成损失、对比损失、重建损失和鉴别损失训练生成器和鉴别器。通过将目标域对比损失运用到音频领域以提取并学习目标域的高级特征,实现将音乐风格迁移到不同音乐域的目标,大大降低了音乐风格迁移的训练成本。

    2023-08-21
  • 一种在线教育功能智能云钢琴系统
    一种在线教育功能智能云钢琴系统

    本发明涉及一种具有双向互动功能的在线教育功能智能云钢琴系统。采用的技术方案包括:通过WIFI或有线网络进行数据传输和控制的云端服务系统模块和本地系统模块,其特征在于:所述本地系统模块包括智能教学系统模块、电源功放系统模块、音源系统模块和音调系统模块;所述智能教学系统模块包括电源管理和I/O模、内容管理模块、音源系统控制模块、用户数据管理模块、在线交流教育模块;所述电源管理和I/O模块联合所述电源功放系统模块实现对电源的智能管理。

    2023-08-21
  • 用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车
    用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车

    本发明提供了一种用于搅拌车驾驶室内声音的降噪方法、装置和搅拌车。用于搅拌车驾驶室内声音的降噪方法,包括:采集搅拌车驾驶室内的声音信号;将声音信号输入至声纹识别模型,声纹识别模型对声音信号进行噪声识别;将噪声识别结果和声纹识别模型的参数输入至语音分离模型,得到噪声信号;将噪声信号输入至场景识别模型,得到搅拌车所处的场景;根据场景对应的预设参数,获取反向噪声信号;将反向噪声信号,输出至搅拌车驾驶室。本发明通过声纹识别模型进行噪声识别,通过语音分离模型提取噪声信号,有效区分有用的声音和噪声,在去除环境噪声和搅拌机运行噪声的基础上,保留鸣笛声、人声等有用声音,提高驾驶员的驾驶舒适性和安全性。

    2023-08-21
  • 语音识别系统、指令产生系统及其语音识别方法
    语音识别系统、指令产生系统及其语音识别方法

    本发明提出一种语音识别系统、指令产生系统及其语音识别方法。语音识别系统适于与应用系统进行通信。应用系统接收语音输入。语音识别系统包括语音辨识模块、自然语音理解系统以及指令产生系统。语音辨识模块接收由应用系统提供的语音输入,并且辨识语音输入,以产生语音信息。自然语音理解系统耦接语音辨识模块。自然语音理解系统理解语音信息,以产生语意分析结果。指令产生系统耦接自然语音理解系统。指令产生系统利用语意分析结果来比较在当前使用者界面的界面内容中的选择项目,并且依据比较结果来输出控制指令至应用系统。由此,除了可提供便捷的语音识别功能,还可降低在应用系统中对于语音识别所需要的系统资源。

    2023-08-21
  • 基于声纹的通话管理方法、装置、电子设备及存储介质
    基于声纹的通话管理方法、装置、电子设备及存储介质

    本申请公开了一种基于声纹的通话管理方法、装置、电子设备以及存储介质。该方法包括:获取接入会议的语音信号,所述语音信号包括至少两个来自不同与会终端的子语音信号,检测所述语音信号的语音状态,若所述语音信号的语音状态为异常状态,基于所述语音信号的语音特征,确定导致所述异常状态的异常子语音信号,向所述异常子语音信号对应的目标与会终端发送提示信息。该方法可以提高确定导致异常状态的异常子语音信号的准确性,提高确定异常子语音信号的速度,保证会议正常进行,以及简化会议室现场人员的操作流程。

    2023-08-21
  • 音频对抗扰动的测试方法、设备及存储介质
    音频对抗扰动的测试方法、设备及存储介质

    本公开实施例提供一种音频对抗扰动的测试方法、设备及存储介质,通过将初始音频信号输入到对抗性攻击模型的攻击网络获取第一干扰信号;采用具有不同通带的至少两个备选带通滤波器分别对第一干扰信号滤波获取每个备选带通滤波器对应的第二干扰信号;根据各第二干扰信号、初始音频信号及目标音频处理模型确定目标带通滤波器;基于对抗性攻击模型对目标音频处理模型进行对抗性攻击测试,其中对抗性攻击模型中的带通滤波器为目标带通滤波器。本公开实施例从至少两个备选带通滤波器中确定最优的备选带通滤波器作为对抗性攻击模型的目标带通滤波器,使得对抗性攻击模型针对目标音频处理模型生成的对抗音频样本具有最优的对抗性攻击性能。

    2023-08-21
  • 基于集成学习和卷积神经网络的环境声音识别方法
    基于集成学习和卷积神经网络的环境声音识别方法

    本发明公开了基于集成学习和卷积神经网络的环境声音识别方法,包括:S1、特征提取,对原始音频进行分帧和加窗,利用梅尔滤波器组得到声音的梅尔能量频谱,最终得到最后的梅尔能量频谱特征,作为数据集;S2、模型训练,采用k折交叉验证和使用mixup数据增强方法对于所述数据集进行模型训练,得到K个卷积神经网络模型;S3、声音测试,对待测声音样本通过卷积神经网络模型进行识别。本发明能够利用k折交叉验证训练k个模型并结合k个模型进行声音识别,大大增强了模型的泛化能力,有效缓解了过拟合的现象,此外针对数据量不大的情况,使用mixup数据增强对原始样本进行混合以进一步增强模型的泛化能力。

    2023-08-21
  • 一种语音识别方法、装置、设备及存储介质
    一种语音识别方法、装置、设备及存储介质

    本发明实施例公开了一种语音识别方法、装置、设备及存储介质。方法包括:通过加速度传感器和角速度传感器对语音信号进行采集,得到与语音信号对应的加速度信号和角速度信号;通过预设的信号过滤法规则,对加速度信号和角速度信号进行过滤;将过滤后的加速度信号和过滤后的角速度信号输入至预设的语音重组模型中,输出与语音信号对应的重组语音信号;将重组语音信号输入至预设的语音识别模型中,输出与重组语音信号对应的文本信息;在检测到文本信息中包含唤醒词时,对终端设备或终端设备的预设应用进行唤醒。本发明实施例可以在用户无感知的情况下进行唤醒识别,既能保证唤醒识别效率又做到无干扰,提高用户体验。

    2023-08-21
  • 一种基于双麦克风系统检测和定位无声语音指令的方法
    一种基于双麦克风系统检测和定位无声语音指令的方法

    本发明公开了一种基于双麦克风系统检测和定位无声语音指令的方法。所述方法利用智能设备上的双麦克风系统对“海豚音攻击”进行检测和定位。通过对声音信号进行预处理和特征提取,继而训练二分类机器学习模型,利用训练好的模型进行无声语音指令的检测,这种方法可以有效的识别接收到的语音指令是“无声”的还是正常的指令,进而取消无声指令的识别和执行,然后对攻击者进行定位,从而更快的发现攻击者。

    2023-08-21
  • 一种适用于演出场所的声音反射板
    一种适用于演出场所的声音反射板

    本发明提出了一种适用于演出场所的声音反射板,包括箱体和万向轮,箱体的底部设有万向轮,万向轮通过螺丝与箱体固定连接,箱体的底部设有底座,底座通过螺丝与箱体固定连接,底座的一侧设有控制中心,控制中心通过螺丝与底座固定连接,箱体的一侧设有推手,推手通过焊接与箱体固定连接。该种适用于演出场所的声音反射板,通过设有的万向轮,实现了该设备的移动,且不需要安装,解决了安装费用的问题,通过该设备体型较小,结构简单,解决了高昂的材料费用问题,通过设有的控制中心,实现了该设备的控制功能,提高了便捷性,通过偏转杆的一端设有固定板,实现了声音反射板的固定,提高了稳定性。

    2023-08-21
  • 一种韵律预测的方法、装置、设备及存储介质
    一种韵律预测的方法、装置、设备及存储介质

    本申请提供了一种韵律预测的方法、装置、设备及存储介质,涉及自然语言理解技术领域。从文本语义和文本标点两方面分析文本语义,再综合文本语义和文本标点对文本语义的影响,预测该文本的韵律信息,保证在文本本身出现歧义的情况下,能够准确地预测文本的韵律信息。所述方法包括:获得待合成文本的语义向量;对所述待合成文本的每个停顿标记进行向量转换,得到所述待合成文本的标记向量;合并所述语义向量和所述标记向量,得到第一特征向量;将所述第一特征向量输入预设的韵律预测模型,得到所述待合成文本的韵律信息。

    2023-08-21
技术分类