掌桥专利:专业的专利平台
掌桥专利
首页

一种修正广播音色的方法及系统

文献发布时间:2023-06-19 16:06:26



技术领域

本发明涉及广播通信技术领域,尤其涉及一种修正广播音色的方法及系统。

背景技术

广播是常见的传播方式,也是上世纪20年代开始流行的媒体之一。不过,随着技术的演进,广播从最初的模拟广播到数字广播,再到现在的网络广播,已经经历了三代的变革。而随着互联网、移动互联网、云计算、大数据和物联网的发展,基于物联网的广播系统将会成为新一代(即第四代)广播系统。

不可否认的是,出于对广播产品的特性而言,无论对于哪一代广播系统,广播的音色永远是不可忽视的考虑点。而现有的用于调整音色的设备和方法均未考虑众多影响音色的因素,调整的结果比较片面和主观。故此,寻求一种修正广播音色的新方法具有重要意义。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有用于调整音色的设备和方法存在的问题,提出了本发明。

因此,本发明解决的技术问题是:解决现有的用于调整音色的设备和方法均未考虑众多影响音色的因素,调整的结果比较片面和主观的问题。

为解决上述技术问题,本发明提供如下技术方案:一种修正广播音色的方法,包括抓取并分析声波特征信息;输入所述声波特征信息进行修正,获取理论音频θ;匹配当前环境信息,将所述理论音频θ环境化,获取环境音频ρ;提取所述环境音频ρ并进行广播。

作为本发明所述的修正广播音色的方法的一种优选方案,其中:所述声波特征信息包括频率f、振幅p、相位φ。

作为本发明所述的修正广播音色的方法的一种优选方案,其中:对所述声波特征信息进行修正包括输入所述声波特征信息,并进行降噪预处理;构建神经网络模型;经预处理的所述声波特征信息加载到所述神经网络模型后,选取训练参数对其进行训练学习,并通过训练学习输出值判断所述降噪预处理是否达标;实时输出训练学习达标的所述声波特征信息,并将不达标的所述声波特征信息再次进行降噪预处理后进行上述训练学习。

作为本发明所述的修正广播音色的方法的一种优选方案,其中:选定所述训练参数具体值后,相对应获取一个训练学习标准阈值;当预处理的所述声波特征信息训练学习输出值达到所述训练学习标准阈值时,定义预处理的所述声波特征信息达标。

作为本发明所述的修正广播音色的方法的一种优选方案,其中:通过以下公式获取所述理论音频θ,

其中,f为频率、p为振幅、φ为相位、T为周期、λ为波长、θ为理论音频。

作为本发明所述的修正广播音色的方法的一种优选方案,其中:所述环境信息包括探测空间的大小S以及区域空气流速的大小L。

作为本发明所述的修正广播音色的方法的一种优选方案,其中:通过以下公式获取所述环境音频ρ,

其中,f为频率、θ为理论音频、T为周期、λ为波长、S为探测空间的大小、L为区域空气流速的大小、ρ为环境音频。

为解决上述技术问题,本发明还提供如下技术方案:一种修正广播音色的系统,包括抓取分析模块,用于抓取并分析声波特征信息;输入模块,与所述抓取分析模块连接,用于输入所述声波特征信息;修正模块,与所述输入模块连接,用于对所述声波特征信息进行修正,获取理论音频θ;匹配模块,与所述修正模块连接,接收所述理论音频θ,并匹配相应环境信息,获取环境音频ρ;中控模块,与所述匹配模块连接,提取所述环境音频ρ并进行广播。

作为本发明所述的修正广播音色的系统的一种优选方案,其中:所述修正模块包括预处理单元,用于对输入的所述声波特征信息进行降噪预处理;构建单元,用于构建神经网络模型,并通过构建的所述神经网络模型进行训练学习;计算单元,用于计算训练参数相匹配的训练学习标准阈值以及计算理论音频θ;判断单元,用于判断预处理的所述声波特征信息是否达标。

作为本发明所述的修正广播音色的系统的一种优选方案,其中:所述匹配模块包括接收单元,用于接收所述理论音频θ;获取单元,用于获取所述环境信息,以及通过所述环境信息获取所述环境音频ρ。

本发明的有益效果:通过本发明提供的修正广播音色的方法及系统,获取相应音波特征信息后通过修正模块先一步进行理论修正,再次通过匹配环境信息进一步进行音色的环境化,进一步提高了音色调整的优质度,解决了现有的用于调整音色的设备和方法均未考虑众多影响音色的因素,调整的结果比较片面和主观的问题。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:

图1为本发明提供的修正广播音色的方法的方法流程图;

图2为本发明提供的修正广播音色的系统的模块图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。

本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。

同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

实施例1

现有的用于调整音色的设备和方法均未考虑众多影响音色的因素,调整的结果比较片面和主观。

故此,请参阅图1,本发明提供一种修正广播音色的方法,包括:

抓取并分析声波特征信息;

输入声波特征信息进行修正,获取理论音频θ;

匹配当前环境信息,将理论音频θ环境化,获取环境音频ρ;

提取环境音频ρ并进行广播。

需要说明的是,运用相关设备进行抓取并分析声波特征信息,在过程中采用了基于移动侦测机制的方法,因而在进行声波特征信息采集前,还包括有一移动侦测步骤,对画面进行移动侦测的相关设置如下:将图像帧分割成若干图像块,各若干图像块设为移动侦测区域,并对移动侦测区域编号标记。本领域的相关技术人员可以灵活地对画面区域划分,以获得一较佳的侦测效果。

在具体的采集过程中,对该周期内的图像帧进行移动侦测检测,获取声音采集周期内的声音特征。

其中,声波特征信息包括频率f、振幅p、相位φ。考虑到音调是由频率f

决定的,频率高的音调就高,音调是人声20Hz-20kHz频率的统称,人声里有很多频率,每个频率都有对应的波长和周期;振幅p决定响度,振幅越大越响;波长λ、周期T受到音调影响;相位φ一般和发声位置有关,例如人在移动时,声音相位就一直在变。故此,选用频率f、振幅p和相位φ作为声波特征信息。

进一步的,对声波特征信息进行修正包括:

输入声波特征信息,并进行降噪预处理;

构建神经网络模型;

经预处理的声波特征信息加载到神经网络模型后,选取训练参数对其进行训练学习,并通过训练学习输出值判断降噪预处理是否达标;

实时输出训练学习达标的声波特征信息,并将不达标的声波特征信息再次进行降噪预处理后进行训练学习。

其中,考虑到选用相关设备在进行抓取声波特征信息时,所抓取的声波里面一般均有噪声的存在,基本不会存在纯音色,故此本发明选择在输入声波特征信息后预先进行降噪预处理,优先将噪声处理掉,得到尽可能纯净的目标声波。

如下为进行降噪预处理的具体步骤:

步骤一:使用加速度传感器分别收集高信噪比和低信噪比的声波振动信号,其中高信噪比的声波振动信号为参考信号;

步骤二:对低信噪比的振动信号进行短时傅里叶变换;

步骤三:进行预白化操作,得到预白化之后的时间-频率-振幅三维振动图像;

①求出时间-频率-振幅的三维振动图像对应矩阵的协方差矩阵,

计算样本的协方差;

②对协方差矩阵进行白化运算,求出白化矩阵;

③通过白化矩阵对短时傅立叶变换得到的时间-频率-振幅三维振动图像进行白化,得到预白化之后的振动信号;

步骤四:对预白化之后的三维振动图像进行逆短时傅里叶变换,得到预白化之后振动信号所对应的时域振动图像;

步骤五:对预白化之后的振动图像进行降噪处理,得到降噪之后的振动信号,将预白化并降噪处理过的振动信号与高信噪比的参考信号进行对比,分析预白化之后的降噪效果,从而进一步进行信号检测与故障诊断。

如下表1所述,为采用预处理与不采用预处理对于声波的原始还原度的比

对表:

表1:目标声波原始还原度比对表

声波原始还原度(%)

不采用降噪预处理 74.66

采用降噪预处理 94.18

由上表1可明显看出,在输入声波特征信息后进行降噪预处理的重要性。

优选的,构建的神经网络模型为:

其中,G表示频率f输入式、D表示振幅p输入式、E表示相位φ输入式,

输出的V值表示训练学习输出值。

进一步的,选定训练参数具体值后,相对应获取一个训练学习标准阈值;当预处理的声波特征信息训练学习输出值达到训练学习标准阈值时,定义预处理的声波特征信息达标。

其中,选定训练参数具体值后,通过以下公式相对应获取一个训练学习标准阈值Y:

一般选取环境分贝为20db环境下频率为55HZ、振幅为45°的声音作为训练参数具体值进行输入。

更进一步的,通过以下公式获取理论音频θ:

其中,f为频率、p为振幅、φ为相位、T为周期、λ为波长、θ为理论音频。

其中,在将理论音频进行环境匹配时,环境信息包括探测空间的大小S以及区域空气流速的大小L。本发明采用的毫米波雷达及流速传感器进行相应信息的采集。

需要说明的是:考虑到毫米波的短波长特性使得其雷达具有以下优点:一是能够对空间中小尺寸目标或目标细节进行有效的探测与识别;二是毫米波元件的封装体积小、结构紧凑、重量轻,能够满足系统对雷达体积、重量的要求;三是毫米波天线产生的波束窄,测角精度高。故此,采用毫米波雷达用来探测空间的大小。

具体的,流速传感器采用LaserFlow&trade非接触式流速传感器。

优选的,通过以下公式获取环境音频ρ:

其中,f为频率、θ为理论音频、T为周期、λ为波长、S为探测空间的大小、L为区域空气流速的大小、ρ为环境音频。

由下表2所示,为采用本发明与采用现有技术(进行传统公式的统一修正,不考虑具体的环境,亦不考虑具体目标声波的区别特征)在音色调整的优质度上的对比:

表2:本发明与现有技术在音色调整的优质度上的对比表

不同声音调整后的区别度(%) 相比于原有声音的区别度(%) 调整后的音质效果

现有技术 12.33 47.201 64.12%标准音质、35.88%低于标准音质

本发明 63.289 77.69 94.66%高音质、5.34%标准音质

由上表2可以看出,由于考虑到众多不同的实际情况,采用不同的声音在采用本发明调整后与原来的声音区别度以及相比较于原有声音的区别度均明显高于现有技术,调整后的音质效果也明显高于现有技术。

通过本发明提供的修正广播音色的方法及系统,获取相应音波特征信息后通过修正模块先一步进行理论修正,再次通过匹配环境信息进一步进行音色的环境化,进一步提高了音色调整的优质度,解决了现有的用于调整音色的设备和方法均未考虑众多影响音色的因素,调整的结果比较片面和主观的问题。

实施例2

请参阅图2,为本发明提供的修正广播音色的系统的第一个实施例:一种修正广播音色的系统,包括:

抓取分析模块100,用于抓取并分析声波特征信息;

输入模块200,与抓取分析模块100连接,用于输入声波特征信息;

修正模块300,与输入模块200连接,用于对声波特征信息进行修正,获取理论音频θ;

匹配模块400,与修正模块300连接,接收理论音频θ,并匹配相应环境信息,获取环境音频ρ;

中控模块500,与匹配模块400连接,提取环境音频ρ并进行广播。

进一步的,修正模块300包括:

预处理单元,用于对输入的声波特征信息进行降噪预处理;

构建单元,用于构建神经网络模型,并通过构建的神经网络模型进行训练学习;

计算单元,用于计算训练参数相匹配的训练学习标准阈值以及计算理论音频θ;

判断单元,用于判断预处理的声波特征信息是否达标。

更进一步的,匹配模块400包括:

接收单元,用于接收理论音频θ;

获取单元,用于获取环境信息,以及通过环境信息获取环境音频ρ。

应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机系统通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。

此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机系统的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。

进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。

如在本申请所使用的,术语“组件”、“模块”、“系统”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地系统、分布式系统中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它系统进行交互)的信号,以本地和/或远程过程的方式进行通信。

应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

技术分类

06120114707805