掌桥专利:专业的专利平台
掌桥专利
首页

一种多媒体音视频数据管理系统

文献发布时间:2024-07-23 01:35:21


一种多媒体音视频数据管理系统

技术领域

本发明涉及数据处理技术领域,具体涉及一种多媒体音视频数据管理系统。

背景技术

多媒体音视频数据的生成和传输过程会引入噪声,对多媒体音视频数据的质量产生影响,所以,对多媒体音视频数据进行去噪是多媒体音视频数据预处理过程中非常重要的一环。对多媒体音视频数据进行去噪不仅能够提高多媒体音视频的主观视听质量,还有利于后续对多媒体音视频数据进行压缩、编码、传输和存储处理。

SG多项式滤波算法结构简单,运算方便,对高斯噪声、瑞利噪声等不同类型的噪声均有较好的抑制性能,所以,一般采用SG多项式滤波算法实现对多媒体音视频数据的去噪。但是,在使用SG多项式滤波算法对多媒体音视频数据进行去噪的过程中,受到固定窗口尺寸和多项式阶数选择的限制,不合理的窗口尺寸取值和多项式阶数取值会导致多媒体音视频数据中的细节被破坏,或者导致部分多媒体音视频数据出现过拟合现象,使去噪效果下降。

发明内容

本发明提供一种多媒体音视频数据管理系统,以解决去噪算法参数选择不合理导致的多媒体音视频数据的数据去噪效果下降的问题,所采用的技术方案具体如下:

本发明一个实施例提供了一种多媒体音视频数据管理系统,该系统包括以下模块:

数据采集模块,用于读取多媒体流数据并进行划分,获取多媒体流数据序列和多媒体流相关序列;

相似性评价模块,用于根据多媒体流数据序列和多媒体流相关序列对应的频率幅值之间差异情况,结合多媒体流数据序列与每个多媒体流相关序列之间的特征相似情况,获取多媒体流数据序列的流数据相似度;

波动程度分析模块,用于设置窗口尺寸初始值和多项式阶数初始值,根据多媒体流数据序列中的多媒体流数据的平滑差异对比,获取多媒体流数据的平滑距离,根据多媒体流数据对应的幅值,获取多媒体流数据的滤波波动指数;

参数确定及去噪模块,用于根据滤波波动指数获多媒体流数据的第一滤波特征值,根据窗口尺寸初始值、多媒体流数据的第一滤波特征值和多媒体流数据的前一个多媒体流数据的窗口尺寸,确定多媒体流数据窗口尺寸,根据多项式阶数初始值、滤波波动指数和多媒体流数据的前一个多媒体流数据的多项式阶数,确定多媒体流数据多项式阶数,根据多媒体流数据窗口尺寸和多媒体流数据多项式阶数确定SG多项式滤波算法的参数取值,对多媒体流数据进行去噪,获取去噪后的多媒体流数据。

进一步,所述根据多媒体流数据序列和多媒体流相关序列对应的频率幅值之间差异情况,结合多媒体流数据序列与每个多媒体流相关序列之间的特征相似情况,获取多媒体流数据序列的流数据相似度的获取方法为:

根据多媒体流数据序列和多媒体流相关序列对应的频率幅值之间差异情况,获取多媒体流频率相关序列的第一幅值差异特征值;

根据多媒体流数据序列与每个多媒体流相关序列之间的特征相似情况,获取多媒体流数据序列的序列特征相似度;

根据第一幅值差异特征值以及序列特征相似度,获取多媒体流数据序列的流数据相似度,所述流数据相似度与所述第一幅值差异特征值呈负相关关系,与所述序列特征相似度呈正相关关系。

进一步,多媒体流频率相关序列的第一幅值差异特征值与序列特征相似度的获取方法为:

分别获取多媒体流数据序列和多媒体流相关序列中每个多媒体流数据对应的频率的幅值,将多媒体流数据对应的频率的幅值按照多媒体流数据在多媒体流数据序列和多媒体流相关序列中的顺序分别进行排列,获取多媒体流频率序列和多媒体流频率相关序列;

将多媒体流频率序列和多媒体流频率相关序列中对应位置的幅值的差值的平方和,记为多媒体流频率相关序列的第一幅值差异特征值;

将多媒体流数据序列的方差、偏度和峰度依次排列为的列向量记为多媒体流数据序列的数据特征向量,将多媒体流相关序列的方差、偏度和峰度依次排列为的列向量记为多媒体流相关序列的数据特征向量;将多媒体流数据序列和多媒体流相关序列的数据特征向量的相似度记为多媒体流相关序列的第一向量相似度,将所有多媒体流相关序列的第一向量相似度的和记为多媒体流数据序列的序列特征相似度;

根据第一幅值差异特征值以及序列特征相似度,获取多媒体流数据序列的流数据相似度,所述流数据相似度与所述第一幅值差异特征值呈负相关关系,与所述序列特征相似度呈正相关关系。

进一步,所述根据多媒体流数据序列中的多媒体流数据的平滑差异对比,获取多媒体流数据的平滑距离,根据多媒体流数据对应的幅值,获取多媒体流数据的滤波波动指数的方法为:

将多媒体流数据作为中心数据,建立长度为第二预设阈值的流数据参考序列;

对多媒体流数据的流数据参考序列进行平滑处理,获取多媒体流数据的流数据平滑序列,将多媒体流数据的流数据参考序列和流数据平滑序列的序列距离记为多媒体流数据的平滑距离;

根据多媒体流数据对应的幅值,获取多媒体流数据的第二幅值特征值;

根据多媒体流数据所在的多媒体流数据序列的流数据相似度、多媒体流数据的平滑距离和第二幅值特征值,获取多媒体流数据的滤波波动指数,所述多媒体流数据的滤波波动指数分别与多媒体流数据所在的多媒体流数据序列的流数据相似度、多媒体流数据的平滑距离和第二幅值特征值呈正相关关系。

进一步,所述根据多媒体流数据对应的幅值,获取多媒体流数据的第二幅值特征值的方法为:

将多媒体流数据对应的幅值与预设的频率调节因子的和记为第一幅值特征值,将多媒体流数据在多媒体流相关序列中对应的数据的幅值与预设的频率调节因子的和记为第一幅值系数,将第一幅值特征值与第一幅值系数的比值的归一化值记为多媒体流数据与多媒体流相关序列的第一幅值比值,将多媒体流数据对应的所有第一幅值比值的和记为多媒体流数据的第二幅值特征值。

进一步,所述根据滤波波动指数获多媒体流数据的第一滤波特征值的方法为:

将多媒体流数据在多媒体流数据序列中的次序与多媒体流数据序列中包含的数值的比值,记为多媒体流数据的次序权值;

将多媒体流数据的滤波波动指数与次序权值的乘积,记为多媒体流数据的第一滤波特征值。

进一步,所述多媒体流数据窗口尺寸的获取方法为:

当多媒体流数据为所有多媒体流数据中的第一个多媒体流数据时,多媒体流数据窗口尺寸为窗口尺寸初始值;

当多媒体流数据不是所有多媒体流数据中的第一个多媒体流数据时,根据多媒体流数据的次序权值、多媒体流数据的滤波波动指数、以及多媒体流数据的前一个多媒体流数据的多项式阶数,获取多媒体流数据多项式阶数。

进一步,所述根据多媒体流数据的次序权值、多媒体流数据的滤波波动指数、以及多媒体流数据的前一个多媒体流数据的多项式阶数,获取多媒体流数据多项式阶数的获取方法为:

将以自然常数为底数,以多媒体流数据的次序权值为自变量的对数函数值的相反数,记为多媒体流数据的第三对数值;

根据多媒体流数据的第三对数值、多媒体流数据的滤波波动指数、以及多媒体流数据的前一个多媒体流数据的多项式阶数,获取多媒体流数据多项式阶数。

进一步,所述根据多媒体流数据的第三对数值、多媒体流数据的滤波波动指数、以及多媒体流数据的前一个多媒体流数据的多项式阶数,获取多媒体流数据多项式阶数的获取方法为:

将多媒体流数据的第三对数值、多媒体流数据的滤波波动指数、以及多媒体流数据的前一个多媒体流数据的多项式阶数的乘积,记为多媒体流数据的第三乘积;

将多媒体流数据序列中多媒体流数据之前的所有多媒体流数据的第三乘积的和的取整值记为多媒体流数据多项式阶数。

进一步,所述根据多媒体流数据窗口尺寸和多媒体流数据多项式阶数确定SG多项式滤波算法的参数取值的方法为:

将多媒体流数据的多媒体流数据窗口尺寸和多媒体流数据多项式阶数分别作为SG多项式滤波算法中窗口尺寸和多项式阶数这两个参数的取值。

本发明的有益效果是:

本发明首先将多媒体流数据划分为多媒体流数据序列,并获取多媒体流数据序列相邻的多媒体流数据序列,即多媒体流相关序列,根据在多媒体流数据中相邻的多媒体流数据具有较强的相似性且在频域中表现更为明显的特征,在频域分析多媒体流数据之间的相似性,获取多媒体流数据序列的流数据相似度;然后,考虑到波动程度不同的多媒体流数据需要设置不同的窗口尺寸和多项式阶数,建立第一流数据的流数据参考序列,从更为微观的角度更为细致地分析第一流数据的局部细节信息,在流数据相似度的基础上评价多媒体流数据序列中包含的多媒体流数据的波动程度,获取第一流数据的滤波波动指数;进一步的,设置窗口尺寸初始值和多项式阶数初始值,结合多媒体流数据的滤波波动指数确定第一流数据窗口尺寸和第一流数据多项式阶数;最后将多媒体流数据的第一流数据窗口尺寸和第一流数据多项式阶数分别作为SG多项式滤波算法中窗口尺寸和多项式阶数这两个参数的取值,使用SG多项式滤波算法对多媒体流数据进行去噪,获取去噪后的多媒体流数据,解决去噪算法参数选择不合理导致的多媒体音视频数据的数据去噪效果下降的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一个实施例所提供的一种多媒体音视频数据管理系统的流程示意图;

图2为本发明一个实施例所提供的第一幅值差异特征值获取流程图;

图3为本发明一个实施例所提供的流数据相似度获取流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,其示出了本发明一个实施例提供的一种多媒体音视频数据管理系统流程图,该系统包括:数据采集模块、相似性评价模块、波动程度分析模块、参数确定及去噪模块。

数据采集模块,读取多媒体流数据并进行划分,获取多媒体流数据序列和多媒体流相关序列。

读取多媒体文件的多媒体流数据,将多媒体流数据划分为长度为第一预设阈值N的多媒体流数据序列。

为了达到更好的去噪效果,对每个多媒体流数据序列分别进行分析。将多媒体流数据序列之前的相邻L个多媒体流数据序列记为多媒体流相关序列。

将多媒体流相关序列中的多媒体流数据记为多媒体流相关数据。其中,本实施例对第一预设阈值N的取值为500,对L的取值为5,第一预设阈值N和L的取值目的为便于后续分析,实施者也可根据实际需要对第一预设阈值N和L进行取值,本申请不做限制。

当多媒体流数据中无法划分出足够的多媒体流相关序列和多媒体流数据序列时,使用线性插值方法对缺失数值进行补全。其中,使用线性插值方法对缺失数值进行补全为公知技术,不再赘述,实施者也可根据实际需要选择其他的数据补全方法,本申请不做限制。

至此,获取多媒体流数据序列和多媒体流相关序列。

相似性评价模块,根据多媒体流数据序列和多媒体流相关序列,获取多媒体流频率相关序列的第一幅值差异特征值,计算多媒体流数据序列的序列特征相似度,进而获取多媒体流数据序列的流数据相似度。

在多媒体流数据中,相邻的多媒体流数据具有较强的相似性,而且,多媒体流数据的相似性在频域中更为明显。为了更准确地评价多媒体流数据的相似性,对多媒体流数据序列和多媒体流相关序列分别进行离散余弦变换,获取多媒体流数据序列和多媒体流相关序列中每个多媒体流数据对应的频率的幅值,将多媒体流数据对应的频率的幅值按照多媒体流数据在多媒体流数据序列和多媒体流相关序列中的顺序分别进行排列,获取多媒体流频率序列和多媒体流频率相关序列。

其中,使用离散余弦变换获取多媒体流数据对应的频率的幅值为公知技术,不再赘述。

将多媒体流频率序列和多媒体流频率相关序列中对应位置的幅值的差值的平方和,记为多媒体流频率相关序列的第一幅值差异特征值。第一幅值差异特征值获取流程图如图2所示。

将多媒体流数据序列的方差、偏度和峰度依次排列为的列向量记为多媒体流数据序列的数据特征向量,将多媒体流相关序列的方差、偏度和峰度依次排列为的列向量记为多媒体流相关序列的数据特征向量,将多媒体流数据序列和多媒体流相关序列的数据特征向量的相似度记为多媒体流相关序列的第一向量相似度,将所有多媒体流相关序列的第一向量相似度的和记为多媒体流数据序列的序列特征相似度。

其中,本实施例使用余弦相似度作为数据特征向量的相似度度量,实施者也可以根据具体需求选择其他相似度度量方法,计算两个向量的余弦相似度为公知技术,不再赘述。

多媒体流数据序列和多媒体流相关序列的数据特征向量间的相似性越大时,多媒体流数据序列的序列特征相似度越大,即多媒体流数据序列和多媒体流相关序列的序列相关性越显著,对后续窗口尺寸取值和多项式阶数取值的影响越大。

根据多媒体流频率相关序列的第一幅值差异特征值以及多媒体流数据序列的序列特征相似度,获取多媒体流数据序列的流数据相似度。所述流数据相似度与所述第一幅值差异特征值呈负相关关系,与所述序列特征相似度呈正相关关系。

可以理解的是,本申请正相关关系与负相关关系是指自变量和因变量之间的关系,正相关关系为自变量随着因变量的增大(减小)而增大(减小),可以为相加关系、相乘关系等;负相关关系为自变量随着因变量的增大(减小)而减小(增大),可以是反比关系、相减关系等。

优选的,作为本申请的一个实施例,将以自然常数为底数,以多媒体流频率相关序列的第一幅值差异特征值的相反数为指数的幂,记为多媒体流频率相关序列的第一幂值,将多媒体流频率相关序列与当前时刻的多媒体流数据序列之间间隔的多媒体流频率相关序列数量记为第一数量,将第一数量与数字1的和的平方记为多媒体流频率相关序列的第一平方,将多媒体流频率相关序列的第一幂值与第一平方的比值,记为多媒体流频率相关序列的第一比值,所述多媒体流数据序列的流数据相似度为所述序列特征相似度与所述第一比值的乘积。

为了更准确地对多媒体流频率相关序列与多媒体流数据序列之间的相关性进行评价,设置多媒体流频率相关序列的第一平方,使与多媒体流数据序列更为接近的多媒体流频率相关序列对序列间相似性评价的影响更大,提高后续窗口尺寸取值和多项式阶数取值的准确性。

至此,获取多媒体流数据序列的流数据相似度。

波动程度分析模块,设置窗口尺寸初始值和多项式阶数初始值,根据多媒体流数据序列定义第一流数据,计算第一流数据的平滑距离,获取第一流数据的第二幅值特征值,进而获取第一流数据的滤波波动指数。

设置窗口尺寸初始值和多项式阶数初始值,本实施例对窗口尺寸初始值的取值为15,对多项式阶数初始值的取值为3。实施者也可根据实际需求设置窗口尺寸初始值和多项式阶数初始值,本发明不做限制。

当多媒体流数据序列中包含的多媒体流数据的波动程度不同时,需要设置不同的窗口尺寸和多项式阶数,因此,需要评价多媒体流数据序列中包含的多媒体流数据的波动程度。

将多媒体流数据序列中每个多媒体流数据分别作为中心数据,以W为长度建立中心数据的流数据参考序列。

本实施例对第二预设阈值W的取值为15,实施者也可根据实际需要对第二预设阈值W进行取值,本申请不做限制。当对多媒体流数据建立流数据参考序列时多媒体流数据的数量不足时,使用线性插值方法对不足的数值进行补全。其中,使用线性插值方法对缺失的数值进行补全为公知技术,不再赘述,实施者也可根据实际需要选择其他的数据补全方法,本申请不做限制。

分别对多媒体流数据序列中包含的所有多媒体流数据进行分析,将所分析的多媒体流数据记为第一流数据。

设置第一流数据的流数据参考序列的目的为:可以更为细致地分析第一流数据的局部细节信息。

使用指数滑动平均算法对第一流数据的流数据参考序列进行平滑处理,获取第一流数据的流数据平滑序列,使用DTW动态时间规整算法计算第一流数据的流数据参考序列和流数据平滑序列的dtw距离,将第一流数据的流数据参考序列和流数据平滑序列的dtw距离,记为第一流数据的平滑距离。

其中,使用指数滑动平均算法对序列进行平滑处理为公知技术,不再赘述,实施者也可以根据实际需要选择其他的序列平滑处理方法,本发明不做限制;使用DTW动态时间规整算法计算序列之间的距离为公知技术,不再赘述,实施者也可以根据实际需要选择其他的序列距离评价方法,本发明不做限制。

将第一流数据对应的幅值与频率调节因子的和记为第一幅值特征值,将第一流数据在多媒体流相关序列中对应的数据的幅值与频率调节因子的和记为第一幅值系数,将第一幅值特征值与第一幅值系数的比值的归一化值记为第一流数据与多媒体流相关序列的第一幅值比值,将第一流数据对应的所有第一幅值比值的和记为第一流数据的第二幅值特征值。

其中,本实施例对频率调节因子的取值为0.01,实施者也可以根据具体需求设置频率调节因子的取值,频率调节因子的作用为防止分母为0使分式无意义。

根据第一流数据所在的多媒体流数据序列的流数据相似度、第一流数据的平滑距离和第二幅值特征值,获取第一流数据的滤波波动指数。所述第一流数据的滤波波动指数分别与第一流数据所在的多媒体流数据序列的流数据相似度、第一流数据的平滑距离和第二幅值特征值呈正相关关系。

优选的,作为本申请的一个实施例,所述第一流数据的滤波波动指数为第一流数据所在的多媒体流数据序列的流数据相似度、第一流数据的平滑距离和第二幅值特征值的乘积的归一化值。

流数据相似度获取流程图如图3所示。

当第一流数据对应的幅值相比于第一流数据在多媒体流相关序列中对应的数据的幅值越大时,第一流数据所在的多媒体流数据序列的细节信息变化越为明显,此时,第一流数据的滤波波动指数越大,应该选择越小的窗口尺寸和越大的多项式阶数,使受到窗口尺寸和多项式阶数影响较大的高频信息更容易被筛选出来。

当第一流数据的平滑距离越大时,第一流数据所在的多媒体流数据序列的细节信息变化越为明显,此时,第一流数据的滤波波动指数越大。

当第一流数据所在的多媒体流数据序列的流数据相似度越大时,多媒体流数据序列和多媒体流相关序列之间的相似程度越大,前时刻的多媒体流数据序列本身的规律性细节信息越为明显,应该选择越小的窗口尺寸和越大的多项式阶数,使受到窗口尺寸和多项式阶数影响较大的高频信息更容易被筛选出来,此时,第一流数据的滤波波动指数越大。

至此,获取第一流数据的滤波波动指数。

参数确定及去噪模块,根据滤波波动指数获取第一流数据的第一滤波特征值,根据窗口尺寸初始值、第一流数据的第一滤波特征值和第一流数据的前一个多媒体流数据的窗口尺寸,确定第一流数据窗口尺寸,计算第一流数据的滤波波动指数,根据多项式阶数初始值、第一流数据的滤波波动指数和第一流数据的前一个多媒体流数据的多项式阶数,确定第一流数据多项式阶数,根据第一流数据窗口尺寸和第一流数据多项式阶数确定去噪算法的参数取值,对多媒体流数据进行去噪,获取去噪后的多媒体流数据。

将第一流数据在多媒体流数据序列中的次序与多媒体流数据序列中包含的数值的比值,记为第一流数据的次序权值,将第一流数据的滤波波动指数与次序权值的乘积,记为第一流数据的第一滤波特征值。

根据第一流数据的第一滤波特征值和第一流数据的前一个多媒体流数据的窗口尺寸,确定第一流数据窗口尺寸,其中,当第一流数据为所有多媒体流数据中的第一个多媒体流数据时,第一流数据窗口尺寸为窗口尺寸初始值。所述第一流数据窗口尺寸与所述第一流数据的第一滤波特征值呈负相关关系,与第一流数据的前一个多媒体流数据的窗口尺寸呈正相关关系。

优选的,作为本申请的一个实施例,将以自然常数为底数,以第一流数据的第一滤波特征值为自变量的对数函数值,记为第一流数据的第一对数值,将第一流数据的第一对数值的相反数记为第一流数据的第二对数值,将第一流数据的第二对数值与第一流数据的前一个多媒体流数据的窗口尺寸的乘积记为第一流数据的第二乘积,所述第一流数据窗口尺寸为多媒体流数据序列中第一流数据之前的所有多媒体流数据的第二乘积的和的取整值。

本实施例选取最大最小值归一化方法作为获取滤波波动指数的归一化值的计算方法,实施者也可以根据具体需求选择其他的归一化方法,本申请不做限制。

根据第一流数据的滤波波动指数和第一流数据的前一个多媒体流数据的多项式阶数,确定第一流数据多项式阶数。其中,当第一流数据为所有多媒体流数据中的第一个多媒体流数据时,第一流数据多项式阶数为多项式阶数初始值。所述第一流数据多项式阶数分别与所述第一流数据的滤波波动指数和第一流数据的前一个多媒体流数据的多项式阶数呈正相关关系。

优选的,作为本申请的一个实施例,将以自然常数为底数,以第一流数据的次序权值为自变量的对数函数值的相反数,记为第一流数据的第三对数值,将第一流数据的第三对数值、第一流数据的滤波波动指数、以及第一流数据的前一个多媒体流数据的多项式阶数的乘积,记为第一流数据的第三乘积,所述第一流数据多项式阶数为多媒体流数据序列中第一流数据之前的所有多媒体流数据的第三乘积的和的取整值。

至此,获取第一流数据窗口尺寸和第一流数据多项式阶数。

将多媒体流数据的第一流数据窗口尺寸和第一流数据多项式阶数分别作为SG多项式滤波算法中窗口尺寸和多项式阶数这两个参数的取值,使用SG多项式滤波算法对多媒体流数据进行去噪,获取去噪后的多媒体流数据。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种多媒体音视频数据同步计算方法
  • 一种基于大数据的移动多媒体广告智能推送管理系统
技术分类

06120116679664