掌桥专利:专业的专利平台
掌桥专利
首页

应用于网络摄像头的视频编码方法、计算机可读介质、电子设备

文献发布时间:2023-06-19 19:33:46


应用于网络摄像头的视频编码方法、计算机可读介质、电子设备

技术领域

本发明属于视频图像处理技术领域,具体涉及应用于网络摄像头的视频编码方法、计算机可读介质、电子设备。

背景技术

随着社会迅速发展,人工智能技术快速普及,近几年视频监控市场的发生爆炸式的增长,摄像头应用领域不断多元化,尤其是高清智能摄像头部署场景变得越来越普遍。

随着摄像头变得越来越高清,图像质量越来越好,给网络传输带宽、服务器存储空间造成极大的压力;普遍的安防监控场景下通常是长时间内画面都没有发生变化,由于没有针对不同场景做视频图像处理,所以,在长时间的监控下静止的画面也往往产生巨大量的视频数据量,造成存储空间的浪费;由于静止画面不代表画面简单,所以,视频码率有可能存在比较高的水位,这就需要良好的网络带宽才能保证视频传输质量,给网络带宽造成巨大压力。

目前对于网络摄像头而言,一般使用芯片厂商提供的编码码率控制方式,针对监控业务场景进行调试,固定一套码率控制参数,例如,常见的方式使用VBR模式,即动态码率模式,其作用是在静态画面时降低码率,动态画面时提高码率,这种模式只能安装设定的方式进行调整,而且因为参数固定,摄像头并不能在每种监控场景都达到理想的效果。

发明内容

有鉴于此,一方面,一些实施例公开了应用于网络摄像头的视频编码方法,包括:

获取网络摄像头拍摄的编码后的每一帧视频信息,确定视频信息的时域运动复杂度、帧残差比特数和单帧比特数;

统计单位时间内的网络摄像头视频的视频码率;

根据时域运动复杂度,确定网络摄像头画面的运动状态;

根据网络摄像头画面的运动状态,调整编码策略和/或视频码率,与画面的运动状态相适配。

进一步,一些实施例公开的应用于网络摄像头的视频编码方法,若时域运动复杂度等于零,且帧残差比特数不大于500,则确定网络摄像头画面为绝对静止状态,此时,编码量化参数QP最大值设为48,设定帧间P帧编码成skip帧,设定帧内宏块编码skip策略,视频码低于100kbps。

一些实施例公开的应用于网络摄像头的视频编码方法,若时域运动复杂度等于零,且帧残差比特数大于500,则确定网络摄像头画面为静止状态,此时,编码量化参数QP最大值设为48,设定帧内宏块编码skip策略,视频码率低于200kbps。

一些实施例公开的应用于网络摄像头的视频编码方法,若时域运动复杂度在1~10之间,则确定网络摄像头画面为平稳状态,编码量化参数QP最大值设为44,设定帧内宏块编码skip策略。

一些实施例公开的应用于网络摄像头的视频编码方法,若时域运动复杂度大于10,则确定网络摄像头画面为运动状态,编码量化参数QP最大值设为44。

一些实施例公开的应用于网络摄像头的视频编码方法,若网络摄像头的画面为运动状态,进一步,若视频码率小于最大视频码率,不做任何处理;若视频码率大于最大视频码率,逐步增大编码量化参数QP最大值,直至视频码率小于最大视频码率。

一些实施例公开的应用于网络摄像头的视频编码方法,还包括:

获取调整视频码率后网络摄像头拍摄的编码后的每一帧视频信息,确定视频信息的时域运动复杂度、帧残差比特数和单帧比特数;

统计单位时间内的网络摄像头视频的视频码率;

根据时域运动复杂度,确定网络摄像头画面的运动状态;

根据网络摄像头画面的运动状态,调整编码策略和/或视频码率,与画面的运动状态相适配。

另一方面,一些实施例公开了计算机可读介质,该计算机可读介质上存储有计算机程序,当计算机程序被执行时实现应用于网络摄像头的视频编码方法。

再一方面,一些实施例公开了电子设备,包括:

一个或多个处理器;

存储装置,其上存储有一个或多个程序;

当一个或多个程序被一个或多个处理器执行时,实现应用于网络摄像头的视频编码方法。

本发明实施例公开的应用于网络摄像头的视频编码方法,利用帧间预测编码技术,通过帧间运动矢量的变化特点,将网络摄像头的画面确定为不同的运动状态,进而根据不同运动状态设定编码量化参数和视频码率,实现了网络摄像头画面的自适应编码,提高了视频传输质量,节省了存储空间。

附图说明

图1一些实施例公开的应用于网络摄像头的视频编码方法流程示意图。

具体实施方式

在这里专用的词“实施例”,作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。本发明实施例中性能指标测试,除非特别说明,采用本领域常规试验方法。应理解,本发明实施例中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明实施例公开的内容。

除非另有说明,否则本文使用的技术和科学术语具有本发明实施例所属技术领域的普通技术人员通常理解的相同含义;作为本发明实施例中其它未特别注明的试验方法和技术手段均指本领域内普通技术人员通常采用的实验方法和技术手段。

本文所用的术语“基本”和“大约”用于描述小的波动。例如,它们可以是指小于或等于±5%,如小于或等于±2%,如小于或等于±1%,如小于或等于±0.5%,如小于或等于±0.2%,如小于或等于±0.1%,如小于或等于±0.05%。在本文中以范围格式表示或呈现的数值数据,仅为方便和简要起见使用,因此应灵活解释为不仅包括作为该范围的界限明确列举的数值,还包括该范围内包含的所有独立的数值或子范围。例如,“1~5%”的数值范围应被解释为不仅包括1%至5%的明确列举的值,还包括在所示范围内的独立值和子范围。因此,在这一数值范围中包括独立值,如2%、3.5%和4%,和子范围,如1%~3%、2%~4%和3%~5%等。这一原理同样适用于仅列举一个数值的范围。此外,无论该范围的宽度或所述特征如何,这样的解释都适用。

在本文中,包括权利要求书中,连接词,如“包含”、“包括”、“带有”、“具有”、“含有”、“涉及”、“容纳”等被理解为是开放性的,即是指“包括但不限于”。只有连接词“由……构成”和“由……组成”是封闭连接词。

为了更好的说明本发明内容,在下文的具体实施例中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在实施例中,对于本领域技术人员熟知的一些方法、手段、仪器、设备等未作详细描述,以便凸显本发明的主旨。

在不冲突的前提下,本发明实施例公开的技术特征可以任意组合,得到的技术方案属于本发明实施例公开的内容。

在一些实施方式中,如图1所示,应用于网络摄像头的视频编码方法包括:

获取网络摄像头拍摄的编码后的每一帧视频信息,确定视频信息的时域运动复杂度、帧残差比特数和单帧比特数;

统计单位时间内的网络摄像头视频的视频码率;通常,根据单位时间内网络摄像头视频数据流量进行码率统计;

根据时域运动复杂度,确定网络摄像头画面的运动状态;

根据网络摄像头画面的运动状态,将视频码率调整为与运动状态相适配的视频码率。

一些实施例中,若时域运动复杂度等于零,且帧残差比特数不大于500,则确定网络摄像头画面为绝对静止状态,此时,编码量化参数QP最大值设为48,设定帧间P帧编码成skip帧,设定帧内宏块编码skip策略,调整视频码率低于100kbps。

通常情况下,通过比对前后帧图像的纹理信息与宏块匹配残差计算出运动复杂度,实际测试中,时域运动复杂度值为0时,在多种测试环境下肉眼感官前后画面没有发生大面积变化,运动复杂度值为0时,可以认为画面处于一个平稳的状态,即绝对静止状态。帧残差比特数是帧内编码单元根据预测方式进行预测之后得到的与参考像素之间的差值,时域运动复杂度值低于500,对于画面是处于一个绝对静止的状态;实际测试中,时域运动复杂度值小于500时,肉眼感官几乎看不到画面有发生变化;即,绝对静止状态。

一般地,量化参数QP是量化步长Qstep的序号,量化是在不降低视觉效果的前提下减少图像编码长度、减少视觉恢复中不必要的信息,QP越大,质量越差,数据越小,当QP为51时为最大量化序号,编码产生的数据量是最小的;QP为48是在高密度场景如人流量大、车流量大等画面高复杂度的运用场景,在满足运营商网络传输要求的峰值码率上限条件下的最大值,以防止码率产生过冲。

视频码率可以在实际场景进行测试编码数据得到,对于绝对静止状态的画面,可以确定视频码率低于100kbps。

一些实施例中,若时域运动复杂度等于零,且帧残差比特数大于500,则确定网络摄像头画面为静止状态,此时,编码量化参数QP最大值设为48,设定帧内宏块编码skip策略,视频码率低于200kbps。视频码率可以通过对实际场景进行测试,对于静止状态的画面,可以确定视频码率低于200kbps。

一些实施例中,若时域运动复杂度在1~10之间,则确定网络摄像头画面为平稳状态,编码量化参数QP最大值设为44,设定帧内宏块编码skip策略。

一些实施例中,若时域运动复杂度大于10,则确定网络摄像头画面为运动状态,编码量化参数QP最大值设为44。

一些实施例中,若网络摄像头的画面为运动状态,进一步,若视频码率小于最大视频码率,不做任何处理;若视频码率大于最大视频码率,逐步增大编码量化参数QP最大值,直至视频码率小于最大视频码率。通常,可以为运动状态的画面设定一个最大视频码率,以满足视频清晰、传输质量高的要求,若实际视频码率小于最大视频码率,则保持实际视频码率,不做任何处理;若实际视频码率大于最大视频码率,则,逐步减小实际视频码率,以使实际视频码率小于或等于最大视频码率。通常最大视频码率可以根据网络运营商确定的网络传输能力,或者视频分辨率等等进行确定。

一些实施例公开的应用于网络摄像头的视频编码方法,还包括:

获取调整视频码率后网络摄像头拍摄的编码后的每一帧视频信息,确定视频信息的时域运动复杂度、帧残差比特数和单帧比特数;通常调整视频码率后,网络摄像头以调整后的视频码率为基础,进行拍摄,此时,进一步获取编码后的每一帧视频信息,确定视频信息的时域运动复杂度、帧残差比特数和单帧比特数,以便能再一次重复后续步骤,对视频码率进行进一步优化调整;

统计单位时间内的网络摄像头视频的视频码率;

根据时域运动复杂度,确定网络摄像头画面的运动状态;

根据网络摄像头画面的运动状态,将视频码率调整为与运动状态相适配的视频码率。

一些实施例中,应用于网络摄像头的视频编码方法包括:

帧间信息统计,获取网络摄像头拍摄的编码后的每一帧视频信息,确定视频信息的时域运动复杂度、帧残差比特数和单帧比特数;

统计单位时间内的网络摄像头视频的视频码率,进行码率统计;

根据时域运动复杂度划分画面状态,确定网络摄像头画面的运动状态;将摄像头的画面区分为绝对静止、静止、平稳或运动;

根据网络摄像头画面的状态,调整编码策略,进一步结合统计的视频码率,调整适宜的视频码率,与画面的运动状态相适配。

一些实施例公开了计算机可读介质,该计算机可读介质上存储有计算机程序,当计算机程序被执行时实现应用于网络摄像头的视频编码方法。

一般地,可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网或广域网—连接到用户计算机,或者,可以连接到外部计算机,例如利用因特网服务提供商来通过因特网连接。

一般地,实施例中公开的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质包括电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器、只读存储器、可擦式可编程只读存储器、光纤、便携式紧凑磁盘只读存储器、光存储器件、磁存储器件、或者上述的任意合适的组合。

一些实施例公开了电子设备,该电子设备包括:

一个或多个处理器;

存储装置,其上存储有一个或多个程序;

当一个或多个程序被一个或多个处理器执行时,实现应用于网络摄像头的视频编码方法。

一般地,电子设备可以包括处理装置,例如中央处理器、图形处理器等,可以根据存储在只读存储器中的程序或者从存储装置加载到随机访问存储器中的程序而执行各种适当的动作和处理。在存储器中,还存储有电子设备操作所需的各种程序和数据。

本发明实施例公开的应用于网络摄像头的视频编码方法,利用帧间预测编码技术,通过帧间运动矢量的变化特点,将网络摄像头的画面确定为不同的运动状态,进而根据不同运动状态设定编码量化参数和视频码率,实现了网络摄像头画面的自适应编码,提高了视频传输质量,节省了存储空间。

本发明实施例公开的技术方案和实施例中公开的技术细节,仅是示例性说明本发明的发明构思,并不构成对本发明实施例技术方案的限定,凡是对本发明实施例公开的技术细节所做的常规改变、替换或组合等,都与本发明具有相同的发明构思,都在本发明权利要求的保护范围之内。

技术分类

06120115953608