导航：首页> 电通信技术>视频处理方法、装置、计算机设备及存储介质

视频处理方法、装置、计算机设备及存储介质

文献发布时间：2023-06-19 11:27:38

技术领域

本申请涉及视频处理技术领域，特别涉及一种视频处理方法、装置、计算机设备及存储介质。

背景技术

随着视频处理技术的不断发展，视频的表现形式也越来越多样化。例如，当前存在一种画幅视频，画幅视频的表现形式为：视频帧的中间区域为视频的主体内容，视频的主体内容的上下或者左右两边的区域为背景内容。

当前，在对画幅视频进行编码后，画幅视频中的视频帧的码率较低，视频帧的清晰度较低，画质较差。

发明内容

本申请实施例提供了一种视频处理方法、装置、计算机设备及存储介质，能够提高视频中主体内容的清晰度，提升视频的主体内容的画质。所述技术方案如下：

根据本申请实施例的一方面，提供了一种视频处理方法，所述方法包括：

从视频的每个视频帧中，获取前景位置信息所指示的前景区域对应的前景图像，所述前景位置信息表示所述视频中的每个视频帧中的前景区域的位置；

对所获取的多个前景图像进行编码，得到前景视频；

获取所述视频的至少一个目标背景图像以及每个目标背景图像的显示时长，所述至少一个目标背景图像为所述视频的至少一个视频帧的背景区域对应的背景图像，所述背景区域为视频帧中除前景区域之外的区域；

基于所述前景位置信息、所述前景视频、所述至少一个目标背景图像和所述每个目标背景图像的显示时长，生成所述视频的编码信息。

在一种可能的实现方式中，所述获取所述视频的至少一个目标背景图像以及每个目标背景图像的显示时长，包括：

获取所述视频的每个视频帧中的背景区域对应的原始背景图像；

基于所获取的多个原始背景图像，确定所述至少一个目标背景图像，其中，每个目标背景图像对应至少一个原始背景图像，所述每个目标背景图像与对应的至少一个原始背景图像相同；

基于所述每个目标背景图像对应的至少一个原始背景图像所属的视频帧的显示时长，确定所述每个目标背景图像的显示时长。

在另一种可能的实现方式中，所述基于所获取的多个原始背景图像，确定所述至少一个目标背景图像，包括：

响应于所述多个原始背景图像均相同，对所述多个原始背景图像进行去重处理，将剩余的一个原始背景图像确定为所述目标背景图像。

在另一种可能的实现方式中，所述获取所述视频的每个视频帧中的背景区域对应的原始背景图像，包括：

按照所述视频的多个视频帧的排列顺序，依次获取每个视频帧中的背景区域对应的原始背景图像。

在另一种可能的实现方式中，所述基于所获取的多个原始背景图像，确定所述至少一个目标背景图像，包括：

响应于所述多个原始背景图像包括相同的多组原始背景图像，将所述多组原始背景图像中的任一组原始背景图像确定为所述目标背景图像；或者，

响应于所述多个原始背景图像包括相同的多组原始背景图像，对所述多组原始背景图像中的任一组原始背景图像所包括的连续且相同的多个原始背景图像进行去重处理，将所述任一组原始背景图像中剩余的原始背景图像确定为所述目标背景图像。

在另一种可能的实现方式中，所述基于所获取的多个原始背景图像，确定所述至少一个目标背景图像，包括：

响应于所述多个原始背景图像包括连续且相同的多个背景图像，对所述连续且相同的多个背景图像进行去重处理，将剩余的一个背景图像确定为所述目标背景图像。

在另一种可能的实现方式中，所述基于所获取的多个原始背景图像，确定所述至少一个目标背景图像，包括：

响应于所述多个原始背景图像包括与相邻的背景图像均不相同的背景图像，将所述与相邻的背景图像均不相同的背景图像确定为所述目标背景图像。

在另一种可能的实现方式中，所述基于所述每个目标背景图像对应的至少一个原始背景图像所属的视频帧的显示时长，确定所述每个目标背景图像的显示时长，包括：

响应于所述目标背景图像由相同的多个背景图像进行去重处理得到，将所述相同的多个背景图像所属的视频帧的显示时长的和值，确定为所述目标背景图像的显示时长。

响应于所述目标背景图像为所述多个原始背景图像中与相邻的背景图像均不相同的背景图像，将所述目标背景图像所属的视频帧的显示时长确定为所述目标背景图像的显示时长。

在另一种可能的实现方式中，所述获取所述视频的至少一个目标背景图像以及每个目标背景图像的显示时长，包括：

响应于所述视频的背景标签为第一标签，获取所述视频的任一视频帧中的背景区域对应的原始背景图像，所述第一标签用于表示所述视频的每个视频帧的背景区域均相同；

将获取到的一个原始背景图像确定为所述目标背景图像；

将所述视频的总时长，确定为所述目标背景图像的显示时长。

在另一种可能的实现方式中，所述获取所述视频的至少一个目标背景图像以及每个目标背景图像的显示时长，包括：

响应于所述视频的背景标签为第二标签，按照所述视频的多个视频帧的排列顺序，获取一个视频帧中的背景区域对应的原始背景图像，所述第二标签用于表示所述视频的多个视频帧对应的原始背景图像中包括相同的多组原始背景图像，且每组中的原始背景图像互不相同；

响应于本次获取到的原始背景图像与已确定的第一个目标背景图像不相同，将本次获取到的所述原始背景图像确定为目标背景图像，继续按照所述视频的多个视频帧的排列顺序，获取下一个视频帧中的背景区域对应的原始背景图像，直至获取到的原始背景图像与已确定的第一个目标背景图像相同；

对于已确定的多个目标背景图像中的每个目标背景图像，将所述目标背景图像所属的视频帧的显示时长，确定为所述目标背景图像的显示时长。

在另一种可能的实现方式中，所述从视频的每个视频帧中，获取前景位置信息所指示的前景区域对应的前景图像之前，所述方法还包括：

对所述视频的任一视频帧进行角点检测，得到所述视频帧的前景区域的多个边缘点的坐标；

将所述多个边缘点的坐标确定为所述前景位置信息。

在另一种可能的实现方式中，所述获取所述视频的每个视频帧中的背景区域对应的原始背景图像，包括：

将所述每个视频帧中所述前景位置信息所指示的前景区域变换为透明的状态，得到所述每个视频帧的背景区域对应的原始背景图像。

根据本申请实施例的另一方面，提供了一种视频处理方法，所述方法包括：

获取视频的编码信息，所述编码信息包括前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长；

对所述前景视频进行解码，在所述前景位置信息所指示的位置，显示解码得到的前景图像，以及，按照所述每个目标背景图像的显示时长，显示所述每个目标背景图像；

其中，所述前景位置信息表示所述视频中的每个视频帧中的前景区域的位置，所述前景区域包括视频帧中的主体内容，所述前景视频是对所述视频的视频帧中的前景区域对应的前景图像进行编码得到的，所述至少一个目标背景图像为所述视频的至少一个视频帧的背景区域对应的背景图像，所述背景区域为所述视频的视频帧中除前景区域之外的区域。

在一种可能的实现方式中，所述按照所述每个目标背景图像的显示时长，显示所述每个目标背景图像，包括：

响应于所述至少一个目标背景图像的显示时长的和值小于所述视频的总时长，按照每个目标背景图像的显示时长，循环显示所述至少一个目标背景图像。

根据本申请实施例的另一方面，提供了一种视频处理装置，所述装置包括：

前景图像获取模块，用于从视频的每个视频帧中，获取前景位置信息所指示的前景区域对应的前景图像，所述前景位置信息表示所述视频中的每个视频帧中的前景区域的位置；

前景视频编码模块，用于对所获取的多个前景图像进行编码，得到前景视频；

目标背景图像获取模块，用于获取所述视频的至少一个目标背景图像以及每个目标背景图像的显示时长，所述至少一个目标背景图像为所述视频的至少一个视频帧的背景区域对应的背景图像，所述背景区域为视频帧中除前景区域之外的区域；

编码信息生成模块，用于基于所述前景位置信息、所述前景视频、所述至少一个目标背景图像和所述每个目标背景图像的显示时长，生成所述视频的编码信息。

在一种可能的实现方式中，所述目标背景图像获取模块，包括：

原始背景图像获取单元，用于获取所述视频的每个视频帧中的背景区域对应的原始背景图像；

目标背景图像确定单元，用于基于所获取的多个原始背景图像，确定所述至少一个目标背景图像，其中，每个目标背景图像对应至少一个原始背景图像，所述每个目标背景图像与对应的至少一个原始背景图像相同；

显示时长确定单元，用于基于所述每个目标背景图像对应的至少一个原始背景图像所属的视频帧的显示时长，确定所述每个目标背景图像的显示时长。

在另一种可能的实现方式中，所述目标背景图像确定单元，用于响应于所述多个原始背景图像均相同，对所述多个原始背景图像进行去重处理，将剩余的一个原始背景图像确定为所述目标背景图像。

在另一种可能的实现方式中，所述原始背景图像获取单元，用于按照所述视频的多个视频帧的排列顺序，依次获取每个视频帧中的背景区域对应的原始背景图像。

在另一种可能的实现方式中，所述目标背景图像确定单元，用于响应于所述多个原始背景图像包括相同的多组原始背景图像，将所述多组原始背景图像中的任一组原始背景图像确定为所述目标背景图像；或者，

所述目标背景图像确定单元，用于响应于所述多个原始背景图像包括相同的多组原始背景图像，对所述多组原始背景图像中的任一组原始背景图像所包括的连续且相同的多个原始背景图像进行去重处理，将所述任一组原始背景图像中剩余的原始背景图像确定为所述目标背景图像。

在另一种可能的实现方式中，所述目标背景图像确定单元，用于响应于所述多个原始背景图像包括连续且相同的多个背景图像，对所述连续且相同的多个背景图像进行去重处理，将剩余的一个背景图像确定为所述目标背景图像。

在另一种可能的实现方式中，所述目标背景图像确定单元，用于响应于所述多个原始背景图像包括与相邻的背景图像均不相同的背景图像，将所述与相邻的背景图像均不相同的背景图像确定为所述目标背景图像。

在另一种可能的实现方式中，所述显示时长确定单元，用于响应于所述目标背景图像由相同的多个背景图像进行去重处理得到，将所述相同的多个背景图像所属的视频帧的显示时长的和值，确定为所述目标背景图像的显示时长。

在另一种可能的实现方式中，所述显示时长确定单元，用于响应于所述目标背景图像为所述多个原始背景图像中与相邻的背景图像均不相同的背景图像，将所述目标背景图像所属的视频帧的显示时长确定为所述目标背景图像的显示时长。

在另一种可能的实现方式中，所述目标背景图像获取模块，用于：

将获取到的一个原始背景图像确定为所述目标背景图像；

将所述视频的总时长，确定为所述目标背景图像的显示时长。

在另一种可能的实现方式中，所述目标背景图像获取模块，用于：

对于已确定的多个目标背景图像中的每个目标背景图像，将所述目标背景图像所属的视频帧的显示时长，确定为所述目标背景图像的显示时长。

在另一种可能的实现方式中，所述装置还包括：

角点检测模块，用于对所述视频的任一视频帧进行角点检测，得到所述视频帧的前景区域的多个边缘点的坐标；

前景位置信息确定模块，用于将所述多个边缘点的坐标确定为所述前景位置信息。

在另一种可能的实现方式中，所述原始背景图像获取单元，用于将所述每个视频帧中所述前景位置信息所指示的前景区域变换为透明的状态，得到所述每个视频帧的背景区域对应的原始背景图像。

根据本申请实施例的另一方面，提供了一种视频处理装置，所述装置包括：

编码信息获取模块，用于获取视频的编码信息，所述编码信息包括前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长；

前景图像显示模块，用于对所述前景视频进行解码，在所述前景位置信息所指示的位置，显示解码得到的前景图像；

目标背景图像显示模块，用于按照所述每个目标背景图像的显示时长，显示所述每个目标背景图像；

在一种可能的实现方式中，所述目标背景图像显示模块，用于响应于所述至少一个目标背景图像的显示时长的和值小于所述视频的总时长，按照每个目标背景图像的显示时长，循环显示所述至少一个目标背景图像。

根据本申请实施例的另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现上述任一种可能的实现方式中所述的视频处理方法。

根据本申请实施例的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现上述任一种可能的实现方式中所述的视频处理方法。

根据本申请实施例的另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述任一种可能的实现方式中所述的视频处理方法。

本申请实施例提供的技术方案，对视频的视频帧中的前景区域对应的前景图像进行单独编码，降低了视频编码的分辨率，在整体码率一定的情况下，提高了编码得到的前景视频中单位像素所占的码率，进而基于前景区域所在的位置、编码得到的前景视频、包括视频的次要内容的背景图像以及背景图像的显示时长，生成视频的编码信息，以通过该编码信息控制前景视频的显示位置以及背景图像的显示时长，使处理后的视频播放时能够呈现出与视频帧相同的显示效果，在确保视频保持原始显示效果的基础上，通过提高前景视频中单位像素的码率，实现了视频的主体内容的清晰度的提高，提升了视频的主体内容的画质。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种实施环境的示意图；

图2是本申请实施例提供的一种视频处理方法的流程图；

图3是本申请实施例提供的一种视频帧的示意图；

图4是本申请实施例提供的一种视频处理方法的流程图；

图5是本申请实施例提供的一种视频处理方法的流程图；

图6是本申请实施例提供的一种视频帧的示意图；

图7是本申请实施例提供的一种视频帧的示意图；

图8是本申请实施例提供的一种视频帧的示意图；

图9是本申请实施例提供的一种视频处理装置的框图；

图10是本申请实施例提供的一种视频处理装置的框图；

图11是本申请实施例提供的一种终端的框图；

图12是本申请实施例提供的一种服务器的框图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们的任意变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”，至少一个包括一个、两个或两个以上，多个包括两个或两个以上，而每个是指对应的多个中的每一个，任一是指多个中的任意一个。举例来说，多个视频帧包括3个视频帧，而每个是指这3个视频帧中的每一个视频帧，任一是指这3个视频帧中的任意一个，可以是第一个，可以是第二个、也可以是第三个。

图1是本申请实施例提供的一种实施环境的示意图。参见图1，该实施环境包括终端110和服务器120。

可选地，终端110为智能手机、平板电脑、笔记本电脑或者台式计算机，但并不局限于此。可选地，终端110上设有客户端，如视频客户端、社交客户端或者浏览器客户端等。

服务器120是为终端110提供视频服务的后台服务器。终端110与服务器120通过无线或者有线网络连接。终端110能够向服务器120上传视频，以通过服务器120将视频分享至其他终端，也能够从服务器120获取其他终端上传的视频，对获取到的视频进行播放。

图2是本申请实施例提供的一种视频处理方法的流程图。在本申请实施例中，以计算机设备为执行主体进行简要说明，参见图2，该实施例包括：

201、计算机设备从视频的每个视频帧中，获取前景位置信息所指示的前景区域对应的前景图像，对所获取的多个前景图像进行编码，得到前景视频，其中，前景位置信息表示视频中的每个视频帧中的前景区域的位置。

其中，视频包括由连续的多个图像构成的帧序列，一个视频帧为该帧序列中的一个图像。前景区域是指视频帧中用于显示视频的主体内容的区域。主体内容是视频帧中突出显示的内容。可选地，主体内容包括人像、物品、动物、景物、虚拟形象或者影视剧集画面等，但并不局限于此。例如，视频帧包括人像，该视频帧的前景区域为该人像所在的区域。前景图像是由从视频帧中截取到的前景区域生成的图像。例如，参见图3，视频帧包括前景区域301，从该视频帧中截取前景区域301，由截取到的前景区域301生成前景图像302。

另外，视频帧中除前景区域之外的其他区域为背景区域，背景区域用于显示视频的次要内容。可选地，次要内容包括不具有特定含义的内容，例如，次要内容包括不具有特定含义的纯色图像。或者，次要内容包括用于衬托主体内容的内容，例如，主体内容为人像，次要内容包括用于衬托人像的景物；再如，次要内容包括具有装饰作用的图像。或者，次要内容包括对主体内容进行注释的内容，例如，主要内容为影视剧集画面，次要内容包括对该影视剧集画面进行注释的文字内容。

若视频的视频帧能够分为用于显示视频的主体内容的前景区域和用于显示视频的次要内容的背景区域，则可以通过本申请提供的视频处理方法，将前景区域对应的前景图像单独进行编码，得到前景视频，以通过降低分辨率，在码率一定的情况下，提高前景视频的视频帧中单位像素所占的码率，从而提高视频的主体内容的清晰度，提升视频的主体内容的画质。

对于视频的每个视频帧，计算机设备根据前景位置信息，从视频帧中确定前景区域；截取该视频帧中的前景区域，得到该视频帧对应的前景图像。

需要说明的是，在一种可能的实现方式中，计算机设备被配置为终端，上述视频处理方法由终端来实施。可选地，终端上设有视频客户端，终端通过运行该视频客户端来实施上述视频处理方法。上述视频为存储在终端本地的视频，在执行上述步骤201之前，终端还响应于视频处理指令，从本地存储中获取该视频处理指令所指示的视频。可选地，上述视频是终端拍摄得到的视频、其他终端传输到终端的视频或者终端从服务器获取到的视频。可选地，上述视频是经过剪辑处理后的视频或者拍摄完成后未经过剪辑处理的原始视频，本申请对上述视频的来源和剪辑情况不加以限定。

在另一种可能的实现方式中，计算机设备被配置为服务器，上述视频处理方法由服务器来实施。可选地，上述视频为服务器接收到的终端上传的视频，服务器响应于接收到终端上传的视频，执行步骤201；或者，上述视频为存储在服务器对应的视频库中的视频，服务器在执行步骤201之前，还响应于视频处理指令，从视频库中获取未通过上述视频处理方法进行处理的视频。

202、计算机设备获取该视频的至少一个目标背景图像以及每个目标背景图像的显示时长，其中，至少一个目标背景图像为该视频的至少一个视频帧的背景区域对应的背景图像，背景区域为视频帧中除前景区域之外的区域。

除了对前景图像进行单独编码之外，计算机设备还从视频中提取目标背景图像，并且确定目标背景图像的显示时长，以使目标背景图像按照对应的显示时长与前景图像进行同步显示时，能够呈现出与视频帧相同的显示效果。

203、计算机设备基于前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长，生成视频的编码信息。

计算机设备基于前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长，生成视频的编码信息，从而计算机设备或者其他获取到编码信息的终端能够在前景位置信息所指示的位置显示前景视频，同时按照每个目标背景图像的显示时长，对目标背景图像进行显示，呈现出与视频的视频帧相同的显示效果。

图4是本申请实施例提供的一种视频处理方法的流程图。在本申请实施例中，以终端为执行主体进行简要说明，参见图4，该实施例包括：

401、终端获取视频的编码信息，该编码信息包括前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长。

其中，前景位置信息表示视频中的每个视频帧中的前景区域的位置，前景区域包括视频帧中的主体内容。前景视频是对视频的视频帧中的前景区域对应的前景图像进行编码得到的。至少一个目标背景图像为视频的至少一个视频帧的背景区域对应的背景图像，其中，背景区域为视频的视频帧中除前景区域之外的区域。

可选地，终端上设有视频客户端，终端通过运行该视频客户端来实施上述视频处理方法。可选地，终端显示视频播放界面，该视频播放界面包括视频的播放选项；终端响应于对该视频的播放选项的交互操作，获取该视频的编码信息。

可选地，若终端本地存储有该视频的编码信息，则终端从本地存储中获取该视频的编码信息；若终端本地未存储有该视频的编码信息，则终端从服务器获取该视频的编码信息。终端从服务器获取该视频的编码信息的过程包括：终端响应于对该视频的播放选项的交互操作，向服务器发送视频获取请求，该视频获取请求用于请求获取该视频的编码信息；服务器接收视频获取请求，根据该视频获取请求，获取该视频的编码信息，向终端返回该视频的编码信息；终端接收该视频的编码信息。

402、终端对前景视频进行解码，在前景位置信息所指示的位置，显示解码得到的前景图像。

终端对编码信息中的前景视频进行解码，按照前景视频的帧率，也即是按照前景视频的每个视频帧的显示时长，在编码信息中的前景位置信息所指示的位置，显示解码得到的前景图像。其中，前景视频的帧率与前景视频对应的原始的视频的帧率相同。

403、终端按照每个目标背景图像的显示时长，显示每个目标背景图像。

终端在显示前景视频的第一帧前景图像的同时，按照上述至少一个目标背景图像中第一个目标背景图像的显示时长，显示第一个目标背景图像，进一步地，终端按照前景视频的帧率，依次显示解码得到的前景图像，同时按照至少一个目标背景图像中的每个目标背景图像的显示时长，依次显示目标背景图像，以呈现与视频的视频帧相同的显示效果。

在本申请实施例中，由于视频的编码信息中的前景视频是对视频的视频帧中的前景区域对应的前景图像进行单独编码得到的，在整体码率一定的情况下，降低了视频编码的分辨率，提高了前景视频中单位像素所占的码率，进而按照编码信息中的前景位置信息所指示的位置对前景视频进行显示，以及按照背景图像的显示时长，对背景图像进行显示，使处理后的视频播放时能够呈现出与视频帧相同的显示效果，在确保视频保持原始显示效果的基础上，通过提高前景视频中单位像素的码率，实现了视频的主体内容的清晰度的提高，提升了视频的主体内容的画质。

图5是本申请实施例提供的一种视频处理方法的流程图。在本申请实施例中，以服务器生成视频的编码信息，终端从服务器获取视频的编码信息，基于编码信息对视频进行显示为例进行详细说明，参见图5，该实施例包括：

501、服务器基于视频的视频帧，确定前景位置信息，该前景位置信息表示视频帧中的前景区域的位置。

其中，视频帧的前景区域包括该视频帧的主体内容。在一种可能的实现方式中，视频的多个视频帧中的前景区域的位置均相同，服务器基于视频的任一视频帧，确定前景位置信息即可，该前景位置信息能够表示每个视频帧中的前景区域的位置。

在另一种可能的实现方式中，视频的多个视频帧中的前景区域的位置存在差异，服务器基于视频的每个视频帧，确定每个视频帧对应的前景位置信息。

可选地，对于一个视频帧，服务器通过角点检测的方法，基于该视频帧中的像素点的特征值的变化情况，来确定该视频帧对应的前景位置信息，该过程包括：服务器对视频的任一视频帧进行角点检测，得到该视频帧的前景区域的多个边缘点的坐标；将上述多个边缘点的坐标确定为前景位置信息。可选地，服务器将视频的视频帧输入到角点检测模型中，得到角点检测模型输出的多个边缘点的坐标，该多个边缘点的坐标表示该视频帧的前景区域所在的位置。其中，角点检测模型是一种机器学习模型，是基于多个样本图像进行训练得到的，每个样本图像均标注有前景区域的多个边缘点的坐标，训练完成的角点检测模型具有识别图像中的前景区域的多个边缘点的坐标的功能。

在一个示例中，继续参见图3，多个边缘点的坐标包括四个顶点的坐标，该多个边缘点的坐标表示的前景区域301的形状为矩形。在另一个示例中，服务器得到的前景位置信息也可以包括左边缘的位置信息、上边缘的位置信息、宽度和高度，上述左边缘的位置信息、上边缘的位置信息、宽度和高度表示一个矩形的前景区域。需要说明的是，上述示例以多个边缘点表示的前景区域的形状是矩形为例进行说明，多个边缘点表示的前景区域的形状也可以是三角形、五角星形、六角星形、圆形或者不规则形状等任一形状，本申请对前景区域的形状不加以限定。

或者，对于一个视频帧，服务器也可以通过主体检测的方法或者边缘检测的方法，确定该视频帧对应的前景位置信息。例如，服务器通过主体检测的方法或者边缘检测的方法，识别出视频帧中突出的人脸区域、人体区域或者物体区域的位置信息，作为前景位置信息。本申请以通过角点检测的方法确定前景位置信息为例进行说明，对确定前景位置信息的具体方式不加以限定。

502、服务器从视频的每个视频帧中，获取前景位置信息所指示的前景区域对应的前景图像。

在一种可能的实现方式中，若视频的多个视频帧中的前景区域的位置均相同，服务器通过上述步骤501确定了一个前景位置信息，则服务器根据该前景位置信息，依次从每个视频帧中，获取该前景位置信息所指示的前景区域对应的前景图像，从而得到多个前景图像。

在另一种可能的实现方式中，若视频的多个视频帧中的前景区域的位置存在差异，服务器通过上述步骤501分别为每个视频帧确定了一个前景位置信息，则服务器依次根据每个视频帧对应的前景位置信息，从每个视频帧中获取每个视频帧对应的前景位置信息所指示的前景区域对应的前景图像，从而得到多个前景图像。

503、服务器对所获取的多个前景图像进行编码，得到前景视频。

可选地，服务器采用任一用于视频的压缩编码标准，对多个前景图像进行编码，得到前景视频。例如，服务器采用MPEG-4(Moving Picture Experts Group-4，动态图像专家组-4)标准，对多个前景图像进行编码，得到MP4(Moving Picture Experts Group-4，动态图像专家组-4)格式的前景视频。

504、服务器获取该视频的每个视频帧中的背景区域对应的原始背景图像。

例如，继续参见图3，服务器从该视频的一个视频帧中，获取到该视频帧中的背景区域303对应的原始背景图像304。

在一种可能的实现方式中，服务器将每个视频帧中前景位置信息所指示的前景区域变换为透明的状态，得到每个视频帧的背景区域对应的原始背景图像。其中，透明的状态是指处于透明的状态的区域与叠加在该区域上的图像相比较是透明的，处于透明的状态的区域与任意图像叠加显示时，均不会对所叠加的图像形成遮挡。处于透明的状态的区域与任意图像叠加显示的效果均是呈现所叠加的图像，隐藏处于透明的状态的区域。可选地，若透明度从0到1依次表示透明至不透明的状态，则通过将前景区域的透明度变更为0，来使前景区域达到透明的状态。

上述技术方案，通过使前景区域变换为透明的状态，来隐藏前景区域的显示，从而得到了仅包括背景区域的原始背景图像。并且，通过变换透明状态得到的原始背景图像与视频帧的尺寸一致，便于终端通过显示原始背景图像呈现出与视频帧的背景区域相同的显示效果。

在另一种可能的实现方式中，服务器从每个视频帧中截去前景区域，将截去前景区域后的每个视频帧确定为每个视频帧对应的原始背景图像。

需要说明的一点是，可选地，服务器按照视频的多个视频帧的排列顺序，依次获取每个视频帧中的背景区域对应的原始背景图像，从而得到多个原始背景图像，其中，多个原始背景图像是按照多个视频帧的排列顺序进行排列的。

上述技术方案，按照多个视频帧的排列顺序，获得与多个视频帧的排列顺序相同的多个原始背景图像，便于服务器依据多个原始背景图像的变化规律，选取至少一个目标背景图像，以及便于显示视频的终端按照背景图像的排列顺序进行显示，确定视频能够保持原始显示效果。

另外，在一些实施例中，服务器也可以不按照多个视频帧的排列顺序获取多个原始背景图像，服务器可以按照任意顺序获取多个原始背景图像，本申请对此不加以限定。

需要说明的另一点是，在本申请实施例中，对获取前景图像和获取原始背景图像的先后顺序以先获取前景图像，再获取原始背景图像为例进行说明。可选地，服务器从视频帧中截取前景图像之后，将截取前景图像后的视频帧的剩余部分确定为原始背景图像。在一些实施例中，获取前景图像的步骤和获取原始背景图像的步骤也可以按照其他时序进行。例如，服务器同时获取前景图像和原始背景图像；或者，服务器先获取原始背景图像，再获取前景图像，本申请对此不加以限定。

505、服务器基于所获取的多个原始背景图像，确定至少一个目标背景图像。

在一种可能的实现方式中，服务器将多个原始背景图像作为多个目标背景图像。

在另一种可能的实现方式中，视频的多个视频帧的背景区域具有一定的变化规律，例如，多个视频帧的背景区域相同或者多个视频帧的背景区域与一组图像循环播放的效果相同，多个视频帧对应的多个原始背景图像存在着重复出现的现象，服务器对多个原始背景图像进行去重，保留具有代表性的少量目标背景图像即可，以通过降低目标背景图像的体积，来降低视频的编码信息的体积。其中，每个目标背景图像对应至少一个原始背景图像，每个目标背景图像与对应的至少一个原始背景图像相同。

下面基于多个原始背景图像中可能存在的3种变化规律，对服务器基于所获取的多个原始背景图像，确定至少一个目标背景图像的步骤进行详细说明。

(1)多个原始背景图像均相同。

若多个原始背景图像均相同，则多个原始背景图像中的任一个原始背景图像均可代表该多个原始背景图像，服务器将多个原始背景图像中的任一个确定为目标背景图像即可。在多个原始背景图像均相同的情况下，服务器选取的至少一个目标背景图像的数量为一个。相应的，服务器基于所获取的多个原始背景图像，确定至少一个目标背景图像的步骤包括：服务器响应于多个原始背景图像均相同，对多个原始背景图像进行去重处理，将剩余的一个原始背景图像确定为目标背景图像。其中，上述剩余的一个原始背景图像为多个原始背景图像中的任一个，本申请对此不加以限定。

上述技术方案，在多个原始背景图像均相同的情况下，选取其中一个原始背景图像作为目标背景图像，大大减少了目标背景图像的数量，降低了编码信息中的目标背景图像的体积，从而降低了视频的编码信息的体积。

(2)多个原始背景图像包括相同的多组原始背景图像。

若多个原始背景图像包括相同的多组原始背景图像，则多组原始背景图像中的任一组原始背景图像均可代表该多组原始背景图像，服务器将其中一组原始背景图像作为至少一个目标背景图像即可。其中，一组原始背景图像包括至少两个原始背景图像。相应的，服务器基于所获取的多个原始背景图像，确定至少一个目标背景图像的步骤包括：服务器响应于多个原始背景图像包括相同的多组原始背景图像，将多组原始背景图像中的任一组原始背景图像确定为目标背景图像。

例如，多个原始背景图像表示为“abcabcabcabc”，其中，“a”、“b”和“c”分别表示不同的原始背景图像，多个原始背景图像包括相同的4组原始背景图像，其中每组原始背景图像均为“abc”，服务器将“abc”作为至少一个目标背景图像即可。

上述技术方案，在多个原始背景图像是由一组原始背景图像循环排列而成的情况下，服务器将一组原始背景图像作为至少一个目标背景图像，大大减少了目标背景图像的数量，降低了编码信息中的目标背景图像的体积，从而降低了视频的编码信息的体积。

需要说明的是，在一些实施例中，若一组原始背景图像包括至少两个相同的原始背景图像，进一步可选地，服务器对一组原始背景图像进行去重处理，将剩余的原始背景图像确定为目标背景图像。相应的，服务器基于所获取的多个原始背景图像，确定至少一个目标背景图像的步骤包括：服务器响应于多个原始背景图像包括相同的多组原始背景图像，对多组原始背景图像中的任一组原始背景图像所包括的连续且相同的多个原始背景图像进行去重处理，将该任一组原始背景图像中剩余的原始背景图像确定为目标背景图像。

例如，多个原始背景图像表示为“abbabbabbabb”，多个原始背景图像中的任一组原始背景图像为“abb”，服务器对“abb”进行去重处理，得到“ab”，将“ab”作为至少一个目标背景图像。

再如，多个原始背景图像表示为“aabbaabbaabbaabb”，多个原始背景图像中的任一组原始背景图像为“aabb”，服务器对“aabb”进行去重处理，得到“ab”，将“ab”作为至少一个目标背景图像。

上述技术方案，在多个原始背景图像是由一组原始背景图像循环排列而成，且该组原始背景图像包括连续且相同的多个原始背景图像的情况下，对该组原始背景图像中重复的原始背景图像进行进一步的去重处理，得到至少一个目标背景图像，进一步减少了目标背景图像的数量，降低了编码信息中的目标背景图像的体积，从而进一步降低了视频的编码信息的体积。

(3)多个原始背景图像包括连续且相同的多个背景图像。

若多个原始背景图像包括连续且相同的多个背景图像，则连续且相同的多个背景图像中的任一个均可代表该连续且相同的多个背景图像，服务器保留连续且相同的多个背景图像中的一个，作为目标背景图像即可。相应的，服务器基于所获取的多个原始背景图像，确定至少一个目标背景图像的步骤包括：服务器响应于多个原始背景图像包括连续且相同的多个背景图像，对连续且相同的多个背景图像进行去重处理，将剩余的一个背景图像确定为目标背景图像。其中，剩余的一个背景图像为连续且相同的多个背景图像中的任一个。

例如，多个原始背景图像表示为“aaaaaabbbbbb”，多个原始背景图像包括连续且相同的多个背景图像“aaaaaa”和连续且相同的多个背景图像“bbbbbb”，则分别对“aaaaaa”和“bbbbbb”进行去重处理，得到“ab”，将“ab”作为至少一个目标背景图像。

需要说明的是，在一些实施例中，除了包括连续且相同的多个背景图像之外，多个原始背景图像还包括与相邻的背景图像均不相同的背景图像。对于与相邻的背景图像均不相同的背景图像，服务器将该背景图像确定为至少一个目标背景图像中的一个，也即是，服务器响应于多个原始背景图像包括与相邻的背景图像均不相同的背景图像，将与相邻的背景图像均不相同的背景图像确定为目标背景图像。

例如，多个原始背景图像表示为“aaaaaaaabccc”，多个原始背景图像包括连续且相同的多个背景图像“aaaaaaaa”以及连续且相同的多个背景图像“ccc”。另外，多个原始背景图像还包括背景图像“b”，与背景图像“b”相邻的背景图像为“a”和“c”，其中，背景图像“b”和与背景图像“b”相邻的背景图像“a”和背景图像“c”均不相同，则分别对连续且相同的多个背景图像“aaaaaaaa”和连续且相同的多个背景图像“ccc”进行去重处理，保留连续且相同的多个背景图像“aaaaaaaa”中的一个、连续且相同的多个背景图像“ccc”中的一个以及与相邻的背景图像均不相同的背景图像“b”作为至少一个目标背景图像，得到至少一个目标背景图像“abc”。

再如，多个原始背景图像表示为“abbbbbbbccc”，多个原始背景图像包括连续且相同的多个背景图像“bbbbbbb”以及连续且相同的多个背景图像“ccc”。另外，多个原始背景图像还包括背景图像“a”，与背景图像“a”相邻的背景图像为“b”，其中，背景图像“a”和与背景图像“a”相邻的背景图像“b”不相同，则分别对连续且相同的多个背景图像“bbbbbbb”和连续且相同的多个背景图像“ccc”进行去重处理，保留连续且相同的多个背景图像“bbbbbbb”中的一个、连续且相同的多个背景图像“ccc”中的一个以及与相邻的背景图像不相同的背景图像“a”作为至少一个目标背景图像，得到至少一个目标背景图像“abc”。

上述技术方案，在多个原始背景图像包括连续且相同的多个背景图像的情况下，对重复的多个背景图像进行去重处理，得到至少一个目标背景图像，减少了目标背景图像的数量，降低了编码信息中的目标背景图像的体积，从而降低了视频的编码信息的体积。

需要说明的是，若多个原始背景图像的变化情况不符合多个原始背景图像均相同的变化规律，也不符合多个原始背景图像包括相同的多组原始背景图像的变化规律，也不符合多个原始背景图像包括连续且相同的多个背景图像的变化规律，则服务器将多个原始背景图像确定为多个目标背景图像。

需要说明的是，可选地，服务器确定至少一个目标背景图像之后，将每个目标背景图像存储为目标图像格式。可选地，目标图像格式为PNG(Portable Network Graphics，便携式网络图形)格式、JPEG(Joint Photographic Experts Group，联合图像专家组)格式或者其他图像格式，本申请对此不加以限定。

506、服务器基于每个目标背景图像对应的至少一个原始背景图像所属的视频帧的显示时长，确定每个目标背景图像的显示时长。

在一种可能的实现方式中，服务器响应于目标背景图像为多个原始背景图像中与相邻的背景图像均不相同的背景图像，将该目标背景图像所属的视频帧的显示时长确定为该目标背景图像的显示时长。

例如，至少一个目标背景图像“ab”是由多个原始背景图像“abbabbabbabb”进行去重处理得到的，其中，目标背景图像“a”在多个原始背景图像中与相邻的背景图像均不相同，目标背景图像“a”的显示时长为该目标背景图像“a”所属的视频帧的显示时长。

再如，至少一个目标背景图像“abc”是由多个原始背景图像“aaaaaaaabccc”进行去重处理得到的，其中，目标背景图像“b”在多个原始背景图像中与相邻的背景图像均不相同，目标背景图像“b”的显示时长为该目标背景图像“b”所属的视频帧的显示时长。

上述技术方案，若目标背景图像是多个原始背景图像中与相邻的背景图像均不相同的背景图像，则表示该目标背景图像对应的背景区域在视频的视频帧中是独立单帧显示的，将该目标背景图像所属的视频帧的显示时长确定为该目标背景图像的显示时长，能够使终端按照显示时长对目标背景图像进行显示时，还原视频帧的显示效果。

在另一种可能的实现方式中，服务器响应于目标背景图像由相同的多个背景图像进行去重处理得到，将相同的多个背景图像的数量所属的视频帧的显示时长的和值，确定为目标背景图像的显示时长。

例如，至少一个目标背景图像“ab”中的目标背景图像“a”是由多个原始背景图像“aaaaaabbbbbb”中相同的多个背景图像“aaaaaa”进行去重处理得到的，其中，多个背景图像“aaaaaa”所属的视频帧的显示时长依次为0.04秒、0.04秒、0.04秒、0.04秒、0.04秒、0.04秒，则目标背景图像“a”的显示时长为上述相同的多个背景图像“aaaaaa”中的每个背景图像“a”所属的视频帧的显示时长的和值0.24秒。

再如，至少一个目标背景图像“ab”是由多个原始背景图像“aabbaabbaabb”中相同的多个背景图像“aa”进行去重处理得到的，其中，多个背景图像“aa”所属的视频帧的显示时长依次为0.04秒、0.04秒，则目标背景图像“a”的显示时长为上述相同的多个背景图像“aa”中的每个背景图像“a”所属的视频帧的显示时长的和值0.08秒。

上述技术方案，若目标背景图像是从连续且相同的多个背景图像中选取出来的一个背景图像，通过将该目标背景图像的显示时长确定为多个背景图像所属的视频帧的显示时长的和值，能够使按照显示时长显示该目标背景图像的效果代表多个视频帧的背景区域的显示效果，从而在降低视频的编码信息的基础上，保证视频能够呈现原始显示效果。

需要说明的是，若多个原始背景图像均相同，目标背景图像为该多个原始背景图像中的一个，则服务器可以将多个原始背景图像所属的视频帧的显示时长的和值确定为该目标背景图像的显示时长；服务器也可以直接将视频的总时长确定为该目标背景图像的显示时长，本申请对此不加以限定。

在另一种可能的实现方式中，若多个目标背景图像为视频对应的多个原始背景图像，则对于多个目标背景图像中的每个目标背景图像，服务器将该目标原始图像所属的视频帧的显示时长确定为该目标背景图像的显示时长。

507、服务器基于前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长，生成视频的编码信息。

在一种可能的实现方式中，服务器将前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长确定为视频的编码信息。

在另一种可能的实现方式中，服务器将前景位置信息编码在前景视频中；将每个目标背景图像的显示时长编码在对应的目标背景图像中；将编码有前景位置信息的前景视频和编码有对应的显示时长的至少一个目标背景图像确定为视频的编码信息。

本申请提供了一种新型的视频编码方案，通过对视频的视频帧中的前景区域对应的前景图像进行单独编码，降低了视频编码的分辨率，在整体码率一定的情况下，提高了编码得到的前景视频中单位像素所占的码率，进而基于前景区域所在的位置、编码得到的前景视频、包括视频的次要内容的背景图像以及背景图像的显示时长，生成视频的编码信息，以通过该编码信息控制前景视频的显示位置以及背景图像的显示时长，使处理后的视频播放时能够呈现出与视频帧相同的显示效果，在确保视频保持原始显示效果的基础上，通过提高前景视频中单位像素的码率，实现了视频的主体内容的清晰度的提高，提升了视频的主体内容的画质。

508、服务器响应于接收到终端的视频获取请求，向终端返回该视频获取请求所请求获取的视频的编码信息。

可选地，服务器生成视频的编码信息后，将该视频的视频标识与该视频的编码信息进行对应存储。终端发送的视频获取请求携带有视频标识，服务器根据视频获取请求携带的视频标识，从所存储的视频标识与编码信息的对应关系中，获取视频获取请求携带的视频标识对应的编码信息，向终端返回该编码信息。

509、终端接收服务器返回的编码信息，从该编码信息中获取前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长。

在一种可能的实现方式中，编码信息由前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长组成，终端直接从编码信息中获取前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长。

在另一种可能的实现方式中，编码信息由编码有前景位置信息的前景视频和至少一个编码有显示时长的目标背景图像组成，终端从编码有前景位置信息的前景视频中解码得到前景位置信息和前景视频，从每个编码有显示时长的目标背景图像中解码得到每个目标背景图像的显示时长。

510、终端对前景视频进行解码，在前景位置信息所指示的位置，显示解码得到的前景图像，以及，按照每个目标背景图像的显示时长，显示每个目标背景图像。

在一种可能的实现方式中，若至少一个目标背景图像的显示时长的和值与视频的总时长相同，则表示至少一个目标背景图像不是循环显示的一个单元，若至少一个目标背景图像为一个目标背景图像，则终端按照该目标背景图像的显示时长显示该目标背景图像即可；若至少一个目标背景图像为多个目标背景图像，则终端按照每个目标背景图像的显示时长，按照排列顺序，依次显示目标背景图像即可。

在另一种可能的实现方式中，若至少一个目标背景图像的显示时长的和值与视频的总时长不同，则表示至少一个目标背景图像是循环显示的一个单元，服务器需要按照每个目标背景图像的显示时长，循环显示该至少一个目标背景图像，也即是，服务器响应于至少一个目标背景图像的显示时长的和值小于视频的总时长，按照每个目标背景图像的显示时长，循环显示至少一个目标背景图像。

例如，至少一个目标背景图像表示为“abc”3个目标背景图像，且该3个目标背景图像的显示时长的和值为5秒，视频的总时长为15秒，服务器按照每个目标背景图像的显示时长，对该3个目标背景图像进行循环显示，也即是，按照“abcabcabc”的顺序以及每个目标背景图像的显示时长进行显示。

本申请还提供了一种与上述新型的视频编码方案相对应的视频显示方案，由于视频的编码信息中的前景视频是对视频的视频帧中的前景区域对应的前景图像进行单独编码得到的，在整体码率一定的情况下，降低了视频编码的分辨率，提高了前景视频中单位像素所占的码率，进而按照编码信息中的前景位置信息所指示的位置对前景视频进行显示，以及按照背景图像的显示时长，对背景图像进行显示，使处理后的视频播放时能够呈现出与视频帧相同的显示效果，在确保视频保持原始显示效果的基础上，通过提高前景视频中单位像素的码率，实现了视频的主体内容的清晰度的提高，提升了视频的主体内容的画质。

需要说明的是，在一些实施例中，视频对应有背景标签，该背景标签用于表示该视频的视频帧中的背景区域的变化规律，服务器可以基于已知的该背景标签所表示的变化规律，来获取目标背景图像。例如，若背景标签表示视频的每个视频帧的背景区域均相同，则服务器获取任一视频帧对应的原始背景图像，作为目标背景图像即可。相应的，上述步骤504至步骤506可以替换为以下获取视频的至少一个目标背景图像以及每个目标背景图像的显示时长的步骤：服务器响应于视频的背景标签为第一标签，获取该视频的任一视频帧中的背景区域对应的原始背景图像，第一标签用于表示视频的每个视频帧的背景区域均相同；服务器将获取到的一个原始背景图像确定为目标背景图像；服务器将视频的总时长，确定为目标背景图像的显示时长。

上述技术方案，在已确定视频的多个视频帧的背景区域均相同的情况下，从其中一个视频帧中获取一个背景图像，作为目标背景图像，无需通过获取多个视频帧对应的背景图像，并对获取到的多个背景图像进行比较来确定目标背景图像，提高了目标背景图像的获取效率。

再如，若背景标签表示视频的每个视频帧的背景区域是循环重复显示的，则服务器获取循环重复显示所基于的一组原始背景图像作为目标背景图像即可。相应的，上述步骤504至步骤506可以替换为以下获取视频的至少一个目标背景图像以及每个目标背景图像的显示时长的步骤：服务器响应于视频的背景标签为第二标签，按照视频的多个视频帧的排列顺序，获取一个视频帧中的背景区域对应的原始背景图像，第二标签用于表示视频的多个视频帧对应的原始背景图像中包括相同的多组原始背景图像，且每组中的原始背景图像互不相同；服务器响应于本次获取到的原始背景图像与已确定的第一个目标背景图像不相同，将本次获取到的原始背景图像确定为目标背景图像，继续按照视频的多个视频帧的排列顺序，获取下一个视频帧中的背景区域对应的原始背景图像，直至获取到的原始背景图像与已确定的第一个目标背景图像相同；对于已确定的多个目标背景图像中的每个目标背景图像，服务器将该目标背景图像所属的视频帧的显示时长，确定为该目标背景图像的显示时长。

例如，服务器获取第一个视频帧对应的第一个原始背景图像和第二个视频帧对应的第二个原始背景图像，响应于第一个原始背景图像和第二个原始背景图像不同，将第一个原始背景图像和第二个原始背景图像确定为目标背景图像，获取第三个视频帧对应的第三个原始背景图像；响应于第三个原始背景图像与第一个原始背景图像和第二个原始背景图像均不相同，将第三个原始背景图像确定为目标背景图像，获取第四个视频帧对应的第四个原始背景图像，以此类推，直至获取到的原始背景图像与已确定的第一个目标背景图像相同。示例性地，若第四个原始背景图像与第一个目标背景图像相同，则结束获取视频帧对应的原始背景图像的过程，得到3个目标背景图像，分别为第一个原始背景图像、第二个原始背景图像和第三个原始背景图像。

上述技术方案，在已确定视频的多个视频帧的背景区域是循环重复显示的，且循环重复显示的一个单元内的背景区域互不相同的情况下，依次获取视频帧对应的原始背景图像，作为目标背景图像，响应于获取到的原始背景图像与第一个目标背景图像相同，就结束获取原始背景图像的过程，通过少量的图像比较，即可确定需要循环显示的一组目标背景图像，提高了目标背景图像的获取效率。

需要说明的是，在一些实施例中，待处理的视频包括四类。其中，第一类视频的特点为多个视频帧中的背景区域均为相同的纯色区域，例如，其中一个视频帧如图6所示，该视频帧包括前景区域601和纯色的背景区域602，每个视频帧中的背景区域均与背景区域602相同；第二类视频的特点为多个视频帧中的背景区域均相同，且不是纯色区域，例如，其中一个视频帧如图7所示，该视频帧包括前景区域701和背景区域702，每个视频帧中的背景区域均与背景区域702相同；第三类视频的特点为多个视频帧中的背景区域循环显示，且循环显示的多个背景区域互不相同，例如，循环显示的3个视频帧如图8所示，第一个视频帧包括前景区域801和背景区域802，第二个视频帧包括前景区域803和背景区域804，第三个视频帧包括前景区域805和背景区域806，背景区域802、背景区域804和背景区域806互不相同，并且，背景区域802、背景区域804和背景区域806按照背景区域802、背景区域804、背景区域806、背景区域802、背景区域804、背景区域806的顺序进行循环显示；第四类视频为多个视频帧中的背景区域互不相同。服务器可以根据上述四类视频的特点，确定至少一个目标背景图像。相应的，服务器获取视频的至少一个目标背景图像以及每个目标背景图像的显示时长的步骤包括：服务器获取第一个视频帧中的背景区域对应的第一个原始背景图像；响应于第一个原始背景图像中的像素点的像素值均相同，将第一个原始背景图像确定为目标背景图像，结束获取目标背景图像的步骤；响应于第一个原始背景图像中的像素点的像素值不同，获取第二个视频帧中的背景区域对应的第二个原始背景图像；响应于第一个原始背景图像与第二个原始背景图像相同，将第一个原始背景图像和第二个原始背景图像中的任一个确定为目标背景图像，结束获取目标背景图像的步骤；响应于第一个原始背景图像和第二个原始背景图像不同，将第一个原始背景图像和第二个原始背景图像确定为目标背景图像，获取第三个视频帧对应的第三个原始背景图像；响应于第三个原始背景图像与第一个原始背景图像和第二个原始背景图像均不相同，将第三个原始背景图像确定为目标背景图像，获取第四个视频帧对应的第四个原始背景图像，以此类推，直至获取到的原始背景图像与已确定的第一个目标背景图像相同。示例性地，若第四个原始背景图像与第一个目标背景图像相同，则结束获取视频帧对应的原始背景图像的过程，得到3个目标背景图像，分别为第一个原始背景图像、第二个原始背景图像和第三个原始背景图像。若多个视频帧对应的原始背景图像与第一个目标背景图像均不相同，则多个视频帧对应的原始背景图像均为目标背景图像。

需要说明的是，若目标背景图像为像素点的像素值均相同的第一个原始背景图像，该目标背景图像也可以称为纯色背景贴图。若目标背景图像为多个视频帧对应的相同的多个原始背景图像中的一个，该目标背景图像也可以称为静态背景贴图。若多个目标背景图像包括多个视频帧对应的循环显示的一组原始背景图像，该多个目标背景图像也可以称为动态背景贴图。

上述技术方案，在待处理的视频包括上述四类视频的情况下，通过获取少量视频帧对应的原始背景图像，即可确定至少一个目标背景图像，提高了目标背景图像的获取效率。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

图9是本申请实施例提供的一种视频处理装置的框图。参见图9，该装置包括：

前景图像获取模块901，用于从视频的每个视频帧中，获取前景位置信息所指示的前景区域对应的前景图像，前景位置信息表示视频中的每个视频帧中的前景区域的位置；

前景视频编码模块902，用于对所获取的多个前景图像进行编码，得到前景视频；

目标背景图像获取模块903，用于获取视频的至少一个目标背景图像以及每个目标背景图像的显示时长，至少一个目标背景图像为视频的至少一个视频帧的背景区域对应的背景图像，背景区域为视频帧中除前景区域之外的区域；

编码信息生成模块904，用于基于前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长，生成视频的编码信息。

在一种可能的实现方式中，目标背景图像获取模块903，包括：

原始背景图像获取单元，用于获取视频的每个视频帧中的背景区域对应的原始背景图像；

目标背景图像确定单元，用于基于所获取的多个原始背景图像，确定至少一个目标背景图像，其中，每个目标背景图像对应至少一个原始背景图像，每个目标背景图像与对应的至少一个原始背景图像相同；

显示时长确定单元，用于基于每个目标背景图像对应的至少一个原始背景图像所属的视频帧的显示时长，确定每个目标背景图像的显示时长。

在另一种可能的实现方式中，目标背景图像确定单元，用于响应于多个原始背景图像均相同，对多个原始背景图像进行去重处理，将剩余的一个原始背景图像确定为目标背景图像。

在另一种可能的实现方式中，原始背景图像获取单元，用于按照视频的多个视频帧的排列顺序，依次获取每个视频帧中的背景区域对应的原始背景图像。

在另一种可能的实现方式中，目标背景图像确定单元，用于响应于多个原始背景图像包括相同的多组原始背景图像，将多组原始背景图像中的任一组原始背景图像确定为目标背景图像；或者，

目标背景图像确定单元，用于响应于多个原始背景图像包括相同的多组原始背景图像，对多组原始背景图像中的任一组原始背景图像所包括的连续且相同的多个原始背景图像进行去重处理，将任一组原始背景图像中剩余的原始背景图像确定为目标背景图像。

在另一种可能的实现方式中，目标背景图像确定单元，用于响应于多个原始背景图像包括连续且相同的多个背景图像，对连续且相同的多个背景图像进行去重处理，将剩余的一个背景图像确定为目标背景图像。

在另一种可能的实现方式中，目标背景图像确定单元，用于响应于多个原始背景图像包括与相邻的背景图像均不相同的背景图像，将与相邻的背景图像均不相同的背景图像确定为目标背景图像。

在另一种可能的实现方式中，显示时长确定单元，用于响应于目标背景图像由相同的多个背景图像进行去重处理得到，将相同的多个背景图像所属的视频帧的显示时长的和值，确定为目标背景图像的显示时长。

在另一种可能的实现方式中，显示时长确定单元，用于响应于目标背景图像为多个原始背景图像中与相邻的背景图像均不相同的背景图像，将目标背景图像所属的视频帧的显示时长确定为目标背景图像的显示时长。

在另一种可能的实现方式中，目标背景图像获取模块903，用于：

响应于视频的背景标签为第一标签，获取视频的任一视频帧中的背景区域对应的原始背景图像，第一标签用于表示视频的每个视频帧的背景区域均相同；

将获取到的一个原始背景图像确定为目标背景图像；

将视频的总时长，确定为目标背景图像的显示时长。

在另一种可能的实现方式中，目标背景图像获取模块903，用于：

响应于视频的背景标签为第二标签，按照视频的多个视频帧的排列顺序，获取一个视频帧中的背景区域对应的原始背景图像，第二标签用于表示视频的多个视频帧对应的原始背景图像中包括相同的多组原始背景图像，且每组中的原始背景图像互不相同；

响应于本次获取到的原始背景图像与已确定的第一个目标背景图像不相同，将本次获取到的原始背景图像确定为目标背景图像，继续按照视频的多个视频帧的排列顺序，获取下一个视频帧中的背景区域对应的原始背景图像，直至获取到的原始背景图像与已确定的第一个目标背景图像相同；

对于已确定的多个目标背景图像中的每个目标背景图像，将目标背景图像所属的视频帧的显示时长，确定为目标背景图像的显示时长。

在另一种可能的实现方式中，该装置还包括：

角点检测模块，用于对视频的任一视频帧进行角点检测，得到视频帧的前景区域的多个边缘点的坐标；

前景位置信息确定模块，用于将多个边缘点的坐标确定为前景位置信息。

在另一种可能的实现方式中，原始背景图像获取单元，用于将每个视频帧中前景位置信息所指示的前景区域变换为透明的状态，得到每个视频帧的背景区域对应的原始背景图像。

需要说明的是：上述实施例提供的视频处理装置在进行视频处理时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将计算机设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的视频处理装置与视频处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图10是本申请实施例提供的一种视频处理装置的框图。参见图10，该装置包括：

编码信息获取模块1001，用于获取视频的编码信息，编码信息包括前景位置信息、前景视频、至少一个目标背景图像和每个目标背景图像的显示时长；

前景图像显示模块1002，用于对前景视频进行解码，在前景位置信息所指示的位置，显示解码得到的前景图像；

目标背景图像显示模块1003，用于按照每个目标背景图像的显示时长，显示每个目标背景图像；

其中，前景位置信息表示视频中的每个视频帧中的前景区域的位置，前景区域包括视频帧中的主体内容，前景视频是对视频的视频帧中的前景区域对应的前景图像进行编码得到的，至少一个目标背景图像为视频的至少一个视频帧的背景区域对应的背景图像，背景区域为视频的视频帧中除前景区域之外的区域。

在一种可能的实现方式中，目标背景图像显示模块1003，用于响应于至少一个目标背景图像的显示时长的和值小于视频的总时长，按照每个目标背景图像的显示时长，循环显示至少一个目标背景图像。

需要说明的是：上述实施例提供的视频处理装置在进行视频处理时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将终端的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的视频处理装置与视频处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在本申请中，计算机设备可被配置为终端或服务器。若计算机设备被配置为终端，图11示出了本申请一个示例性实施例提供的终端1100的结构框图。该终端1100可以是智能手机、平板电脑、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1100还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端1100包括有：处理器1101和存储器1102。

处理器1101可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1101可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1101可以集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1101还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1102可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1102中的非暂态的计算机可读存储介质用于存储至少一条程序代码，该至少一条程序代码用于被处理器1101所执行以实现本申请中方法实施例提供的视频处理方法。

在一些实施例中，终端1100还可选包括有：外围设备接口1103和至少一个外围设备。处理器1101、存储器1102和外围设备接口1103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1103相连。具体地，外围设备包括：射频电路1104、显示屏1105、摄像头组件1106、音频电路1107、定位组件1108和电源1109中的至少一种。

外围设备接口1103可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1101和存储器1102。在一些实施例中，处理器1101、存储器1102和外围设备接口1103被集成在同一芯片或电路板上；在一些其他实施例中，处理器1101、存储器1102和外围设备接口1103中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1104用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1104将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1104包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1104可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1104还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1105用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1105是触摸显示屏时，显示屏1105还具有采集在显示屏1105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1101进行处理。此时，显示屏1105还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1105可以为一个，设置在终端1100的前面板；在另一些实施例中，显示屏1105可以为至少两个，分别设置在终端1100的不同表面或呈折叠设计；在另一些实施例中，显示屏1105可以是柔性显示屏，设置在终端1100的弯曲表面上或折叠面上。甚至，显示屏1105还可以设置成非矩形的不规则图形，也即异形屏。显示屏1105可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。

摄像头组件1106用于采集图像或视频。可选地，摄像头组件1106包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1106还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1101进行处理，或者输入至射频电路1104以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1101或射频电路1104的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1107还可以包括耳机插孔。

定位组件1108用于定位终端1100的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件1108可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源1109用于为终端1100中的各个组件进行供电。电源1109可以是交流电、直流电、一次性电池或可充电电池。当电源1109包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端1100还包括有一个或多个传感器1110。该一个或多个传感器1110包括但不限于：加速度传感器1111、陀螺仪传感器1112、压力传感器1113、指纹传感器1114、光学传感器1115以及接近传感器1116。

本领域技术人员可以理解，图11中示出的结构并不构成对终端1100的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

若计算机设备被配置为服务器，图12是本申请实施例提供的一种服务器的框图，该服务器1200可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(Central Processing Units，CPU)1201和一个或一个以上的存储器1202，其中，存储器1202中存储有至少一条程序代码，至少一条程序代码由处理器1201加载并执行以实现上述各个方法实施例提供的视频处理方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一条程序代码，上述至少一条程序代码可由服务器中的处理器执行以完成上述实施例中的视频处理方法。例如，计算机可读存储介质可以是ROM(Read-Only Memory，只读存储器)、RAM(Random Access Memory，随机存取存储器)、CD-ROM(Compact Disc Read-Only Memory，只读光盘)、磁带、软盘和光数据存储设备等。

本申请还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述各个方法实施例中的视频处理方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：刘春宇;
专利申请人：广州酷狗计算机科技有限公司;

上一篇：一种高强度预应力混凝土预制管桩制作方法
下一篇：基于VPX的高精度时钟源系统及时钟纠偏方法