掌桥专利:专业的专利平台
掌桥专利
首页

视频转换方法、装置、系统及存储介质

文献发布时间:2023-06-19 09:24:30


视频转换方法、装置、系统及存储介质

技术领域

本公开涉及视频处理技术领域,尤其涉及一种视频转换方法、装置、系统及存储介质。

背景技术

目前,大多数视频和影视作品在拍摄过程中会采用宽的宽高比(即横屏),诸如4:3、16:9。以宽的宽高比录制的视频或类似媒体可能会被设计为在桌面上或横屏取向上观看。因此,用户在使用移动终端观看横屏视频时,为了获得良好的视觉体验,一般要把终端屏转换到横屏位置来播放视频。

然而,越来越多的用户,特别是手机用户,更习惯于观看高的宽高比(即竖屏)的视频。垂直取向的媒体已成为用于在许多应用中观看和显示媒体的流行格式。常见的解决方式是把横屏视频按横屏宽高比缩小到竖屏方向上进行观看,这样视频上下会有大块未使用的屏幕区域,同时画幅变小,造成用户视觉体验差。

发明内容

本公开提供一种视频转换方法、装置、系统及存储介质,以至少解决用户无法在视频剪切转换后对剪切区域进一步调整的问题。

根据本公开实施例的第一方面,提供一种视频转换方法,所述视频转换方法可以包括:获取第一取向的第一视频以及用于将第一视频转换为第二取向的第二视频的剪切信息;基于剪切信息生成并显示用于调整剪切信息的用户界面;经由用户界面接收用于调整剪切信息的用户输入;以及根据调整后的剪切信息来生成第二视频。

可选地,剪切信息可以包括用于将第一视频剪切为第二视频的剪切窗口。

可选地,基于剪切信息生成并显示用于调整剪切信息的用户界面的步骤可以包括:针对第一视频的一帧,在该帧上显示用于将该帧剪切为第二视频的对应帧的剪切窗口。

可选地,所述视频转换方法可以包括:确定第一视频的至少一个关键帧,其中,生成并显示用于调整剪切信息的用户界面的步骤可以包括:生成并显示用于调整所述至少一个关键帧中的每个关键帧的剪切信息的用户界面。

可选地,根据调整后的剪切信息来生成第二视频的步骤可以包括:根据调整后的剪切信息自适应地对第一视频的剪切窗口进行调整;并且利用自适应调整后的剪切窗口对第一视频进行剪切以获得第二视频。

可选地,获取第一视频转换为第二取向的第二视频的剪切信息的步骤可以包括:对第一视频的每个帧进行分析以确定每个帧的至少一种信息;基于分析结果生成并显示针对每个帧的用于调整所述至少一种信息在视频取向转换时的权重的另一用户界面;通过所述另一用户界面来接收用于调整所述至少一种信息的权重的用户输入;基于权重被调整的所述至少一种信息来生成剪切信息。

可选地,基于权重被调整的所述至少一种信息来生成剪切信息的步骤可以包括:基于权重被调整的所述至少一种信息来生成相应帧的标注图;通过计算标注图的矩来获得相应帧的焦点;根据所述焦点以及指定宽高比来生成剪切窗口。标注图为信息分布图。

根据本公开实施例的第二方面,提供一种视频转换装置,所述视频转换装置可以包括:接口模块,被配置为接收第一取向的第一视频;分析模块,被配置为获取用于将第一视频转换为第二取向的第二视频的剪切信息,并且基于剪切信息生成并显示用于调整剪切信息的用户界面;显示模块,被配置为显示所述用户界面,其中,用于调整剪切信息的用户输入经由所述用户界面被接收;以及编辑模块,被配置为根据调整后的剪切信息来生成第二视频。

可选地,剪切信息可以包括用于将第一视频剪切为第二视频的剪切窗口。

可选地,针对第一视频的一帧,分析模块使在该帧上显示用于将该帧剪切为第二视频的对应帧的剪切窗口。

可选地,分析模块可以被配置为确定第一视频的至少一个关键帧,并且生成并显示用于调整所述至少一个关键帧中的每个关键帧的剪切信息的用户界面。

可选地,编辑模块可以被配置为根据调整后的剪切信息自适应地对第一视频的剪切窗口进行调整,并且利用自适应调整后的剪切窗口对第一视频进行剪切以获得第二视频。

可选地,分析模块可以被配置为对第一视频的每个帧进行分析以确定每个帧的至少一种信息,基于分析结果生成并显示针对每个帧的用于调整所述至少一种信息在视频取向转换时的权重的另一用户界面,通过所述另一用户界面来接收用于调整所述至少一种信息的权重的用户输入,基于权重被调整的所述至少一种信息来生成剪切信息。

可选地,分析模块可以被配置为基于权重被调整的所述至少一种信息来生成相应帧的标注图,通过计算标注图的矩来获得相应帧的焦点,并且根据所述焦点以及指定宽高比来生成剪切窗口。

根据本公开实施例的第三方面,提供一种视频转换设备,所述视频转换设备可以包括:显示器;收发器,用于接收第一取向的第一视频;以及处理器,用于:获取用于将第一视频转换为第二取向的第二视频的剪切信息,基于剪切信息生成并显示用于调整剪切信息的用户界面,控制显示器显示所述用户界面,控制收发器经由用户界面接收用于调整剪切信息的用户输入,并且根据调整后的剪切信息来生成第二视频。

可选地,剪切信息可以包括用于将第一视频剪切为第二视频的剪切窗口。

可选地,针对第一视频的一帧,处理器可以使在该帧上显示用于将该帧剪切为第二视频的对应帧的剪切窗口。

可选地,处理器可以确定第一视频的至少一个关键帧,并且生成并显示用于调整所述至少一个关键帧中的每个关键帧的剪切信息的用户界面。

可选地,处理器可以根据调整后的剪切信息自适应地对第一视频的剪切窗口进行调整,并且利用自适应调整后的剪切窗口对第一视频进行剪切以获得第二视频。

可选地,处理器可以对第一视频的每个帧进行分析以确定每个帧的至少一种信息,基于分析结果生成并显示针对每个帧的用于调整所述至少一种信息在视频取向转换时的权重的另一用户界面,通过所述另一用户界面来接收用于调整所述至少一种信息的权重的用户输入,基于权重被调整的所述至少一种信息来生成剪切信息。

可选地,处理器可以基于权重被调整的所述至少一种信息来生成相应帧的标注图,通过计算标注图的矩来获得相应帧的焦点,并且根据所述焦点以及指定宽高比来生成剪切窗口。

根据本公开实施例的第四方面,提供一种电子设备,所述电子设备可以包括:至少一个处理器;至少一个存储计算机可以执行指令的存储器,其中,所述计算机可以执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如上所述的视频转换方法。

根据本公开实施例的第五方面,提供一种存储指令的计算机可以读存储介质,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如上所述的视频转换方法。

根据本公开实施例的第六方面,提供一种计算机程序产品,所述计算机程序产品中的指令被电子装置中的至少一个处理器运行以执行如上所述的视频转换方法。

本公开的实施例提供的技术方案至少带来以下有益效果:

在视频剪切处理后,通过设置用户界面向用户呈现剪切信息,使得用户可以经由用户界面对最终剪切结果做进一步的剪切调整,以达到用户更加满意的剪切效果。

此外,通过设置用户界面使得用户可以根据自己需求来调节各信息流在转换视频结果中的比例,使得在剪切处理中保留用户定义的重要信息,从而达到用户期望的剪切效果。

此外,通过计算每帧图像的焦点,使得更加突出每帧重点信息的分布情况,并且通过对每帧焦点的轨迹拟合,能够提供更好的剪切信息,增加帧与帧之间的契合度,提高用户体验。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。

图1是根据本公开实施例提供的将视频从一个取向转换为另一个取向的应用环境的示图;

图2是根据本公开实施例的视频转换方法的流程图;

图3是根据本公开实施例的调整剪切窗口的用户界面的示图;

图4是根据本公开实施例的获取单个帧的剪切窗口信息的流程示意图;

图5是根据本公开实施例的标注区域的示意图;

图6是根据本公开实施例的调整信息权重的用户界面的示意图;

图7是根据本公开实施例的视频转换设备的框图;

图8是根据本公开另一实施例的视频转换方法的流程图;

图9是根据本公开实施例的视频转换装置的框图;

图10是根据本公开实施例的电子设备的框图。

在整个附图中,应注意,相同的参考标号用于表示相同或相似的元件、特征和结构。

具体实施方式

提供参照附图的以下描述以帮助对由权利要求及其等同物限定的本公开的实施例的全面理解。包括各种特定细节以帮助理解,但这些细节仅被视为是示例性的。因此,本领域的普通技术人员将认识到在不脱离本公开的范围和精神的情况下,可对描述于此的实施例进行各种改变和修改。此外,为了清楚和简洁,省略对公知的功能和结构的描述。

需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在此需要说明的是,在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况:(1)包括A;(2)包括B;(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”,即表示如下三种并列的情况:(1)执行步骤一;(2)执行步骤二;(3)执行步骤一和步骤二。

相关技术的视频剪切均为全自动实现,自动剪切后的视频可能没有达到用户的预期剪切效果,但是用户并不能对最终剪切结果做进一步的剪切调整。此外,在视频自动剪切中,用户也无法调节视频场景中各信息流的重要性。这导致剪切出来的视频场景也可能不符合用户预期。

本公开可以向用户提供视频剪切处理前的参数调整和处理后的剪切区域调整的功能,让用户得到他们满意的视频剪切结果。

在下文中,根据本公开的各种实施例,将参照附图对本公开的方法、装置以及系统进行详细描述。

图1是根据本公开实施例提供的将视频从一个取向转换为另一个取向的应用环境的示图。在本公开中,取向是相对于设备/装置的横向或竖向。

参照图1,该应用环境100包括终端110和媒体服务器系统120。

终端110为用户所在终端,终端110可以是智能手机、平板电脑、便携式计算机和台式计算机等中的至少一种。虽然本实施例仅示出一个终端110进行说明,但是本领域技术人员可以知晓,上述终端的数量可以为两个或更多个。本公开实施例不对终端的数量和设备类型进行任何限定。

终端110可以安装有目标应用,用于向媒体服务器系统120提供将被剪切和转换的视频,该目标应用可以是多媒体类应用、社交类应用或资讯类应用等。例如,终端110可以是用户使用的终端,在终端110中运行的应用内登录有用户的账户。

终端110可以通过无线网络或有线网络与媒体服务器系统120连接,使得终端110与媒体服务器系统120之间可以进行数据交互。例如,网络可以包含局域网(LAN)、广域网(WAN)、电话网络、无线链路、内联网、互联网或其组合等。

媒体服务器系统120可以是用于对视频进行剪切转换的服务器系统。例如,媒体服务器系统120可以包括一个或多个处理处理器以及存储器。存储器可以包括用于执行以上的视频转换方法的一个或一个以上的程序。媒体服务器系统120还可以包括一个电源组件被配置为执行媒体服务器系统120的电源管理,一个有线或无线网络接口被配置为将媒体服务器系统120连接到网络,和一个输入输出(I/O)接口。媒体服务器系统120可以操作基于存储在存储器的操作系统,例如Windows ServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTM等。然而,上述媒体服务器系统120包含的装置仅是示例性的,本公开不限于此。

媒体服务器系统120可以对输入的视频进行剪切和转换,然后经由无线网络或有线网络将转换好的视频下发给终端110或发布到媒体平台上。

进一步地,媒体服务器系统120可以获取用于将第一视频转换为第二取向的第二视频的剪切信息,基于剪切信息生成并显示用于调整剪切信息的用户界面,经由用户界面接收用于调整剪切信息的用户输入,然后根据调整后的剪切信息来对之前剪切的视频再次进行调整。

可选地,终端110可以安装有实施本公开的视频转换方法的应用程序,终端110可以实现对视频的剪切转换。例如,终端110的存储器可以存储用于执行以上的视频转换方法的一个或一个以上的程序。终端110的处理器可以通过运行相关的程序/算法来实现对视频的剪切转换。然后终端110可以经由无线网络或有线网络将剪切转换好的视频上传至媒体服务器系统120,或者可以将转换好的视频存储在终端110的存储器中。

作为示例,终端110可以将本地或外部获取的横向视频经由无线或有线网络传输给媒体服务器系统120,媒体服务器系统120可以根据本公开的视频转换方法将横向视频剪切转换为竖向视频,然后经由无线或有线网络将转换好的竖向视频下发给终端110。

作为另一示例,终端110可以根据本公开的视频转换方法将本地或外部获取的横向视频转换为竖向视屏,然后经由无线或有线网络将竖向视频上传至媒体服务器系统120。媒体服务器系统120可以将该竖向视频分发给其他的电子设备。

虽然实施例举例说明将横向视频转换为竖向视频,但是也可以采用本公开方法类似地,将竖向视频剪切转换为横向视频。

图2是根据本公开实施例的视频转换方法的流程图。本公开实施例的视频转换方法可以由媒体服务器系统120执行或具有视频剪切转换功能的电子设备执行。

在步骤S201,获取第一取向的第一视频以及用于将第一视频转换为第二取向的第二视频的剪切信息。剪切信息可以包括用于将第一视频剪切为第二视频的剪切窗口。这里,第一取向的第一视频可以指横向视频。

可以使用视频智能裁剪工具(诸如Google Autoflip)来直接获取将一个取向的视频转换为另一个取向的视频的剪切信息。也就是说,可以从相关视频智能裁剪工具获取对第一视频进行剪切的剪切信息。

根据本公开的实施例,可以通过以下方式获取剪切信息:对第一视频的每个帧进行分析以确定每个帧的至少一种信息,基于至少一种信息来生成相应帧的标注图,通过计算标注图的矩来获得相应帧的焦点,将该焦点作为用于剪切该帧的剪切窗口的中心,根据焦点以及指定宽高比来生成剪切窗口。

根据本公开的另一实施例,可以通过以下方式获取剪切信息:对第一视频的每个帧进行分析以确定每个帧的至少一种信息,基于分析结果生成并显示针对每个帧的用于调整至少一种信息在视频取向转换时的权重的用户界,通过该用户界面来接收用于调整至少一种信息的权重的用户输入,基于权重被调整的至少一种信息来生成相应帧的标注图,通过计算标注图的矩来获得相应帧的焦点,将该焦点作为用于剪切该帧的剪切窗口的中心,根据焦点以及指定宽高比来生成剪切窗口。

根据本公开的实施例,在获取剪切信息之前,可以通过设置用户界面使用户可以根据自己需求来调节各信息流在转换视频结果中的比例,使得在剪切处理中保留用户定义的重要信息。

此外,通过计算每帧图像的焦点,使得更加突出每帧重点信息的分布情况,并且通过对每帧焦点的轨迹拟合,能够提供更好的剪切信息,增加帧与帧之间的契合度,提高用户体验。

然而,上述剪切信息的获取仅是示例性的,本公开不限于此。

在本公开中,获取的剪切信息可以是在对视频进行剪切之后的结果信息。可选地,剪切信息可以是在针对视频帧进行信息分析时计算的剪切窗口信息。也就是说,获取的剪切信息可以是在视频剪切处理后的信息,也可以是视频剪切处理前的预分析信息。

在步骤S202,基于剪切信息生成并显示用于调整剪切信息的用户界面。在用户界面中,针对第一视频的一帧,在该帧上可以显示用于将该帧剪切为第二视频的对应帧的剪切窗口。例如,参照图3所示。

在步骤S203,经由用户界面接收用于调整剪切信息的用户输入。这里,用户输入可以是触摸输入、键输入、悬停输入等中的一种。可以根据显示设备的性能来实现不同类型的用户输入。

在步骤S204,根据调整后的剪切信息来生成第二视频。可以根据调整后的剪切信息自适应地对第一视频的剪切窗口进行调整,然后利用自适应调整后的剪切窗口对第一视频进行剪切以获得第二视频。通过自适应调整,能够提供更好的剪切信息,增加帧与帧之间的契合度。

在一种可能的实现方式中,可以确定第一视频的至少一个关键帧,然后生成并显示用于调整至少一个关键帧中的每个关键帧的剪切信息的用户界面。在对第一视频的关键帧的剪切窗口的调整后,可以自动对第一视频的相关帧的剪切窗口自适应地进行调整,在整个视频调整完成后,用户可以导出剪切后的视频。

根据本公开的实施例,允许用户在视频剪切处理前后对整个剪切处理流程有更加全面的把握,并最终得到他们满意的剪切结果。

此外,根据本公开的视频转换方法能够更好地处理视频场景切换、用户指定区域变更或丢失的场景。

图3是根据本公开实施例的调整剪切窗口的用户界面的示图。图3的用户界面可以被显示在诸如终端或服务器的显示器的部分区域上,或者以全屏显示在显示器上。

根据本公开的实施例,在自动剪切流程后,可以提供给用户每一帧的剪切信息,并且将剪切信息反映在后期用于调整剪切窗口的用户界面中。

参照图3,用户可以通过用户界面301针对某一帧做剪切窗口的调整。用户可以对剪切窗口进行上、下、左、右移动以调整至自己关注的区域。当用户界面301显示在触摸屏上时,用户可以触摸剪切窗口来进行相应地移动。或者可以通过鼠标、键盘等来拖动剪切窗口至关注区域。然而,上述示例仅是示例性的,本公开不限于此。

用户可以选择性地对一些帧的剪切窗口进行调整。例如,用户可以在用户界面301中通过拖动视频的滑动条来选择用户感兴趣的帧,然后对该帧的剪切窗口进行调整。或者,可以在用户界面301上设置“下一帧”按钮(未示出),在用户调整完当前帧的剪切窗口后,通过点击“下一帧”按钮来切换值下一帧的调整界面。

此外,在整个视频调整完成后,用户可以通过点击用户界面上的“导出”按钮(未示出),即可导出剪切后的视频。上述按钮示例仅是示例性的,可以根据实际需求在用户界面上设置不同功能的按钮。

可选地,可以在用户界面301上显示每个关键帧的剪切窗口,使得用户对视频的关键帧的剪切窗口进行调整,在调整完关键帧的剪切窗口之后,用户可以通过点击用户界面上的“导出”按钮来导出调整后的视频。

根据本公开实施例的用户界面简单,易于用户操作,提高用户调整剪切信息的效率。

图4是根据本公开实施例的获取单个帧的剪切窗口信息的流程示意图。

参照图4,在获取图像401后,对图像401进行分析以确定图像401的M种信息,M为正整数。其中,对于每一种信息的分析,可以使用对应的分析方法来实现,也就是说,可以使用M种分析方法对图像401进行分析以确定M种信息。例如,可以使用人脸分析方法对图像401的人脸信息进行分析。

通过对M种信息的分析可以生成M个对应的标注区域,即每分析一种信息,都会产生一个图像401相对应的信息分布图。例如,在分析人脸信息时,会生成一个图像401的人脸信息的基于像素的标注区域,然后将基于像素的标注区域转化为信息分布的标注区域。

用户可以根据自己的需求对M个标注区域分别赋予权重,以突出自己关注的部分。例如,如果想重点保护人脸部分不被剪切掉,可以提高人脸信息的标注区域的加权比例并且降低其他信息的标注区域的加权比例。

根据加权后的M个标注区域来计算图像401的整体标注区域。例如,可以通过对加权的M个标注区域求和来获得图像401的整体标注区域。

在获得整体标注区域后,可以基于整体标注区域来生成图像401的标注图。由于之前对各个标注区域进行了加权处理,所以标注图可以显示出每个标注区域的重要性。

通过计算标注图的矩来获得图像401的焦点。例如,可以通过计算标注图的几何中心点来获得图像401的焦点。利用焦点的位置和指定宽高比来生成一个剪切窗口。

然而,上述示例仅是示例性的,也可以从视频智能裁剪工具(诸如GoogleAutoflip)来获取将一个取向的视频转换为另一个取向的视频的剪切窗口信息。在从其他剪切工具或软件获得剪切信息后,可以按照上述类似的方式来获得每个帧的剪切窗口的中心位置、尺寸、宽高比等剪切信息。

图5是根据本公开实施例的标注区域的示意图。

参照图5,图5的(a)为第一视频的某一帧,图5的(b)示出了该帧中重要信息(例如运动信息)的标注区域,(b)中的白色区域为标注区域。然而,上述示例仅是示例性的,本公开不限于此。

图6是根据本公开实施例的调整信息权重的用户界面的示意图。在分析出一帧的各种信息后,可以相应地显示与各种信息相关联的用户界面。

参照图6,在用户界面601中,针对每种信息(诸如第一信息、第二信息等)可以配置有一个滑动条,该滑动条可以用于调整对应信息的权重。例如,可以将滑动条的范围设置为[0,1]。在针对每种信息设置相应权重后,点击“确定”按钮来完成对一帧中的各个信息流的权重的设置。例如,在点击“确定”按钮后,可以将用户输入的权重信息传输给电子设备的处理器,以进行后续的剪切转换。或者可以在点击“确定”按钮后,将相应的剪切窗口呈现在相应的帧上,以向用户展示剪切窗口在帧上的剪切位置。

然而,图6的用户界面仅是示例性的,用户界面中的元素也可以以其他形式展示。

可选地,可以针对每种信息配置一个文本输入框,用户可以通过文本输入框对相应信息赋予权重。然而,上述示例仅是示例性的,本公开不限于此。

用户界面可以显示在电子设备(诸如终端110或媒体服务器系统120)的显示器部分区域上,或者以全屏显示在显示器上,本领域技术人员可以根据实际需求进行显示设置。

根据本公开的实施例,在视频剪切处理前,允许用户调整每个帧的信息流权重,使得在剪切处理中保留用户定义的重要信息。

图7是根据本公开实施例的视频转换设备的框图。该视频转换设备700可以被实施为终端110或者被实施为媒体服务器系统120,或者任意其他的设备。

参照图7,视频转换设备700可以包括收发器701、显示器702和处理器703。

收发器701可以接收第一取向的第一视频。

处理器703可以使用视频智能裁剪工具(诸如Google Autoflip)来获取将一个取向的视频转换为另一个取向的视频的剪切窗口信息。可选地,处理器可以使用本公开实施例的用于获取剪切信息的算法(例如图4所示的方法)来获得用于将第一视频转换为第二取向的第二视频的剪切信息。

处理器703可以基于剪切信息生成并显示用于调整剪切信息的用户界面,并且控制显示器702显示该用户界面。例如,可以显示图3所示的用户界面。

用户界面可以包括与分析信息相关联的图形、文本、图标、视频及其它们的任意组合。当显示器702是触摸显示屏时,显示器702还具有采集在显示器702的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器703进行处理。此时,显示器702还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示器702可以为一个,设置在视频转换设备700的前面板;在另一些实施例中,显示器702可以为至少两个,分别设置在视频转换设备700的不同表面或呈折叠设计;在再一些实施例中,显示器702可以是柔性显示屏,设置在视频转换设备700的弯曲表面上或折叠面上。显示器702可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。然而,上述示例仅是示例性的,本公开不限于此。

处理器703可以控制收发器701经由用户界面接收用于调整剪切信息的用户输入,在剪切窗口调整后,处理器703可以自动对相关帧做剪切窗口的调整,以确保帧与帧之间的契合度。

作为示例,处理器703可以根据调整后的剪切信息自适应地对第一视频的剪切窗口进行调整,然后利用自适应调整后的剪切窗口对第一视频进行剪切以获得第二视频。在获得最终的第二视频后,可以经由收发器701向其他设备输出第二视频。

通过设置剪切后的视频帧的剪切窗口的调整选项,用户可以对最终剪切结果做进一步的调整。

根据本公开的实施例,不仅可以向用户提供视频剪切处理后的剪切区域调整的功能,还可以向用户提供视频剪切处理前的参数调整,让用户得到他们满意的剪切结果。

处理器703可以对第一视频的每个帧进行分析以确定每个帧的至少一种信息,并且基于分析结果生成针对每个帧的用于调整至少一种信息在视频取向转换时的权重的用户界面。例如,可以显示图6所示的用户界面。

处理器703可以控制收发器701通过图6的用户界面来接收用于调整每个帧的至少一种信息的权重的用户输入,基于权重被调整的至少一种信息来生成针对每个帧的剪切窗口信息。在生成每个帧的剪切窗口信息后,处理器703可以根据剪切窗口信息来生成用户界面,以向用户直观地显示每一帧是如何被剪切的。

在一种可能的实现方式中,处理器703可以基于对至少一种信息的分析来生成相应帧的与至少一种信息对应的各个标注区域,标注区域是表示信息分布的区域,其中,相应帧的各个标注区域被赋予由用户输入的权重。

在一种可能的实现方式中,对于第一视频的每个帧,处理器703可以根据权重被调整的各个标注区域来计算相应帧的整体标注区域,基于整体标注区域来计算相应帧的焦点,基于焦点和指定宽高比来生成相应帧的剪切窗口。此外,可以预先设置剪切窗口的尺寸,或可以自适应地调整剪切窗口的尺寸。

在一种可能的实现方式中,处理器703可以通过对每个帧的焦点进行拟合来获得相应帧的拟合后的焦点,然以基于拟合后的焦点和指定宽高比来生成相应帧的剪切窗口。

在一种可能的实现方式中,处理器可以基于整体标注区域来生成针对相应帧的标注图,并通过计算标注图的矩来获得相应帧的焦点。

在一些实施例中,视频转换设备700可以包括存储器,存储器可以存储原始输入视频和转换后的视频。此外,存储器可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器703运行。

在一些实施例中,视频转换设备700还可选包括有:外围设备接口和至少一个外围设备。处理器703和外围设备接口之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口相连。具体地,外围设备可以包括射频电路、触摸显示屏、摄像头、音频电路、定位组件和电源等中的至少一种。

在一些实施例中,视频转换设备700还可以包括有一个或多个传感器。该一个或多个传感器包括但不限于加速度传感器、陀螺仪传感器、压力传感器、指纹传感器、光学传感器以及接近传感器。例如,处理器703可以从一个或多个传感器接收取向变化的指示,从而向用户推荐相应取向的视频。

图8是根据本公开另一实施例的视频转换方法的流程图。

参照图8,在步骤S801,获取第一取向的第一视频。例如,第一取向的第一视频可以是横向视频。

在步骤S802,对第一视频的每个帧的至少一种信息进行分析。

这里,每个帧的至少一种信息可以包括关键区域信息,例如,可以包括人脸信息、人体信息、主要物体信息、运动场景信息和视频边界信息等中的至少一种。其中,人脸信息可以包括人脸识别信息和人脸跟踪信息等,主要物体信息可以包括物体识别信息和物体跟踪信息等。然而,上述示例仅是示例性的,本公开可以分析一帧中的任意数量和种类的信息。

可以预先存储针对主要信息、关键信息或用户感兴趣的信息的分析算法来实现对帧内包含的信息进行分析。例如,可以利用人脸识别算法来分析一帧中的人脸信息,可以利用光流算法来分析一帧中的运动场景信息。然而,上述示例仅是示例性的,本公开不限于此。

在步骤S803,基于对至少一种信息的分析来生成相应帧的与至少一种信息对应的各个标注区域。这里,标注区域可以指表示信息分布的区域。针对一帧,该帧可能包括多种信息,每分析该帧中的一种信息,可以生成该帧对应的一个信息分布图,相应地,如果分析一帧中的多种信息可以生成多个标注区域。

作为示例,在分析一帧中的人脸信息时,可以生成一个相对应这一帧的人脸信息的基于像素的标注区域(mask),然后可以将基于像素的标注区域转化为信息分布的标注区域。

在步骤S804,基于分析结果生成用于调整各个标注区域在视频剪切时所占权重的用户界面并且显示用户界面。用户界面可以包括针对至少一种信息中的每种信息的用于调整权重的滑动条或文本输入框。

在每分析完一帧内包含的信息,可以生成一个针对该帧的用户界面,该用户界面可以包括用于调整该帧中包含的信息的权重的用户接口。例如,用户界面可以包括用于调整每种信息的滑动条或文本输入框。然而,上述示例仅是示例性的,本公开不限于此。

在步骤S805,通过用户界面来接收用于调整各个标注区域的权重的用户输入。可以对相应帧的各个标注区域赋予由用户输入的权重。用户可以根据自己的需求通过用户界面来设置想要保留的信息的权重。例如,如果用户想重点保护人脸部分不被剪切掉,用户可以提高人脸信息的标注区域的加权比例,并且降低其他信息的标注区域的加权比例。用户可以互动地调节加权参数。通过对各个标注区域进行加权,可以突出用户更加关注的信息/区域。

这里,每种信息对应于一种信息标注区域,对每种信息加权可以解释为对信息标注区域的加权。

通过针对每一帧设置用户界面,可以实现用户对一帧中的各个信息流在后续剪切转换操作中的权重。

在步骤S806,对于第一视频的每个帧,根据权重被调整的各个标注区域来计算相应帧的整体标注区域。例如,可以对加权后的各个区域进行求和来获得一帧的整体标注区域。

在步骤S807,基于整体标注区域来生成针对相应帧的标注图。这里,标注图可以是针对各个标注区域的信息分布图像。

在步骤S808,通过计算标注图的矩来获得相应帧的焦点。这里,焦点可以反应一帧中的重要信息的分布状况。例如,可以计算标注图的几何中心点作为一帧的焦点。

在步骤S809,基于焦点和指定宽高比来生成相应帧的剪切窗口。例如,在获得一帧的焦点后,将该焦点作为剪切窗口的中心,并且按照指定宽高比来设置剪切窗口的布局和尺寸。这里,可以将第二视频的宽高比作为指定宽高比,然而本公开不限于此。

在一种可能的实现方式中,可以通过对每个帧的焦点进行拟合来获得相应帧的拟合后的焦点,并且基于拟合后的焦点和指定宽高比来生成相应帧的剪切窗口。通过根据当前场景的一些列帧的焦点,对当前场景剪切区域进行拟合来达到帧与帧之间的更加流畅的剪切效果。

在步骤S810,获取用于将第一视频转换为第二取向的第二视频的剪切信息。例如,在按照步骤S802至S809获得每个帧的剪切窗口信息后,获取全部帧的剪切窗口信息,以用于后续对剪切窗口的进一步调整。

在步骤S811,基于剪切信息生成并显示用于调整剪切信息的用户界面。在用户界面中,针对第一视频的一帧,在该帧上可以显示用于将该帧剪切为第二视频的对应帧的剪切窗口。例如,参照图3所示。

在步骤S812,经由用户界面接收用于调整剪切信息的用户输入。

在步骤S813,可以根据调整后的剪切信息自适应地对第一视频的剪切窗口进行调整。例如,在用户对视频帧进行进一步调整之后,可以对被进一步调整的剪切窗口进行拟合处理,使得最终呈现的视频更加流畅。

在步骤S814,利用自适应调整后的剪切窗口对第一视频进行剪切以获得进一步被调整后的第二视频。

根据本公开的实施例能够提供给用户视频剪切处理前的参数调整和处理后的剪切区域调整的功能,使得用户在视频剪切处理前后对整个剪切处理流程有更加全面的把握,并最终得到他满意的剪切结果。

图9是根据本公开实施例的视频转换装置的框图。

参照图9,视频转换装置900可以包括接口模块901、分析模块902、显示模块903以及编辑模块904。视频转换装置900中的每个模块可以由一个或多个模块来实现,并且对应模块的名称可根据模块的类型而变化。在各种实施例中,可以省略视频转换装置900中的一些模块,或者还可包括另外的模块。此外,根据本公开的各种实施例的模块/元件可以被组合以形成单个实体,并且因此可等效地执行相应模块/元件在组合之前的功能。

接口模块901可以被配置为接收第一取向的第一视频以及用户输入。

分析模块902可以被配置为对第一视频的每个帧进行分析以确定每个帧的至少一种信息,并且基于分析结果生成针对每个帧的用于调整至少一种信息在视频取向转换时的权重的用户界面。

在一种可能的实现方式中,至少一种信息可以包括关键区域信息。

在一种可能的实现方式中,关键区域信息可以包括人脸信息、人体信息、显要物体信息、运动场景信息和视频边界信息中的至少一种。

显示模块903可以被配置为显示用于调整至少一种信息的权重的用户界面。

在一种可能的实现方式中,用户界面可以包括针对至少一种信息中的每种信息的用于调整权重的用户接口。

编辑模块904可以被配置为基于权重被调整的至少一种信息来生成剪切窗口信息以对第一视频进行剪切,并且基于剪切后的第一视频生成第二取向的第二视频。

在一种可能的实现方式中,分析模块902可以基于对至少一种信息的分析来生成相应帧的与至少一种信息对应的各个标注区域,标注区域是表示信息分布的区域,其中,相应帧的各个标注区域被赋予由用户输入的权重。

在一种可能的实现方式中,对于第一视频的每个帧,编辑模块904可以根据权重被调整的各个标注区域来计算相应帧的整体标注区域;基于整体标注区域来计算相应帧的焦点,基于焦点和指定宽高比来生成相应帧的剪切窗口。

在一种可能的实现方式中,编辑模块904可以通过对每个帧的焦点进行拟合来获得相应帧的拟合后的焦点,并且基于拟合后的焦点和指定宽高比来生成相应帧的剪切窗口。

在一种可能的实现方式中,编辑模块904可以基于整体标注区域来生成针对相应帧的标注图,并通过计算标注图的矩来获得相应帧的焦点。

此外,视频转换装置900可以向用户提供视频剪切处理后的剪切区域调整的功能,让用户得到他们满意的剪切结果。

分析模块902可以获取用于将第一视频转换为第二取向的第二视频的剪切信息,并且基于剪切信息生成并显示用于调整剪切信息的用户界面。用于调整剪切信息的用户输入可以经由该用户界面被接收。

在一种可能的实现方式中,剪切信息可以包括用于将第一视频剪切为第二视频的剪切窗口。

在一种可能的实现方式中,针对第一视频的一帧,分析模块902可以使在该帧上显示用于将该帧剪切为第二视频的对应帧的剪切窗口。

作为示例,可以在对每一帧的各个信息的权重进行调整之后,根据调整后的各个信息来剪切视频,之后,可以再次将之前剪切处理后的剪切信息呈现给用户,使得用户可以对剪切后的视频再次进行剪切窗口的调整。可选地,可以在对每一帧的各个信息的权重进行调整之后,此时并不对视频进行剪切,而是将由根据调整后的各个信息产生的剪切信息通过用户界面呈现给用户,用户可以从整体来调整剪切窗口,然后使用最终调整好的剪切窗口进行剪切处理。

在一种可能的实现方式中,分析模块902可以确定第一视频的至少一个关键帧,并且生成并显示用于调整所述至少一个关键帧中的每个关键帧的剪切信息的用户界面。

在一种可能的实现方式中,编辑模块904可以根据调整后的剪切信息自适应地对第一视频的剪切窗口进行调整,并且利用自适应调整后的剪切窗口对第一视频进行剪切以获得第二视频。

本实施例的视频转换装置,通过采用上述模块实现视频转换的实现原理以及技术效果与上述相关方法实施例相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。

根据本公开的实施例,可以提供一种电子设备。图10是根据本公开实施例的电子设备的框图,该电子设备1000包括至少一个存储器1002和至少一个处理器1001,所述至少一个存储器1002中存储有计算机可以执行指令集合,当计算机可以执行指令集合被至少一个处理器1001执行时,执行根据本公开实施例的视频转换方法。

作为示例,电子设备1000可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里,电子设备1000并非必须是单个的电子设备,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备1000还可以是集成控制系统或系统管理器的一部分,或者可以被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子设备。

在电子设备1000中,处理器1001可以包括中央处理器(CPU)、图形处理器(GPU)、可以编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制,处理器1001还可以包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。

处理器1001可以运行存储在存储器中的指令或代码,其中,存储器还可以存储数据。指令和数据还可以经由网络接口装置而通过网络被发送和接收,其中,网络接口装置可以采用任何已知的传输协议。

存储器1002可以与处理器集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储器可以包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库系统可以使用的其他存储装置。存储器和处理器可以在操作上进行耦合,或者可以例如通过I/O端口、网络连接等互相通信,使得处理器能够读取存储在存储器中的文件。

此外,电子设备1000还可以包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。电子设备1000的所有组件可以经由总线和/或网络而彼此连接。

根据本公开的实施例,还可以提供一种存储指令的计算机可以读存储介质,其中,当指令被至少一个处理器运行时,促使至少一个处理器执行根据本公开的视频转换方法。这里的计算机可以读存储介质的示例包括:只读存储器(ROM)、随机存取可以编程只读存储器(PROM)、电可以擦除可以编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如,多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置,所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可以读存储介质中的计算机程序可以在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,此外,在一个示例中,计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上,使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。

根据本公开的实施例中,还可以提供一种计算机程序产品,该计算机程序产品中的指令可以由计算机设备的处理器执行以完成上述视频转换方法。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

相关技术
  • 视频转换方法、装置、系统及存储介质
  • 视频转换方法及装置和视频转换设备及存储介质
技术分类

06120112154073