掌桥专利:专业的专利平台
掌桥专利
首页

一种基于机器学习的风格化智能视频剪辑方法

文献发布时间:2023-06-19 09:43:16



技术领域

本发明涉及视频剪辑技术领域,具体来讲,涉及一种基于机器学习的风格化智能视频剪辑方法。

背景技术

随着5G技术与计算机算力的发展,视频剪辑行业的门槛已经大大降低。但是对于个人用户乃至剪辑师来说,剪辑过程繁琐且单调,往往需要从繁多的源素材中反复回看中寻找灵感。运用本方法的风格化智能剪辑技术,能够让零基础的用户收获似名家大师的剪辑作品,并能从风格模型中学习到更优的拍摄手法与技巧。与此同时,运用云计算大大减少了本地设备(如个人电脑,手机等)数据量的处理,不需要配置昂贵的设备,让更多的用户能够学习到剪辑的艺术,也极大地增加了本方法的实用性。

发明内容

本发明的目的在于提供一种风格化智能视频剪辑的方法,以解决上述背景技术中提到的问题或缺陷。

为实现上述目的,本发明提供一种风格化智能视频剪辑的方法,其方法步骤如下:

S1.将输入的特定风格的影视作品或用户输入剪辑作品传输到云服务器进行以下操作;

S2.进行目标物与场景的检测与识别,并分割每个对象组件,并使用标签列表对图像进行注释;

S3.运用机器学习提取目标特征物,并定义为特征参数;

S4.将视频的特征参数进行平均加权操作,最后集合为获得加权后的特征数据集,此数据集即为视频的风格模型;

S5.用户输入视频源素材并传输到云端,智能选取最佳风格模型,也可由用户手动选择风格模型;

S6.将源素材进行风格化模型的剪辑操作;

S7.将源素材的特征数据集与风格模型进行对比,给出指导性意见;

S8.输出经过风格化剪辑的影视作品以及对于视频源素材的拍摄指导意见。

作为优选,S2中,目标物与场景的检测与识别采用加权双向特征金字塔网络的EfficientDet算法。

作为优选,S3中,目标特征物是指,人物在视频中所占的时长比例,室内场景在视频中所占的时长比例,室外场景在视频中所占的时长比例,基础剪辑手段(如闪前闪回,离切跳切,淡入淡出,交叉剪辑等)出现的时长,时间区间与次数,特定色彩空间画面出现的时间区间等。

作为优选,S5中,智能选取最佳风格模型是指,提取其特征数据集与已学习的风格模型进行比较,采用多项式回归进行拟合,拟合效果最好的模型即为最佳风格模型。

作为优选,S7中,与风格模型进行对比是指,对比源素材特征数据集与风格模型进行参数阈值比较。

作为优选,S7中,给出指导性意见是指,对超出阈值范围的参数进行修正,并将修正值转换为指导性的文字和视频示例作为指导意见。

作为优选,以上所有步骤,所进行的操作均采用云端处理,在远程服务器上部署实施操作。

本发明的优势在于:

1.提高剪辑效率,运用目标物与场景的检测与识别,并分割每个对象组件,并使用标签列表对图像进行注释。

2.简化剪辑思路,运用机器学习提取目标特征物,计算出视频风格特征数据集,让新手也能输出似名师大家风格的剪辑作品。

3.反向指导摄影,通过对比名家大师的作品,找到自身的不足与缺陷,给出指导性的意见,让新手也能很快学习到剪辑知识,甚至可以拓展到教学领域。

4.弱化剪辑配置,运用云计算的优势,将大量的计算工作放到云端处理,提高剪辑效率与便捷性,增大了用户群体。

附图说明

图1为本发明的整体方法流程图,图2为本发明的核心功能组成图。

具体实施方式

为使本发明的上述功能与特点表述清晰,下面将结合本发明实施例中的附图,具体阐述实施步骤。所描述的实例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-2所示,本发明提供一种可实施技术方式:

本发明提供一种风格化智能视频剪辑的方法,其方法步骤如下:

S1.将输入的特定风格的影视作品或用户输入剪辑作品传输到云服务器进行以下操作;

S2.进行目标物与场景的检测与识别,并分割每个对象组件,并使用标签列表对图像进行注释;

S3.运用机器学习提取目标特征物,并定义为特征参数;

S4.将视频的特征参数进行平均加权操作,最后集合为获得加权后的特征数据集,此数据集即为视频的风格模型;

S5.用户输入视频源素材并传输到云端,智能选取最佳风格模型,也可由用户手动选择风格模型;

S6.将源素材进行风格化模型的剪辑操作;

S7.将源素材的特征数据集与风格模型进行对比,给出指导性意见;

S8.输出经过风格化剪辑的影视作品以及对于视频源素材的拍摄指导意见。

具体来讲,S2中,目标物与场景的检测与识别采用加权双向特征金字塔网络的EfficientDet算法。

具体来讲,S3中,目标特征物是指,人物在视频中所占的时长比例,室内场景在视频中所占的时长比例,室外场景在视频中所占的时长比例,基础剪辑手段(如闪前闪回,离切跳切,淡入淡出,交叉剪辑等)出现的时长,时间区间与次数,特定色彩空间画面出现的时间区间等。

具体来讲,S5中,智能选取最佳风格模型是指,提取其特征数据集与已学习的风格模型进行比较,采用多项式回归进行拟合,拟合效果最好的模型即为最佳风格模型。

具体来讲,S7中,与风格模型进行对比是指,对比源素材特征数据集与风格模型进行参数阈值比较。

具体来讲,S7中,给出指导性意见是指,对超出阈值范围的参数进行修正,并将修正值转换为指导性的文字和视频示例作为指导意见。

具体来讲,以上所有步骤,所进行的操作均采用云端处理,在远程服务器上部署实施操作。

相关技术
  • 一种基于机器学习的风格化智能视频剪辑方法
  • 一种基于人工智能的体育赛事视频剪辑方法和系统
技术分类

06120112277763