掌桥专利:专业的专利平台
掌桥专利
首页

基于车外景象的视频生成方法、系统、设备及介质

文献发布时间:2023-06-19 18:32:25


基于车外景象的视频生成方法、系统、设备及介质

技术领域

本申请涉及电子设备技术领域,具体涉及一种基于车外景象的视频生成方法、系统、设备及介质。

背景技术

在车辆的行进过程中,偶尔会遇上令驾驶员、乘客等车内人员感兴趣,想要拍摄下来的美好风景。

但是,对于驾驶员而言,在驾车时使用手机、相机等摄像装置是十分危险的操作,这种操作违反道路交通法规,对行人和其他车辆带来极大危险。此外,虽然乘坐的乘客可以使用手机,但是在行车的过程中,景物稍纵即逝,乘客可能还来不及掏出手机或者相机,就已经错过。这导致驾驶员或者乘客难以拍摄下行车途中碰到的值得记录的时刻,难以和不在场的家人朋友进行分享。

发明内容

本申请的一个目的在于提供一种基于车外景象的视频生成方法、系统、设备及介质,以期提高视频生成的高效性和便捷性。

本申请的一个目的在于提供一种基于车外景象的视频生成方法,其优势在于,获取行车过程中拍摄的影像信息,识别所述影像信息,确定目标景象,根据所述目标景象,确定待处理影像片段,对所述待处理影像片段进行分析处理,从而生成目标视频,以期达到高效便捷生成视频的目的。

本申请的另一个目的在于提供一种基于车外景象的视频生成方法,其优势在于,通过互联网平台资源摄取或者采用大量人工录入的方式对景象进行标注,确定所述景象对应的关键字标签,根据所述景象和所述关键字标签,生成景象数据库,以避免出现景象识别错误的问题,有利于提高景象识别的准确性。

本申请的另一个目的在于提供一种基于车外景象的视频生成方法,其优势在于,查询所述景象数据库,对所述影像信息进行匹配,确定所述影像信息中的景象,根据预设的关键度打分模型,对所述景象进行关键度打分,其中,所述关键度打分模型包括根据目标识别算法、景象相对位置和景象出现时长对所述景象一一进行打分,根据所述关键度打分的打分结果,确定所述景象中关键分高于第一阈值的景象为目标景象,有利于准确识别景象信息,有利于提高视频生成的准确性。

本申请的另一个目的在于提供一种基于车外景象的视频生成方法,其优势在于,查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息,根据所述时间戳信息,通过视线追踪算法,获取目标人员对所述目标景象的兴趣值,若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段,通过视线追踪那个算法从而准确获取目标人员感兴趣的影像片段,以期达到提高视频生成准确性的目的。

本申请的另一个目的在于提供一种基于车外景象的视频生成方法,其优势在于,查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息,获取目标人员在所述出现时间内的姿态信息,根据所述姿态信息和所述时间戳信息,确定所述目标人员对所述目标景象的兴趣值,若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段,通过姿态信息确定兴趣值以便提高影像片段确定的高效性,以避免误生成视频造成冗余的问题。

本申请的另一个目的-在于提供一种基于车外景象的视频生成方法,其优势在于,查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息,获取目标人员在所述出现时间内的语音信息,根据所述语音信息和所述时间戳信息,通过语音识别算法确定所述目标人员对所述目标景象的兴趣值,若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段,以便通过语音直接确定影像片段,以减少目标人员的手动操作行为,有利于提高视频生成的高效性。

为实现上述目的,

第一方面,本申请实施例提供一种基于车外景象的视频生成方法,所述方法包括以下步骤:

获取行车过程中拍摄的影像信息;

识别所述影像信息,确定目标景象;

根据所述目标景象,确定待处理影像片段;

对所述待处理影像片段进行分析处理,生成目标视频。

第二方面,本申请实施例提供一种基于车外景象的视频生成系统,所述车辆唤醒系统包括:处理器,存储器,通信单元;所述处理器与所述存储器、所述通信单元建立通信连接;

处理器,与所述通信单元通信,执行下述存储器存储的指令;

所述通信单元,获取行车过程中拍摄的影像信息;

所述存储器被配置成存储指令,当所述指令被所述处理器执行时,使所述处理器执行步骤,所述步骤包括:

识别所述影像信息,确定目标景象;根据所述目标景象,确定待处理影像片段;对所述待处理影像片段进行分析处理,生成目标视频。

第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。

第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第二方面任一方法中所描述的部分或全部步骤。

第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第二方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

可以看出,本申请实施例中,提供了一种基于车外景象的视频生成方法、系统、电子设备和计算机存储介质,所述方法包括首先获取行车过程中拍摄的影像信息,然后识别所述影像信息,确定目标景象,接着根据所述目标景象,确定待处理影像片段,然后再对所述待处理影像片段进行分析处理,生成目标视频;可见,当目标人员在车辆行进过程中遇到感兴趣的景象时,通过分析处理影像片段生成目标视频,有利于实现在驾驶过程中自动拍摄生成美景视频,无需目标人员手动操作,有利于提高车外美景视频生成的安全性和趣味性,有利于提高视频生成的高效性和便捷性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种基于车外景象的视频生成方法的流程示意图;

图2是本申请实施例提供的另一种基于车外景象的视频生成方法的流程示意图;

图3是本申请实施例提供的另一种基于车外景象的视频生成方法的流程示意图;

图4是本申请实施例提供的一种基于车外景象的视频生成系统的示意图;

图5是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

本申请实施例所涉及到的电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminaldevice)等等。

下面对本申请实施例进行详细介绍。

请参阅图1,图1是本申请实施例提供了一种基于车外景象的视频生成方法的流程示意图,所述方法包括:

S101,电子设备获取行车过程中拍摄的影像信息;

其中,所述行车过程中拍摄影像时可以根据目标人员的手势、注视点调整拍摄位置,从而获得关键影像。

S102,所述电子设备识别所述影像信息,确定目标景象;

其中,所述影像信息包括多帧连续的图像信息,所述图像信息中包括目标景象。

其中,所述目标景象与关键字标签相关联,存储在景象数据库中。

S103,所述电子设备根据所述目标景象,确定待处理影像片段;

其中,所述待处理影像片段为所述影像信息中的一段或多段影像信息。

S104,所述电子设备对所述待处理影像片段进行分析处理,生成目标视频。

其中,所述目标视频包括画面信息、音乐信息和文字信息。

可以看出,本申请实施例中,提供了一种基于车外景象的视频生成方法、系统、电子设备和计算机存储介质,所述方法包括首先获取行车过程中拍摄的影像信息,然后识别所述影像信息,确定目标景象,接着根据所述目标景象,确定待处理影像片段,然后再对所述待处理影像片段进行分析处理,生成目标视频;可见,当目标人员在车辆行进过程中遇到感兴趣的景象时,通过分析处理影像片段生成目标视频,有利于实现在驾驶过程中自动拍摄生成美景视频,无需目标人员手动操作,有利于提高车外美景视频生成的安全性和趣味性,有利于提高视频生成的高效性和便捷性。

在一个可能的示例中,所述电子设备在所述获取行车过程中拍摄的影像信息之前,包括:电子设备通过互联网平台资源摄取或者采用大量人工录入的方式对景象进行标注,确定所述景象对应的关键字标签;所述电子设备根据所述景象和所述关键字标签,生成景象数据库。

其中,所述景象数据库根据预设时间进行定时更新,以确保所述景象数据库的准确性。

其中,所述景象数据库中的景象与关键字标签相关联,以景象为查询标识,查询预设的映射关系,获取所述景象对应的关键字标签,所述映射关系包括景象和关键字标签之间的对应关系。

具体实现中,电子设备通过互联网平台资源摄取和智能学习对景象进行标注,确定所述景象对应的关键字标签如花朵、烟花、溪流等,所述电子设备将根据确定的景象和关键字标签,将景象和关键字标签进行关联,生成景象数据库。

可见,本示例中,通过互联网平台资源摄取或者采用大量人工录入的方式对景象进行标注,进而建立景象数据库,有利于提高目标景象确定的准确性和高效性。

在一个可能的示例中,所述电子设备识别所述影像信息,确定目标景象,包括:电子设备查询所述景象数据库,对所述影像信息进行匹配,确定所述影像信息中的景象;所述电子设备根据预设的关键度打分模型,对所述景象进行关键度打分;所述电子设备根据所述关键度打分的打分结果,确定所述景象中关键分高于第一阈值的景象为目标景象。

其中,所述第一阈值包括预先设置的分数阈值。

其中,所述关键度打分模型包括根据目标识别算法、景象相对位置和景象出现时长对所述景象一一进行打分。

具体地,所述关键度打分模型包括:根据目标识别算法确定一级景象集合;获取所述一级景象集合中每一所述一级景象对应的景象相对位置和景象出现时长;根据所述景象相对位置、景象出现时长和预设公式,确定所述景象的关键度打分结果。

具体地,所述预设公式包括P=xt,x代表景象相对位置对应的位置分数,t代表景象出现时长,P代表所述景象的关键度得分。

具体地,所述位置分数包括所述景象越靠近影像画面的中心位置,则位置分数越高。

具体实现中,电子设备查询所述景象数据库,对所述影像信息进行匹配,确定所述影像信息中的景象包括“云彩”、“树木”,所述电子设备根据预设的关键度打分模型,对所述景象进行关键度打分,确定“云彩”得分60,“树木”得分20,所述电子设备根据所述关键度打分的打分结果,确定所述景象中关键分高于第一阈值的景象“云彩”为目标景象。

可见,本示例中,通过关键度打分模型量化景象关键度,有利于提高目标景象确定的准确性和便捷性,进而有利于提高视频生成的准确性。

在一个可能的示例中,所述电子设备根据所述目标景象,确定待处理影像片段,包括:电子设备查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;所述电子设备根据所述时间戳信息,通过视线追踪算法,获取目标人员对所述目标景象的兴趣值;所述电子设备若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

其中,所述视线追踪算法包括根据所述目标人员的视线移动信息,确定所述目标人员视线停留时间与所述目标景象之间的关系,进而确定所述目标人员对所述目标景象的兴趣值。

具体实现中,电子设备查询所述目标景象“云彩”的出现时间35分钟,确定所述目标景象对应的时间戳信息“16:02-16:37”,所述电子设备根据所述时间戳信息,通过视线追踪算法,发现目标人员视线停留在“云彩”的时长共计10分钟,确定目标人员对所述目标景象的兴趣值为70,所述电子设备确定所述兴趣值70大于第一兴趣阈值,进而确定所述目标景象“云彩”对应的影像片段为待处理影像片段。

可见,本示例中,通过视线追踪算法获取目标人员对所述目标景象的兴趣值,有利于提高判断目标人员对目标景象兴趣值的高效性,有利于提高视频生成的准确性和高效性。

在一个可能的示例中,所述电子设备根据所述目标景象,确定待处理影像片段,包括:电子设备查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;所述电子设备获取目标人员在所述出现时间内的姿态信息;所述电子设备根据所述姿态信息和所述时间戳信息,确定所述目标人员对所述目标景象的兴趣值;所述电子设备若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

其中,所述根据所述姿态信息和所述时间戳信息,确定所述目标人员对所述目标景象的兴趣值时,方法还包括:若能够识别所述目标人员的视线,则根据视线追踪算法、所述姿态信息和所述时间戳信息确定所述目标人员对所述目标景象的兴趣值。

其中,所述所述目标景象的出现时间越长,所述目标景象的兴趣值越大。

其中,所述姿态信息包括面部表情信息和手势信息。

具体实现中,电子设备查询所述目标景象“云彩”的出现时间35分钟,确定所述目标景象对应的时间戳信息“16:02-16:37”;所述电子设备获取目标人员在所述出现时间内的姿态信息,发现目标人员分别在16:10、16:23时指向目标景象,16:24时面部表情较愉悦,所述电子设备根据所述姿态信息和所述时间戳信息,确定所述目标人员对所述目标景象的兴趣值为70;所述电子设备确定所述兴趣值大于第一兴趣阈值,确定所述目标景象“云彩”对应的影像片段为待处理影像片段。

可见,本示例中,在所述目标人员佩戴眼部遮挡物,如蓝光眼镜、墨镜时,通过姿态信息确定兴趣值,有利于在无法追踪所述目标人员视线时确定兴趣值,有利于提高多样化场景中视频生成的高效性。

在一个可能的示例中,所述电子设备根据所述目标景象,确定待处理影像片段,包括:电子设备查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;所述电子设备获取目标人员在所述出现时间内的语音信息;所述电子设备根据所述语音信息和所述时间戳信息,通过语音识别算法确定所述目标人员对所述目标景象的兴趣值;所述电子设备若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

其中,所述语音信息包括所述目标人员与车内人员的对话语音、所述目标人员使用通信设备时提及关于景象话题时的通信语音。

具体实现中,电子设备查询所述目标景象“月亮”的出现时间为62分钟,确定所述目标景象对应的时间戳信息“20:05-20:52”和“21:46-22:01”,此时为夜晚行车,车内光线较弱,所述电子设备获取目标人员在所述出现时间内的语音信息,所述电子设备根据所述语音信息和所述时间戳信息,通过语音识别算法确定所述目标人员对所述目标景象“月亮”的兴趣值为80;所述电子设备若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

可见,本示例中,充分考虑了车内光线较弱的场景,有利于满足多场景确定兴趣值,以及提高兴趣值确定的准确度,进而有利于提高视频生成的高效性。

在一个可能的示例中,所述电子设备目标景象对应的影像片段,包括:电子设备确定由每一所述目标景象对应的多个时间戳信息组成的时间戳信息集合;所述电子设备根据所述时间戳信息集合,确定所述目标景象对应的多个所述时间戳信息之间的时间间隔;所述电子设备根据所述时间间隔和所述兴趣值,确定所述目标景象对应的影像片段。

其中,所述时间戳信息集合与所述目标景象存在映射关系,所述时间戳信息集合与所述目标景象一一对应。

其中,所述根据所述时间间隔和所述兴趣值,确定所述目标景象对应的影像片段包括:根据所述兴趣值确定所述目标影像对应的影像片段时长阈值;若确定所述目标景象对应的多个所述时间戳信息之间的时间间隔小于第二阈值,则确定初始时间戳到结束时间戳之间的影像片段组成影像片段;若确定所述目标景象对应的多个所述时间戳信息之间的时间间隔大于第二阈值,则确定每一所述时间戳信息一定时间内的影像片段分别组成多个影像片段。

具体地,所述影像片段时长阈值大于或等于所述初始时间戳到结束时间戳之间的时间,和/或所述一定时间。

具体实现中,电子设备确定所述目标景象“月亮”对应的时间戳信息“20:05-20:52”和“21:46-22:01”组成的时间戳信息集合;所述电子设备根据所述时间戳信息集合,确定所述目标景象“月亮”对应的多个所述时间戳信息之间的时间间隔为54分钟;确定所述目标景象“月亮”对应的多个所述时间戳信息之间的时间间隔大于第二阈值,所述电子设备确定“20:15-20:37”的影像片段组成影像片段1,“21:47-22:00”的影像片段组成影像片段2。

可见,本示例中,根据时间间隔和兴趣值确定影像片段,有利于提高影像片段与目标人员兴趣值之间的关联度,有利于提高视频生成的准确性。

在一个可能的示例中,所述电子设备对所述待处理影像片段进行分析处理,生成目标视频,包括:电子设备根据所述待处理影像片段中的所述目标景象,查询所述景象数据库,确定目标关键字;所述电子设备获取所述待处理影像片段的片段时长;所述电子设备通过所述姿态信息和所述语音识别算法,确定所述待处理影像片段的情绪分类;所述电子设备根据所述目标关键字、所述片段时长和所述情绪分类,确定所述待处理影像片段的音乐信息和文字信息;所述电子设备根据所述音乐信息和所述文字信息生成目标视频。

其中,所述目标关键字包括所述待处理影像片段中每一所述目标景象对应的关键字标签。

具体实现中,电子设备根据所述待处理影像片段中的所述目标景象“月亮”,查询所述景象数据库,确定目标关键字;所述电子设备获取所述待处理影像片段的片段时长3分钟,接着所述电子设备通过所述姿态信息和所述语音识别算法,确定所述待处理影像片段的情绪分类为“思念”,所述电子设备根据所述目标关键字、所述片段时长和所述情绪分类,确定所述待处理影像片段的音乐信息为舒缓音乐1,确定文字信息为“春江潮水连海平,海上明月共潮生”;所述电子设备根据所述音乐信息和所述文字信息生成目标视频。

可见,本示例中,根据行驶过程中的景物生成视频,有利于提高视频生成的高效性,方便目标人员分享行车过程中的景象。

与上述图1所示的实施例一致的,请参阅图2,图2是本申请实施例提供的另一种基于车外景象的视频生成方法的流程示意图;如图所示,本基于车外景象的视频生成方法包括:

S201,电子设备通过互联网平台资源摄取或者采用大量人工录入的方式对景象进行标注,确定所述景象对应的关键字标签;

S202,所述电子设备根据所述景象和所述关键字标签,生成景象数据库;

S203,所述电子设备获取行车过程中拍摄的影像信息;

S204,所述电子设备查询所述景象数据库,对所述影像信息进行匹配,确定所述影像信息中的景象;

S205,所述电子设备根据预设的关键度打分模型,对所述景象进行关键度打分;

S206,所述电子设备根据所述关键度打分的打分结果,确定所述景象中关键分高于第一阈值的景象为目标景象;

S207,所述电子设备根据所述目标景象,确定待处理影像片段;

S208,所述电子设备对所述待处理影像片段进行分析处理,生成目标视频。可以看出,本申请实施例中,提供了一种基于车外景象的视频生成方法、系统、电子设备和计算机存储介质,所述方法包括首先获取行车过程中拍摄的影像信息,然后识别所述影像信息,确定目标景象,接着根据所述目标景象,确定待处理影像片段,然后再对所述待处理影像片段进行分析处理,生成目标视频;可见,当目标人员在车辆行进过程中遇到感兴趣的景象时,通过分析处理影像片段生成目标视频,有利于实现在驾驶过程中自动拍摄生成美景视频,无需目标人员手动操作,有利于提高车外美景视频生成的安全性和趣味性,有利于提高视频生成的高效性和便捷性。

此外,通过互联网平台资源摄取或者采用大量人工录入的方式对景象进行标注,进而建立景象数据库,进一步采用关键度打分模型量化景象关键度,有利于提高目标景象确定的准确性和便捷性,进而有利于提高视频生成的准确性。

与上述图1所示的实施例一致的,请参阅图3,图3是本申请实施例提供的另一种基于车外景象的视频生成方法的流程示意图;如图所示,本基于车外景象的视频生成方法包括:

S301,电子设备通过互联网平台资源摄取或者采用大量人工录入的方式对景象进行标注,确定所述景象对应的关键字标签;

S302,所述电子设备根据所述景象和所述关键字标签,生成景象数据库;

S303,所述电子设备获取行车过程中拍摄的影像信息;

S304,所述电子设备查询所述景象数据库,对所述影像信息进行匹配,确定所述影像信息中的景象;

S305,所述电子设备根据预设的关键度打分模型,对所述景象进行关键度打分;

S306,所述电子设备根据所述关键度打分的打分结果,确定所述景象中关键分高于第一阈值的景象为目标景象;

S307,所述电子设备查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;

S308,所述电子设备根据所述时间戳信息,通过视线追踪算法,获取目标人员对所述目标景象的兴趣值;

S309,所述电子设备若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段;

S310,所述电子设备对所述待处理影像片段进行分析处理,生成目标视频。

可以看出,本申请实施例中,提供了一种基于车外景象的视频生成方法、系统、电子设备和计算机存储介质,所述方法包括首先获取行车过程中拍摄的影像信息,然后识别所述影像信息,确定目标景象,接着根据所述目标景象,确定待处理影像片段,然后再对所述待处理影像片段进行分析处理,生成目标视频;可见,当目标人员在车辆行进过程中遇到感兴趣的景象时,通过分析处理影像片段生成目标视频,有利于实现在驾驶过程中自动拍摄生成美景视频,无需目标人员手动操作,有利于提高车外美景视频生成的安全性和趣味性,有利于提高视频生成的高效性和便捷性。

此外,通过视线追踪算法获取目标人员对所述目标景象的兴趣值,有利于提高判断目标人员对目标景象兴趣值的高效性,有利于提高视频生成的准确性和高效性。

与上述图1、图2、图3所示的实施例一致的,请参阅图4,图4是本申请实施例中所涉及的基于车外景象的视频生成系统400的示意图。该基于车外景象的视频生成系统400应用于电子设备;所述基于车外景象的视频生成系统400包括:处理器401,存储器402,通信单元403;所述处理器401与所述存储器402、所述通信单元403建立通信连接;

所述处理器401,与所述通信单元403通信,执行下述存储器402存储的指令;

所述通信单元403,获取行车过程中拍摄的影像信息;

所述存储器402被配置成存储指令,当所述指令被所述处理器401执行时,使所述处理器401执行步骤,所述步骤包括:

识别所述影像信息,确定目标景象;根据所述目标景象,确定待处理影像片段;对所述待处理影像片段进行分析处理,生成目标视频。

可以看出,本申请实施例中,提供了一种基于车外景象的视频生成方法、系统、电子设备和计算机存储介质,所述方法包括首先获取行车过程中拍摄的影像信息,然后识别所述影像信息,确定目标景象,接着根据所述目标景象,确定待处理影像片段,然后再对所述待处理影像片段进行分析处理,生成目标视频;可见,当目标人员在车辆行进过程中遇到感兴趣的景象时,通过分析处理影像片段生成目标视频,有利于实现在驾驶过程中自动拍摄生成美景视频,无需目标人员手动操作,有利于提高车外美景视频生成的安全性和趣味性,有利于提高视频生成的高效性和便捷性。

在一个可能的示例中,在所述获取行车过程中拍摄的影像信息之前,所述处理器401具体用于执行以下步骤:通过互联网平台资源摄取或者采用大量人工录入的方式对景象进行标注,确定所述景象对应的关键字标签;根据所述景象和所述关键字标签,生成景象数据库。

在一个可能的示例中,所述识别所述影像信息,确定目标景象,所述处理器401具体用于执行以下步骤:查询所述景象数据库,对所述影像信息进行匹配,确定所述影像信息中的景象;根据预设的关键度打分模型,对所述景象进行关键度打分,其中,所述关键度打分模型包括根据目标识别算法、景象相对位置和景象出现时长对所述景象一一进行打分;根据所述关键度打分的打分结果,确定所述景象中关键分高于第一阈值的景象为目标景象。

在一个可能的示例中,所述根据所述目标景象,确定待处理影像片段,所述处理器401具体用于执行以下步骤:查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;根据所述时间戳信息,通过视线追踪算法,获取目标人员对所述目标景象的兴趣值;若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

在一个可能的示例中,所述根据所述目标景象,确定待处理影像片段,所述处理器401具体用于执行以下步骤:查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;获取目标人员在所述出现时间内的姿态信息,其中,所述姿态信息包括面部表情信息和手势信息;根据所述姿态信息和所述时间戳信息,确定所述目标人员对所述目标景象的兴趣值;若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

在一个可能的示例中,所述根据所述目标景象,确定待处理影像片段,所述处理器401具体用于执行以下步骤:查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;获取目标人员在所述出现时间内的语音信息;根据所述语音信息和所述时间戳信息,通过语音识别算法确定所述目标人员对所述目标景象的兴趣值;若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

在一个可能的示例中,所述目标景象对应的影像片段,所述处理器401具体用于执行以下步骤:确定由每一所述目标景象对应的多个时间戳信息组成的时间戳信息集合,其中,所述时间戳信息集合与所述目标景象存在映射关系,所述时间戳信息集合与所述目标景象一一对应;根据所述时间戳信息集合,确定所述目标景象对应的多个所述时间戳信息之间的时间间隔;根据所述时间间隔和所述兴趣值,确定所述目标景象对应的影像片段。

在一个可能的示例中,所述对所述待处理影像片段进行分析处理,生成目标视频,所述处理器401具体用于执行以下步骤:根据所述待处理影像片段中的所述目标景象,查询所述景象数据库,确定目标关键字,其中,所述目标关键字包括所述待处理影像片段中每一所述目标景象对应的关键字标签;获取所述待处理影像片段的片段时长;通过所述姿态信息和所述语音识别算法,确定所述待处理影像片段的情绪分类;根据所述目标关键字、所述片段时长和所述情绪分类,确定所述待处理影像片段的音乐信息和文字信息;根据所述音乐信息和所述文字信息生成目标视频。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

与上述图1、图2、图3所示的实施例一致的,请参阅图5,图5是本申请实施例提供的一种电子设备500的结构示意图,如图所示,所述电子设备500包括处理器510、存储器520、通信接口530以及一个或多个程序521,其中,所述一个或多个程序521被存储在上述存储器520中,并且被配置由上述处理器510执行,所述一个或多个程序521包括用于执行以下步骤的指令;

获取行车过程中拍摄的影像信息;

识别所述影像信息,确定目标景象;

根据所述目标景象,确定待处理影像片段;

对所述待处理影像片段进行分析处理,生成目标视频。

可以看出,本申请实施例中,提供了一种基于车外景象的视频生成方法、系统、电子设备和计算机存储介质,所述方法包括首先获取行车过程中拍摄的影像信息,然后识别所述影像信息,确定目标景象,接着根据所述目标景象,确定待处理影像片段,然后再对所述待处理影像片段进行分析处理,生成目标视频;可见,当目标人员在车辆行进过程中遇到感兴趣的景象时,通过分析处理影像片段生成目标视频,有利于实现在驾驶过程中自动拍摄生成美景视频,无需目标人员手动操作,有利于提高车外美景视频生成的安全性和趣味性,有利于提高视频生成的高效性和便捷性。

在一个可能的示例中,在所述获取行车过程中拍摄的影像信息之前,所述程序中的指令具体用于执行以下操作:通过互联网平台资源摄取或者采用大量人工录入的方式对景象进行标注,确定所述景象对应的关键字标签;根据所述景象和所述关键字标签,生成景象数据库。

在一个可能的示例中,所述识别所述影像信息,确定目标景象,所述程序中的指令具体用于执行以下操作:查询所述景象数据库,对所述影像信息进行匹配,确定所述影像信息中的景象;根据预设的关键度打分模型,对所述景象进行关键度打分,其中,所述关键度打分模型包括根据目标识别算法、景象相对位置和景象出现时长对所述景象一一进行打分;根据所述关键度打分的打分结果,确定所述景象中关键分高于第一阈值的景象为目标景象。

在一个可能的示例中,所述根据所述目标景象,确定待处理影像片段,所述程序中的指令具体用于执行以下操作:查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;根据所述时间戳信息,通过视线追踪算法,获取目标人员对所述目标景象的兴趣值;若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

在一个可能的示例中,所述根据所述目标景象,确定待处理影像片段,所述程序中的指令具体用于执行以下操作:查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;获取目标人员在所述出现时间内的姿态信息,其中,所述姿态信息包括面部表情信息和手势信息;根据所述姿态信息和所述时间戳信息,确定所述目标人员对所述目标景象的兴趣值;若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

在一个可能的示例中,所述根据所述目标景象,确定待处理影像片段,所述程序中的指令具体用于执行以下操作:查询所述目标景象的出现时间,确定所述目标景象对应的时间戳信息;获取目标人员在所述出现时间内的语音信息;根据所述语音信息和所述时间戳信息,通过语音识别算法确定所述目标人员对所述目标景象的兴趣值;若确定所述兴趣值大于第一兴趣阈值,则确定所述目标景象对应的影像片段为待处理影像片段。

在一个可能的示例中,所述目标景象对应的影像片段,所述程序中的指令具体用于执行以下操作:确定由每一所述目标景象对应的多个时间戳信息组成的时间戳信息集合,其中,所述时间戳信息集合与所述目标景象存在映射关系,所述时间戳信息集合与所述目标景象一一对应;根据所述时间戳信息集合,确定所述目标景象对应的多个所述时间戳信息之间的时间间隔;根据所述时间间隔和所述兴趣值,确定所述目标景象对应的影像片段。

在一个可能的示例中,所述对所述待处理影像片段进行分析处理,生成目标视频,所述程序中的指令具体用于执行以下操作:根据所述待处理影像片段中的所述目标景象,查询所述景象数据库,确定目标关键字,其中,所述目标关键字包括所述待处理影像片段中每一所述目标景象对应的关键字标签;获取所述待处理影像片段的片段时长;通过所述姿态信息和所述语音识别算法,确定所述待处理影像片段的情绪分类;根据所述目标关键字、所述片段时长和所述情绪分类,确定所述待处理影像片段的音乐信息和文字信息;根据所述音乐信息和所述文字信息生成目标视频。

本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。

本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 直播视频的生成发布方法、存储介质、电子设备及系统
  • 基于神经网络的视频描述生成方法、存储介质及终端设备
  • 基于文本的视频生成方法、装置、计算机设备及存储介质
  • 视频生成、视频播放方法、装置、电子设备及存储介质
  • 基于视频的目标探测追踪方法、系统、介质及设备
  • 基于仿射变换的视频生成方法、系统、电子设备和介质
  • 基于在线教育的视频生成方法、系统、设备及存储介质
技术分类

06120115602867