掌桥专利:专业的专利平台
掌桥专利
首页

目标烹饪视频的生成方法、装置、存储介质及电子装置

文献发布时间:2023-06-19 19:30:30


目标烹饪视频的生成方法、装置、存储介质及电子装置

技术领域

本申请涉及智慧家庭技术领域,具体而言,涉及一种目标烹饪视频的生成方法、装置、存储介质及电子装置。

背景技术

目前,随着智能家电设备的智能化水平不断提高,用户对智能家电设备的要求也越来越高,例如,用户希望将自己的烹饪过程录制成具有解说的烹饪教程。然而,相关技术中,智能家电设备只能录制用户的烹饪过程,无法提供用户的烹饪过程对应的解说过程,因此,在烹饪场景下,存在如何生成具有解说音频的烹饪视频的技术问题。

针对相关技术中,如何生成具有解说音频的烹饪视频的技术问题,尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种目标烹饪视频的生成方法、装置、存储介质及电子装置,以至少解决相关技术中,如何生成具有解说音频的烹饪视频的技术问题。

根据本申请实施例的一个实施例,提供了一种目标烹饪视频的生成方法,包括:对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

在一个示例性实施例中,在基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本之前,所述方法还包括:根据所述烹饪设备的设备类型确定所述烹饪设备是否预置有传感器;在确定所述烹饪设备预置有传感器的情况下,将所述传感器的传感器数据确定为所述烹饪设备的设备数据;在确定所述烹饪设备未预置有传感器的情况下,使用处于所述烹饪设备的预设范围内的监测设备对所述烹饪设备进行监测,将监测所述烹饪设备得到的监测数据确定为所述烹饪设备的设备数据。

在一个示例性实施例中,基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本,包括:在确定所述烹饪动作包括对所述烹饪食材进行处理的动作的情况下,获取所述烹饪动作对应的第一烹饪事件和所述烹饪食材对应的第二烹饪事件;在确定所述第一烹饪事件和所述第二烹饪事件均指示同一烹饪流程的情况下,将所述烹饪动作对应的第一预设文本和所述烹饪食材对应的第二预设文本进行合并,得到第一合并结果;获取属于所述同一烹饪流程的所述音频信号对应的第三预设文本和所述烹饪设备的设备数据对应的第四预设文本;根据所述第一合并结果,所述第三预设文本和所述第四预设文本生成所述烹饪过程的描述文本。

在一个示例性实施例中,基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本,包括:在确定所述烹饪动作包括对所述烹饪设备进行操作的动作的情况下,获取所述烹饪动作对应的第一烹饪事件,所述音频信号对应的第三烹饪事件和所述烹饪设备的设备数据对应的第四烹饪事件;在确定所述第一烹饪事件,所述第三烹饪事件和所述第四烹饪事件均指示同一烹饪流程的情况下,将所述烹饪动作对应的第一预设文本,所述音频信号对应的第三预设文本和所述烹饪设备的设备数据对应的第四预设文本进行合并,得到第二合并结果;获取属于所述同一烹饪流程的所述烹饪食材对应的第二预设文本;根据所述第二合并结果和所述第二预设文本生成所述烹饪过程的描述文本。

在一个示例性实施例中,在基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本的过程中,所述方法还包括:获取不同烹饪动作之间的间隔时间;在确定所述间隔时间大于第一预设值的情况下,在所述不同的烹饪动作切换时,在所述描述文本中增加不同烹饪动作之间的关联词。

在一个示例性实施例中,根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频,包括:对所述烹饪解说音频进行解析,得到所述烹饪解说音频的第一关键字,其中,所述第一关键字指示所述烹饪过程的第五烹饪事件;获取所述初始烹饪视频的烹饪动作对应的第二关键字,其中,所述第二关键字表示所述烹饪过程的第六烹饪事件;在确定所述第一关键字和所述第二关键字指示同一烹饪事件的情况下,根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

在一个示例性实施例中,在根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频的过程中,所述方法还包括:获取所述初始烹饪视频中除了所述目标对象的烹饪动作之外的其他动作;在确定所述目标对象从所述烹饪动作切换至所述其他动作的情况下,获取所述目标对象从所述烹饪动作切换为所述其他动作后的持续时长;在确定所述持续时长大于第二预设值的情况下,停止采集用户的初始烹饪视频。

根据本申请实施例的另一个实施例,还提供了一种目标烹饪视频的生成装置,包括:解析模块,用于对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取模块,用于获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;第一生成模块,用于基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;第二生成模块,用于根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述目标烹饪视频的生成方法。

根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的目标烹饪视频的生成方法。

在本申请实施例中,对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频;采用上述技术方案,解决了如何生成具有解说音频的烹饪视频的技术问题,进而实现了生成具有解说音频的烹饪视频的目的。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例的一种目标烹饪视频的生成方法的硬件环境示意图;

图2是根据本申请实施例的目标烹饪视频的生成方法的流程图;

图3是根据本申请实施例的目标烹饪视频的生成方法的示意图;

图4是根据本申请实施例的一种目标烹饪视频的生成装置的结构框图(一);

图5是根据本申请实施例的一种目标烹饪视频的生成装置的结构框图(二)。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例的一个方面,提供了一种目标烹饪视频的生成方法。该目标烹饪视频的生成方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述目标烹饪视频的生成方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。

上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。

在本实施例中提供了一种目标烹饪视频的生成方法,应用于上述计算机终端,图2是根据本申请实施例的目标烹饪视频的生成方法的流程图,该流程包括如下步骤:

步骤S202,对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;

步骤S204,获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;

步骤S206,基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;

步骤S208,根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

通过上述步骤,对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频,解决了相关技术中,如何生成具有解说音频的烹饪视频的技术问题,进而实现了生成具有解说音频的烹饪视频的目的。

在一个示例性实施例中,在基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本之前,还提出了一种技术方案,具体步骤包括:根据所述烹饪设备的设备类型确定所述烹饪设备是否预置有传感器;在确定所述烹饪设备预置有传感器的情况下,将所述传感器的传感器数据确定为所述烹饪设备的设备数据;在确定所述烹饪设备未预置有传感器的情况下,使用处于所述烹饪设备的预设范围内的监测设备对所述烹饪设备进行监测,将监测所述烹饪设备得到的监测数据确定为所述烹饪设备的设备数据。

其中,需要说明的是,不同设备类型的烹饪设备对应设置有不同类型的传感器,例如,对于炒锅、炉灶等烹饪设备,可以设置温度传感器,对于电饭煲、蒸锅等烹饪设备,可以设置湿度传感器,而对于抽油烟机,可以设置烟雾感应器,本申请对此不作限制。

在一个示例性实施例中,还可以音频接收模块获取烹饪过程中所述烹饪设备工作时产生的声音数据。并从声音数据中抽取声音数据发生音频信号变化的关键音频帧,根据该关键音频帧进行识别,得到与烹饪设备的开启状态、关闭状态和改变工作状态等对应的音频信号。在一个示例性实施例中,为了更好的理解上述步骤S206中基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本的实现过程,提出了以下技术方案,具体步骤包括:在确定所述烹饪动作包括对所述烹饪食材进行处理的动作的情况下,获取所述烹饪动作对应的第一烹饪事件和所述烹饪食材对应的第二烹饪事件;在确定所述第一烹饪事件和所述第二烹饪事件均指示同一烹饪流程的情况下,将所述烹饪动作对应的第一预设文本和所述烹饪食材对应的第二预设文本进行合并,得到第一合并结果;获取属于所述同一烹饪流程的所述音频信号对应的第三预设文本和所述烹饪设备的设备数据对应的第四预设文本;根据所述第一合并结果,所述第三预设文本和所述第四预设文本生成所述烹饪过程的描述文本。

其中,上述第一烹饪事件和第二烹饪事件均指示的同一烹饪流程例如可以为炒菜,那么获取属于炒菜的声音对应的文本(即上述音频信号对应的第三预设文本)和抽油烟机的设备数据对应的文本(即上述烹饪设备的设备数据对应的第四预设文本),并根据炒菜的动作对应的第一合并结果,炒菜的声音对应的文本和抽油烟机的设备数据对应的文本生成炒菜过程的描述文本,例如可以为“用户当前正在炒菜,烟雾较大”。

在一个示例性实施例中,进一步的,还提出了其他用来实现步骤206中基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本的技术方案,具体步骤包括:在确定所述烹饪动作包括对所述烹饪设备进行操作的动作的情况下,获取所述烹饪动作对应的第一烹饪事件,所述音频信号对应的第三烹饪事件和所述烹饪设备的设备数据对应的第四烹饪事件;在确定所述第一烹饪事件,所述第三烹饪事件和所述第四烹饪事件均指示同一烹饪流程的情况下,将所述烹饪动作对应的第一预设文本,所述音频信号对应的第三预设文本和所述烹饪设备的设备数据对应的第四预设文本进行合并,得到第二合并结果;获取属于所述同一烹饪流程的所述烹饪食材对应的第二预设文本;根据所述第二合并结果和所述第二预设文本生成所述烹饪过程的描述文本。

其中,上述第一烹饪事件,第三烹饪事件和第四烹饪事件均指示同一烹饪流程例如可以为将食材放入烹饪设备,那么获取属于将食材放入烹饪设备时食材对应的文本(即上述烹饪食材对应的第二预设文本),并根据将食材放入烹饪设备时对应的第二合并结果和将食材放入烹饪设备时食材对应的文本生成描述文本,例如可以为“用户当前正在将牛肉和胡萝卜放入炒锅”。

在一个示例性实施例中,在执行上述步骤S206中基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本的过程中,还可以实现以下步骤:获取不同烹饪动作之间的间隔时间;在确定所述间隔时间大于第一预设值的情况下,在所述不同的烹饪动作切换时,在所述描述文本中增加不同烹饪动作之间的关联词。

其中,需要说明的是,上述关联词可以理解为对不同动作进行衔接的词语,用于提高不同烹饪动作之间的动作连贯程度,可以包括“接下来”、“然后”、“随后”等,本申请对此不做限制。

可选的,在其他实施例中,在确定所述间隔时间大于第一预设值的情况下,在所述不同的烹饪动作切换时,根据所述间隔时间和第一预设值的差值大小调整所述描述文本中不同烹饪动作之间的关联词的数量。

在一个示例性实施例中,对于上述步骤S208中根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频的实现过程,具体提出了以下实现步骤,具体包括:对所述烹饪解说音频进行解析,得到所述烹饪解说音频的第一关键字,其中,所述第一关键字指示所述烹饪过程的第五烹饪事件;获取所述初始烹饪视频的烹饪动作对应的第二关键字,其中,所述第二关键字表示所述烹饪过程的第六烹饪事件;在确定所述第一关键字和所述第二关键字指示同一烹饪事件的情况下,根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

在一个示例性实施例中,进一步的,在执行上述步骤S208根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频的过程中,还提出了以下技术方案,具体步骤包括:获取所述初始烹饪视频中除了所述目标对象的烹饪动作之外的其他动作;在确定所述目标对象从所述烹饪动作切换至所述其他动作的情况下,获取所述目标对象从所述烹饪动作切换为所述其他动作后的持续时长;在确定所述持续时长大于第二预设值的情况下,停止采集用户的初始烹饪视频。

进一步的,在其他实施例中,在所述目标对象从所述其他动作切换至所述烹饪动作的情况下,还可以重新生成所述目标烹饪视频。或者,也可以在确定所述持续时长大于第二预设值的情况下,暂停采集用户的初始烹饪视频,直至所述目标对象从所述其他动作切换至所述烹饪动作,此时继续采集用户的初始烹饪视频。

为了更好的理解上述目标烹饪视频的生成方法的过程,以下再结合可选实施例对上述目标烹饪视频的生成的实现方法流程进行说明,但不用于限定本申请实施例的技术方案。

在本实施例中提供了一种目标烹饪视频的生成方法,图3是根据本申请实施例的目标烹饪视频的生成方法的示意图,如图3所示,可以通过摄像头、麦克风、传感器等设备硬件获取多模态数据,即图3中的视频流数据、音频流数据、传感器数据。对于视频流数据,可以使用视觉理解系统进行动作识别和食材识别,其中,动作识别的结果为包括例如颠勺、热油、爆炒等烹饪动作,食材识别的结果包括牛肉、胡萝卜、大葱等烹饪食材。对于音频流数据,可以通过音频理解技术得到例如烹饪设备的开火声音等。然后通过TTS技术生成视频流数据、音频流数据、传感器数据所对应的用于解说烹饪视频的描述文本,得到烹饪过程进行采集得到的烹饪过程视频,并基于描述文本转化得到的音频和烹饪过程视频生成具有解说的烹饪视频。

通过上述步骤,可以在烹饪过程中,利用多模态感知技术得到的多模态数据生成对应的描述文本,进而将描述文本转化为解说音频,通过解说音频和烹饪过程中的视频生成具有解说的烹饪视频。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。

图4是根据本申请实施例的一种目标烹饪视频的生成装置的结构框图(一),如图4所示,包括:

解析模块42,用于对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;

获取模块44,用于获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;

第一生成模块46,用于基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;

第二生成模块48,用于根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

通过上述装置,对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频,解决了相关技术中,如何生成具有解说音频的烹饪视频的技术问题,进而实现了生成具有解说音频的烹饪视频的目的。

在一个示例性实施例中,上述第一生成模块还用于:在确定所述烹饪动作包括对所述烹饪食材进行处理的动作的情况下,获取所述烹饪动作对应的第一烹饪事件和所述烹饪食材对应的第二烹饪事件;在确定所述第一烹饪事件和所述第二烹饪事件均指示同一烹饪流程的情况下,将所述烹饪动作对应的第一预设文本和所述烹饪食材对应的第二预设文本进行合并,得到第一合并结果;获取属于所述同一烹饪流程的所述音频信号对应的第三预设文本和所述烹饪设备的设备数据对应的第四预设文本;根据所述第一合并结果,所述第三预设文本和所述第四预设文本生成所述烹饪过程的描述文本。

其中,上述第一烹饪事件和第二烹饪事件均指示的同一烹饪流程例如可以为炒菜,那么获取属于炒菜的声音对应的文本(即上述音频信号对应的第三预设文本)和抽油烟机的设备数据对应的文本(即上述烹饪设备的设备数据对应的第四预设文本),并根据炒菜的动作对应的第一合并结果,炒菜的声音对应的文本和抽油烟机的设备数据对应的文本生成炒菜过程的描述文本,例如可以为“用户当前正在炒菜,烟雾较大”。

在一个示例性实施例中,进一步的,上述第一生成模块还用于:在确定所述烹饪动作包括对所述烹饪设备进行操作的动作的情况下,获取所述烹饪动作对应的第一烹饪事件,所述音频信号对应的第三烹饪事件和所述烹饪设备的设备数据对应的第四烹饪事件;在确定所述第一烹饪事件,所述第三烹饪事件和所述第四烹饪事件均指示同一烹饪流程的情况下,将所述烹饪动作对应的第一预设文本,所述音频信号对应的第三预设文本和所述烹饪设备的设备数据对应的第四预设文本进行合并,得到第二合并结果;获取属于所述同一烹饪流程的所述烹饪食材对应的第二预设文本;根据所述第二合并结果和所述第二预设文本生成所述烹饪过程的描述文本。

其中,上述第一烹饪事件,第三烹饪事件和第四烹饪事件均指示同一烹饪流程例如可以为将食材放入烹饪设备,那么获取属于将食材放入烹饪设备时食材对应的文本(即上述烹饪食材对应的第二预设文本),并根据将食材放入烹饪设备时对应的第二合并结果和将食材放入烹饪设备时食材对应的文本生成描述文本,例如可以为“用户当前正在将牛肉和胡萝卜放入炒锅”。

在一个示例性实施例中,上述第一生成模块还用于:获取不同烹饪动作之间的间隔时间;在确定所述间隔时间大于第一预设值的情况下,在所述不同的烹饪动作切换时,在所述描述文本中增加不同烹饪动作之间的关联词。

其中,需要说明的是,上述关联词可以理解为对不同动作进行衔接的词语,用于提高不同烹饪动作之间的动作连贯程度,可以包括“接下来”、“然后”、“随后”等,本申请对此不做限制。

可选的,在其他实施例中,在确定所述间隔时间大于第一预设值的情况下,在所述不同的烹饪动作切换时,根据所述间隔时间和第一预设值的差值大小调整所述描述文本中不同烹饪动作之间的关联词的数量。

在一个示例性实施例中,上述第二生成模块还用于:对所述烹饪解说音频进行解析,得到所述烹饪解说音频的第一关键字,其中,所述第一关键字指示所述烹饪过程的第五烹饪事件;获取所述初始烹饪视频的烹饪动作对应的第二关键字,其中,所述第二关键字表示所述烹饪过程的第六烹饪事件;在确定所述第一关键字和所述第二关键字指示同一烹饪事件的情况下,根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

在一个示例性实施例中,进一步的,上述第二生成模块还用于:获取所述初始烹饪视频中除了所述目标对象的烹饪动作之外的其他动作;在确定所述目标对象从所述烹饪动作切换至所述其他动作的情况下,获取所述目标对象从所述烹饪动作切换为所述其他动作后的持续时长;在确定所述持续时长大于第二预设值的情况下,停止采集用户的初始烹饪视频。

进一步的,在其他实施例中,在所述目标对象从所述其他动作切换至所述烹饪动作的情况下,还可以重新生成所述目标烹饪视频。或者,也可以在确定所述持续时长大于第二预设值的情况下,暂停采集用户的初始烹饪视频,直至所述目标对象从所述其他动作切换至所述烹饪动作,此时继续采集用户的初始烹饪视频。

图5是根据本申请实施例的一种目标烹饪视频的生成装置的结构框图(二)。在一个示例性实施例中,如图5所示,上述目标烹饪视频的生成装置还包括确定模块52,用于:根据所述烹饪设备的设备类型确定所述烹饪设备是否预置有传感器;在确定所述烹饪设备预置有传感器的情况下,将所述传感器的传感器数据确定为所述烹饪设备的设备数据;在确定所述烹饪设备未预置有传感器的情况下,使用处于所述烹饪设备的预设范围内的监测设备对所述烹饪设备进行监测,将监测所述烹饪设备得到的监测数据确定为所述烹饪设备的设备数据。

其中,需要说明的是,不同设备类型的烹饪设备对应设置有不同类型的传感器,例如,对于炒锅、炉灶等烹饪设备,可以设置温度传感器,对于电饭煲、蒸锅等烹饪设备,可以设置湿度传感器,而对于抽油烟机,可以设置烟雾感应器,本申请对此不作限制。

本申请的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:

S1,对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;

S2,获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;

S3,基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;

S4,根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

本申请的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

S1,对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;

S2,获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;

S3,基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;

S4,根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频。

可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

相关技术
  • 视频生成、视频播放方法、装置、电子设备及存储介质
  • 视频摘要生成方法、装置、存储介质和电子设备
  • 一种视频集锦的生成方法、装置、电子设备及存储介质
  • 视频生成方法及其装置、电子设备、存储介质
  • 目标搜索词生成方法及装置、电子设备、存储介质
  • 视频生成方法、视频生成装置、电子装置及存储介质
  • 视频生成方法、视频生成装置、电子装置及存储介质
技术分类

06120115932002