掌桥专利:专业的专利平台
掌桥专利
首页

红外线遥控影音装置及红外线遥控影音播放方法

文献发布时间:2023-06-19 19:00:17


红外线遥控影音装置及红外线遥控影音播放方法

技术领域

本发明关于一种影音播放控制方法,特别关于一种红外线遥控影音播放方法。

背景技术

传统电视必须接上数字电视天线、HDMI影音输入或是第四台来观看节目,按照既定的播放时间来进行观赏。近年来智能家电兴起,所有家电都要求可连网、可链接应用程序(APP)等功能,电视亦包含在内。智能电视提供了如同智能型手机可以上网透过YouTube、NETFLIX、Apple TV+、myVideo等平台观看影片的功能。然而目前电视在播放影片时,通常声音都是混着播出,因此使用者常遇到无法分辨声音是属于显示画面中的何角色的问题。

发明内容

鉴于上述,本发明提供一种红外线遥控影音装置及红外线遥控影音播放方法,可以提供指定角色的声音。

依据本发明一实施例的红外线遥控影音装置,包含红外线传感器、显示接口、音频输出接口、内存及处理器,其中处理器连接于红外线传感器、显示接口、音频输出接口及内存。红外线传感器用于接收第一指示讯号及第二指示讯号。显示接口用于播放影片的多个显示画面。音频输出接口用于输出影片的音讯。内存储存多个预处理角色特征组、多个预处理音轨及所述多个预处理角色特征组与所述多个预处理音轨的对应关系。处理器用于:依据第一指示讯号,暂停显示接口的播放及音频输出接口的输出,使显示接口显示暂停画面;依据第二指示讯号,判断位于暂停画面的目标区块中的目标角色图案,其中第二指示讯号指示目标区块,且目标角色图案符合所述多个预处理角色特征组中的一者;依据所述多个预处理角色特征组与所述多个预处理音轨的对应关系,从音频中提取对应于目标角色图案的判定音轨;以及控制显示接口继续播放,且控制音频输出接口输出判定音轨。

依据本发明一实施例的红外线遥控影音播放方法,包含:藉由显示接口播放影片的多个显示画面,且藉由音频输出接口输出影片的音频;藉由红外线传感器接收第一指示讯号;藉由处理器,依据第一指示讯号,暂停显示接口的播放及音频输出接口的输出,使显示接口显示暂停画面;藉由红外线传感器接收第二指示讯号;藉由处理器依据第二指示讯号,判断位于暂停画面的目标区块中的目标角色图案,其中第二指示讯号指示目标区块,且目标角色图案符合多个预处理角色特征组中的一者;藉由处理器依据所述多个预处理角色特征组与多个预处理音轨的对应关系,从音频中提取对应于目标角色图案的判定音轨;以及控制显示接口继续播放,且控制音频输出接口输出判定音轨。

藉由上述架构,本案所揭示的红外线遥控影音装置及红外线遥控影音播放方法,基于多个预处理角色特征组与多个预处理音轨的对应关系,判定红外线指示讯号所指定的角色的对应音轨,可以提供单独播放指定角色声音的功能。

以上的关于本揭露内容的说明及以下的实施方式的说明为用以示范与解释本发明的精神与原理,并且提供本发明的专利申请范围更进一步的解释。

附图说明

图1为依据本发明一实施例所绘示的红外线遥控影音装置的功能方块图。

图2为依据本发明一实施例所绘示的红外线遥控影音播放方法的流程图。

图3为依据本发明一实施例所绘示的红外线遥控影音装置的使用情境图。

图4为依据本发明一实施例所绘示的红外线遥控影音装置的暂停画面示意图。

图5为依据本发明另一实施例所绘示红外线遥控影音播放方法的流程图。

图6A及6B为依据本发明另一实施例所绘示的红外线遥控影音装置的暂停画面示意图。

图7为依据本发明一实施例所绘示的红外线遥控影音播放方法的预处理流程图。

元件标号说明

10红外线遥控影音装置

11红外线传感器

13显示接口

15音频输出接口

17内存

19处理器

1~9指定代码

F3、F4、F6暂停画面

F31分割区块

F61目标区块

41、42目标角色图案

61、62、63预选图案

具体实施方式

以下在实施方式中详细叙述本发明的详细特征组以及优点,其内容足以使任何熟习相关技艺者了解本发明的技术内容并据以实施,且根据本说明书所揭露的内容、申请专利范围及图式,任何熟习相关技艺者可轻易地理解本发明相关的目的及优点。以下的实施例为进一步详细说明本发明的观点,但非以任何观点限制本发明的范畴。

请参考图1,图1为依据本发明一实施例所绘示的红外线遥控影音装置的功能方块图。如图1所示,红外线遥控影音装置10包含红外线传感器11、显示接口13、音频输出接口15、内存17及处理器19,其中处理器19透过有线或无线方式连接于红外线传感器11、显示接口13、音频输出接口15及内存17。特别来说,红外线遥控影音装置10可以智能电视实现,但不以此为限。

红外线传感器11用于接收红外线指示讯号,例如由电视遥控器所发出的红外线指示讯号。进一步来说,红外线指示讯号可以依电视遥控器遭触发(例如按压)的按键的不同而带有不同代码或其他可供处理器19辨识的标记。显示接口13例如为屏幕,音频输出接口15则例如为喇叭。显示接口13及音频输出接口15用于播放影片。进一步来说,显示接口13用于播放影片的多个显示画面,音频输出接口15则用于输出影片的音讯。

内存17例如为快闪(flash)内存、硬盘(HDD)、固态硬盘(SSD)、动态随机存取内存(DRAM)、静态随机存取内存(SRAM)或其他非挥发性内存。内存17可以为本地储存媒介或可以为远程储存媒介,例如云端数据库。内存17储存多个预处理角色特征组、多个预处理音轨及所述多个预处理角色特征组与所述多个预处理音轨的对应关系,其中所述对应关系例如为以查找表的形式储存。

处理器19例如为中央处理器、微控制器、可程序化逻辑控制器或其他处理器。处理器19用于依据红外线传感器11所接收的红外线指示讯号来对显示接口13及音频输出接口15所播放的影片进行处理,以播放指定角色所对应的声音。进一步的执行步骤将于后描述。

请一并参考图1及2,其中图2为依据本发明一实施例所绘示的红外线遥控影音播放方法的流程图。如图2所示,红外线遥控影音播放方法可以包含步骤S201~S207。图2所示的红外线遥控影音播放方法可由图1所示的红外线遥控影音装置10执行,但不限于此。为了方便理解,以下示例性地以红外线遥控影音装置10的运作来说明红外线遥控影音播放方法。

于步骤S201中,红外线遥控影音装置10藉由显示接口13播放影片的多个显示画面,且藉由音频输出接口15输出影片的音频。于步骤S202及S203中,红外线遥控影音装置10藉由红外线传感器11接收第一指示讯号,并藉由处理器19依据第一指示讯号,暂停显示接口13的播放及音频输出接口15的输出,使显示接口13显示暂停画面,即暂停影片的播放。进一步来说,第一指示讯号可以源自于红外线遥控器,红外线遥控器具有多个按键,当特定按键或按键组合遭触发时,红外线遥控器便输出第一指示讯号,且第一指示讯号带有代表所述特定按键或按键组合的代码(后称暂停代码)。举例来说,特定按键可以为数字零的按键或暂停播放按键,本发明不予限制。处理器19预存有暂停代码与暂停影片播放作业的对应关系。当处理器19接收到第一指示讯号时,便可依据第一指示讯号带有的暂停代码控制显示接口13及音频输出接口15暂停播放影片。

于步骤S204中,红外线遥控影音装置10藉由红外线传感器11接收第二指示讯号。于此要特别说明的是,步骤S204或可执行于步骤S202与步骤S203之间。举例来说,使用者可以透过红外线遥控器先后发送两个指示讯号。处理器19可以依据红外线传感器11接收到两指示讯号的时间顺序判断先接收者为第一指示讯号而后接收者为第二指示讯号。

接着,红外线遥控影音装置10藉由处理器19执行步骤S205~S207。于步骤S205中,处理器19依据第二指示讯号,判断位于暂停画面的目标区块中的目标角色图案,其中第二指示讯号指示目标区块,且目标角色图案符合多个预处理角色特征组中的一者。进一步来说,处理器19可以将暂停画面分割为多个分割区块,并分配每个分割区块一指定代码,每个区块的指定代码对应于红外线遥控器上的不同按键或按键组合。由红外线遥控器产生的第二指示讯号依其触发的按键或按键组合,带有对应的指定代码。当处理器19接收到第二指示讯号时,便可判定其中的指定代码所对应的分割区块为目标区块。特别来说,指定代码所对应的按键或按键组合有别于前述暂停代码所对应的按键或按键组合。

处理器19依据储存于内存17中的多个预处理角色特征组判断目标区块中存在符合的目标角色图案。更进一步来说,每个预处理角色特征组包含多个特征,例如五官特征、脸型特征等,当处理器19判断目标区块中包含相同于同一预处理角色特征组中的默认数量的特征时,判断目标区块中存在符合此预处理角色特征组的目标角色图案。特别来说,当处理器19判断目标区块不存在符合预处理角色特征组的图案时,便不作动,或是透过显示接口13或音频输出接口15输出索取讯号以索取另一第二指示讯号,并在接收到新的第二指示讯号后再次执行步骤S205。

于图2的步骤S206中,处理器19依据所述多个预处理角色特征组与多个预处理音轨的对应关系,从音频中提取对应于目标角色图案的判定音轨。进一步来说,所述多个预处理角色特征组分别包含影片中不同角色的五官特征、脸型特征等,所述多个预处理音轨分别包含影片中不同角色的声音,而所述多个预处理角色特征组与多个预处理音轨的对应关系指示属于同个角色的预处理角色特征组与多个预处理音轨的关联性。预处理角色特征组、预处理音轨及两者间的对应关系可以由处理器19或外部处理器(例如云端服务器)在播放影片前以人工智能(AI)技术处理而得并储存至内存17,或由处理器19在接获第一指示讯号前的影片播放期间以AI技术处理而得并储存至内存17,进一步的AI处理方法将于后描述。于一实施态样中,预处理音轨为对部分影片的音讯进行处理而得,处理器19可以依据所述多个预处理角色特征组与所述多个预处理音轨的对应关系,判断对应于目标角色图案的预处理音轨,并依据预处理音轨的声纹从音讯中提取具有相同声纹的判定音轨。于另一实施态样中,预处理音轨为对完整影片的音讯进行处理而得,处理器19可以依据所述多个预处理角色特征组与所述多个预处理音轨的对应关系,判断对应于目标角色图案的预处理音轨并将此预处理音轨作为判定音轨。

于步骤S207中,处理器19控制显示接口13继续播放,且控制音频输出接口15输出判定音轨。于一实施态样中,处理器19可以控制音频输出接口15仅输出判定音轨而不输出音讯中的其他音轨。于另一实施态样中,处理器19可以控制音频输出接口15以高于其他音轨的音量输出判定音轨。

举一个实际的例子来说明步骤S205~S207,请参考图3及图4,图3为依据本发明一实施例所绘示的红外线遥控影音装置的使用情境图,图4则为依据本发明一实施例所绘示的红外线遥控影音装置的暂停画面示意图。如图3所示,作为显示接口的电视屏幕的暂停画面F3可以被分割为九个分割区块F31,这九个分割区块F31可以分别被分配指定代码1~9,分别对应于电视遥控器上的数字按键1~9。当数字按键1遭触发而产生第二指示讯号至电视时,电视的处理器便会据以判断目标区块为具有指定代码1的分割区块F31,以此类推。

假设图4所示的暂停画面F4具有如图3所示的指定代码配置。当第二指示讯号指示指定代码4时,处理器依据内存中的预处理角色特征组判断目标区块中存在符合的目标角色图案41,再依据预处理角色特征组与预处理音轨的对应关系,从音频中提取对应于目标角色图案41的判定音轨,并控制显示接口继续播放且控制音频输出接口输出判定音轨。当第二指示讯号指示指定代码5时,同理于上述,处理器判断目标角色图案42,从音频中提取对应于目标角色图案42,并控制显示接口继续播放且控制音频输出接口输出判定音轨。特别来说,图4所示的分割暂停画面F4的虚线可以选择性地呈现于实际显示的画面上。举例来说,处理器在控制显示接口暂停播放时可以同时控制显示接口呈现分割暂停画面F4的虚线,以方便用户选择目标区块。

图4示例性地绘示目标区块中存在单个目标角色图案41或42的实施例。于目标区块中存在多个目标角色图案的一实施例中,处理器可以依据预处理角色特征组与预处理音轨的对应关系,从音讯中提取分别对应于多个目标角色图案的多个判定音轨,控制显示接口继续播放且控制音频输出接口输出所述多个判定音轨。

对于目标区块中存在多个目标角色图案的另一实施例,请一并参考图1、图2及图5,其中图5为依据所述实施例所绘示红外线遥控影音播放方法的流程图。图5所示的红外线遥控影音播放方法包含前述图2实施例所述的步骤S201~S204、S206及S207,差别在于步骤S205包含了步骤S501~S505。步骤S501~S505同样可由图1所示的红外线遥控影音装置10执行,但不限于此。为了方便理解,以下示例性地以红外线遥控影音装置10的运作来说明步骤S501~S505。

于步骤S501中,处理器19判断位于暂停画面的目标区块(对应于第二指示讯号)中存在符合预处理角色特征组的预选图案数量是否为一个。当判断结果为是时,如步骤S502所示,处理器19将预选图案作为目标角色图案,并接着执行步骤S206。当判断结果为否(即预选图案数量为多个)时,如步骤S503所示,处理器19透过显示接口13或/及音频输出接口15索取第三指示讯号。举例来说,处理器19可以控制显示接口13将目标区块放大以填满画面,且/或显示索取第三指示讯号的文字讯息。举另个例子来说,处理器19可以控制音频输出接口15输出索取第三指示讯号的语音消息。

于步骤S504及步骤S505中,处理器19透过红外线传感器11取得第三指示讯号,且依据第三指示讯号,判断所述多个预选图案中位于目标区块的目标子区块中的预选图案为目标角色图案,其中第三指示讯号指示目标子区块。进一步来说,处理器19可以将目标区块分隔为多个分割子区块,并分配每个分割区块一指定代码,每个分割子区块的指定代码对应于红外线遥控器上的不同按键或按键组合。由红外线遥控器产生的第三指示讯号依其触发的按键或按键组合,带有对应的指定代码。当处理器19接收到第三指示讯号时,便可判定其中的指定代码所对应的分割子区块为目标子区块。处理器19将位于目标子区块中的预选图案作为目标角色图案,并接着进行步骤S206。特别来说,当处理器19判断目标子区块不存在预选图案时,便不作动,或是透过显示接口13或音频输出接口15输出索取讯号以索取另一第三指示讯号,并在接收到新的第三指示讯号后再次执行步骤S505。

举一个实际的例子来说明步骤S501~S505,请参考图6A及6B,图6A及6B为依据本发明另一实施例所绘示的红外线遥控影音装置的暂停画面示意图。假设图6A所示的暂停画面F6具有如图3所示的指定代码配置。当第二指示讯号指示指定代码6时,处理器判断目标区块中存在符合预处理角色特征组的预选图案61的数量为一个,并将预选图案61作为目标角色图案。当第二指示讯号指示指定代码4时,处理器判断目标区块中存在符合预处理角色特征组的预选图案62及63的数量为多个,接着控制显示接口将目标区块放大以填满画面,如图6B所示。假设图6B所示的目标区块F61具有如图3所示的指定代码配置。当第三指示讯号指定代码6时,处理器判断预选图案63为目标角色图案。当第三指示讯号指示指定代码5时,处理器判断预选图案62为目标角色图案。

特别来说,图6A/6B所示的分割暂停画面F6/目标区块F61的虚线可以选择性地呈现于实际显示的画面上。举例来说,处理器在控制显示接口暂停播放时可以同时控制显示接口呈现分割暂停画面F6的虚线,以方便用户选择目标区块,且/或在控制显示接口放大目标区块F61时可以同时控制显示接口呈现分割目标区块F61的虚线,以方便用户选择目标子区块。

如前所述,红外线遥控影音装置的内存中所储存的预处理角色特征组、预处理音轨及两者间的对应关系可以由装置内部处理器或外部处理器(例如云端服务器)在播放影片前处理,或由处理器在接获第一指示讯号前的影片播放期间处理而得。上述数据的处理流程请参考图7,图7为依据本发明一实施例所绘示的红外线遥控影音播放方法的预处理流程图。如图7所示,红外线遥控影音播放方法的预处理流程涉及AI技术,可以包含步骤S701~S704。

于步骤S701中,处理器对影片的多个显示画面执行多目标追踪以取得多个角色各自在所述多个显示画面中所对应的多个特征区块。此处所述的多个显示画面可以为影片的所有显示画面,或是处理器在接获第一指示讯号前影片已播放的显示画面。进一步来说,处理器所执行的多目标追踪可以包含:调整显示画面大小;将调整后的显示画面输入预先训练好的对象侦测模型(例如Yolov3或其他可侦测人物的侦测模型),以产生多个侦测框;将所述多个侦测框输入追踪器处理,以取得多个角色的追踪结果,即各角色在各显示画面中的特征区块。其中,追踪器可以对输入数据执行多目标追踪算法,例如SORT(Simple Onlineand Real-time Tracking)。

于步骤S702中,处理器依据角色各自对应的特征区块,取得多个外观特征组以作为所述多个预处理角色特征组。进一步来说,处理器对于各个角色,可以从其追踪结果取得五官特征、脸型特征等外观特征,组合为外观特征组,以作为预处理角色特征组。

于步骤S703中,处理器将音讯分离为具有不同声纹的多个预处理音轨。进一步来说,处理器可以藉由预先训练好的声源分离模型将音频分离为具有不同声纹的多个预处理音轨。所述声源分离模型可以为以AI智能神经网络人声辨识算法训练而成的模型,其中所述AI智能神经网络人声辨识算法例如为SORT。于此要特别说明的是,处理器对于影片画面的预处理以及对于影片音讯的预处理可以分别或同时执行。除了如图7所示地执行于步骤S702之后,步骤S703可以执行于步骤S701之前,或可以执行于步骤S701与S702之间,或可以与步骤S701或S702同时执行。

于步骤S704中,处理器依据所述多个显示画面、所述多个预处理角色特征组及所述多个预处理音轨,建立所述多个预处理角色特征组与所述多个预处理音轨的对应关系。进一步来说,此步骤可以包含将每一预处理音轨作为目标音轨,执行:对所述多个显示画面中对应于目标音轨具有讯号的期间的多个目标画面中的特征区块执行脸部动作侦测;以及依据脸部动作侦测结果,判断目标音轨对应于所述多个预处理角色特征组中的一者。简而言之,处理器可以判断在目标音轨有讯号时,显示画面中嘴部有开合动作的角色,并建立目标音轨与所述角色的预处理角色特征组的对应关系。特别来说,处理器会预先判断目标音轨具有讯号的期间,再执行显示画面中嘴部有开合动作的角色的判断,以避免目标音轨有讯号的期间与画面中嘴部有开合动作的角色的声音与动作无法对应,角色动作有延迟的现象出现的问题。

藉由上述架构,本案所揭示的红外线遥控影音装置及红外线遥控影音播放方法,基于多个预处理角色特征组与多个预处理音轨的对应关系,判定红外线指示讯号所指定的角色的对应音轨,可以提供单独播放指定角色声音的功能。

虽然本发明以前述的实施例揭露如上,然其并非用以限定本发明。在不脱离本发明的精神和范围内,所为的更动与润饰,均属本发明的专利保护范围。关于本发明所界定的保护范围请参考所附的申请专利范围。

相关技术
  • 受红外线遥控的电子钟及用于红外线遥控电子钟的遥控器
  • 红外线遥控器、红外线遥控信号的产生方法
技术分类

06120115760161