掌桥专利:专业的专利平台
掌桥专利
首页

一种录音方法、终端、及存储介质

文献发布时间:2023-06-19 11:05:16


一种录音方法、终端、及存储介质

技术领域

本发明涉及录音技术领域,尤其涉及录音方法、终端、及存储介质。

背景技术

目前,随着语音识别技术的不断发展,录音产品的需求量随之增长,由于录音过程中,往往会存在多个方向的声源以及环境噪音和非稳态噪音,麦克风会将这些声音都记录下来形成录音文件,而实际上,用户所需要的往往只是特定方向和角度的声音。

现有技术中,为了能够使麦克风录到用户特定方向和角度的声音,往往需要不停的变更移动终端的位置,体验感差。

因此,现有技术还有待改进和提高。

发明内容

本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种录音方法、终端、及存储介质,旨在解决现有技术中终端录音时,终端无法录入固定方向和角度的声音。

为了解决上述技术问题,本发明所采用的技术方案如下:

第一方面,本发明提供了一种录音方法,该方法应用于录音装置,所述录音装置上设置有至少三个麦克风,且各麦克风朝向的方向各不相同;所述录音方法包括:

接收用户指令,确定所述用户指令对应的录音信息;

根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件。

进一步的,所述录音信息包括:录音方向和/或录音角度;

所述根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件,包括:根据录音方向,控制录音装置上的麦克风进行录音,以得到录音文件;和/或根据录音角度,控制录音装置上的麦克风进行录音,以得到录音文件。

进一步的,所述所述录音装置设置有触摸屏,所述触摸屏用于显示所述麦克风的位置;所述用户指令包括:触摸方向指令和/或触摸距离指令;

所述接收用户指令,确定所述用户指令对应的录音信息,包括:接收触摸方向指令,确定所述触摸方向指令对应的录音方向;和/或接收触摸距离指令,确定所述触摸距离指令对应的录音角度。

进一步的,所述录音角度随所述触摸距离指令对应的触摸距离值的增大而减小。

进一步的,所述录音角度为15度-360度。

进一步的,所述根据录音方向,控制录音装置上的麦克风进行录音,以得到录音文件,包括:根据录音方向,确定所述录音方向对应的麦克风;获取所述录音方向对应的麦克风的录音数据,根据所述录音方向和所述录音方向对应的麦克风的录音数据,生成录音文件。

进一步的,所述根据录音角度,控制录音装置上的麦克风进行录音,以得到录音文件,包括:根据录音角度,确定所述录音角度对应的麦克风;获取所述录音角度对应的麦克风的录音数据,根据所述录音角度和所述录音角度对应的麦克风的录音数据,生成录音文件。

进一步的,所述麦克风包括设置在所述录音装置正面两端的第一麦克风和第二麦克风,以及设置在所述录音装置背面两端的第三麦克风和第四麦克风;其中,所述第一麦克风与所述第二麦克风的连线为第一连线,所述第三麦克风和所述第四麦克风的连线为第二连线,所述第一连线与所述第二连线呈一夹角。

第二方面,本发明提供了一种智能终端,该终端包括:

存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如上述第一方面及其任意一种可能实现方式的方法。

第三方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于执行如上述第一方面及其任意一种可能实现方式的方法。

有益效果:本发明提供了一种录音方法、装置、及存储介质,该方法应用于录音装置,所述录音装置上设置有至少三个麦克风,且各麦克风朝向的方向各不相同;所述录音方法包括:接收用户指令,确定所述用户指令对应的录音信息;根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件。本发明通过在录音装置上设置至少三个麦克风,以实现定向录音。

附图说明

为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。

此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。

图1为本申请实施例提供的一种录音方法的流程示意图;

图2为本申请实施例提供的一种录音方法的第一状态示意图;

图3为本申请实施例提供的一种录音方法的第二状态示意图;

图4为本申请实施例提供的一种录音方法的第三状态示意图;

图5为本申请实施例提供的一种录音方法的硬件结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

随着语音识别技术的不断发展,录音产品的需求量随之增长,由于录音过程中,往往会存在多个方向的声源以及环境噪音和非稳态噪音,但一般的录音或者录影,其实并没有方向性,就是各个方向的声音全部都录进来,麦克风会将这些声音都记录下来形成录音文件,而实际上,用户所需要的往往只是特定方向和角度的声音。

基于此,本申请实施例提供了一种录音方法,该方法应用于录音装置,所述录音装置上设置有至少三个麦克风,且各麦克风朝向的方向各不相同;所述录音方法包括:接收用户指令,确定所述用户指令对应的录音信息;根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件。

具体的,本申请实施例的方法应用于录音装置,该装置上设置有至少3个麦克风,麦克风需要设置在不同方位,比如手机背面和手机正面均设有对等数量的麦克风,以便实现全方位录音。

该录音装置可以安装在电子设备上,该电子设备可以为手机,电脑,平板摄像机等。

请参阅图1~图5,图1是本申请实施例提供的一种录音方法的流程示意图。具体步骤如下:

步骤S100、接收用户指令,确定所述用户指令对应的录音信息。

具体的,该用户指令为用户输入的录音方向和/或角度信息。

在用户操作电子设备进入终端录音功能后,可以在电子设备上形成一个可操作界面,通过该区域用户可以通过多种方式输入录音方向和/或角度信息,例如,该可以操作界面可以通过键盘或者触摸的方式来输入用户指令,在一种实现方式中,用户可以直接通过键盘输入方向:前;角度:60度,即代表录入前方60度的声音。

录音信息为用户需要录音的方向和/或角度信息,可以根据用户输入的指令信息。

步骤S200、根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件。

具体的,可在终端中预先存储每个录音方向和角度对应的录音数据,根据所确定的录音方向和/或角度选取相应的录音数据,并根据录音数据控制移动终端上的至少三个麦克风10实现定向录音,并生成录音文件。

本发明实施例提供了一种录音方法,该方法应用于录音装置,所述录音装置上设置有至少三个麦克风10,且各麦克风10朝向的方向各不相同;所述录音方法包括:接收用户指令,确定所述用户指令对应的录音信息;根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件。本发明通过在录音装置上设置至少三个麦克风10,以实现定向录音。

在本申请实施方式中,录音信息包括:录音方向和/或录音角度;

所述根据所录音信息控制录音装置上的麦克风10进行录音,以得到录音文件,包括:根据录音方向,控制录音装置上的麦克风10进行录音,以得到录音文件;和/或

根据录音角度,控制录音装置上的麦克风10进行录音,以得到录音文件。

具体的,在本实施例中,当用户输入指令时,可以根据输入的指令来确定需要录音的方向和/或角度信息。再根据需要录音的方向和/或角度信息来生成录音文件,该录音文件为用户需要定向录音的声音文件。

在一种实施方式中,用户只需要输入方向信息:比如,右方,即可实现此方位的定向录音,此时,电子设备可以默认设置录入正右方90度内的声音,当然,也可以设置成其他角度或者由用户来设置录音角度。设定的角度越小,则生成的录音文件的精度越高。

在另一种实施方式中,用户需要输入角度信息,需特别说明的是,当用户通过输入角度来确定对应的录音信息时,该录音角度为方位角,例如用户指令为:以前方为基准,偏右六十度,即代表方位角。根据此用户指令即可确定需要录入的声音信息。当然,用户可以根据声源的方位,以及需要生成录音的精度来调整录音角度。

另外,用户指令包括录音方向和角度信息,以此来确定对应的录音信息,在此不在赘述。

在本申请实施例中,所述录音装置设置有触摸屏,所述触摸屏用于显示所述麦克风10的位置;所述用户指令包括:触摸方向指令和/或触摸距离指令;

所述接收用户指令,确定所述用户指令对应的录音信息,包括:

接收触摸方向指令,确定所述触摸方向指令对应的录音方向;和/或

接收触摸距离指令,确定所述触摸距离指令对应的录音角度。

具体的,如图2~图4所示,在本实施方式中,当用户操作电子设备进入录音界面后,在录音触摸屏界面上形成有可以触摸操作的预定区域,

该预定区域可以通过接受用户触摸信号来确定录音的方向和/或录音角度信息。具体的确定录音方向和/或录音角度信息的方式有多种。

同时,在该触摸屏幕上还显示有麦克风10位置信息,具体的,位置信息代表麦克风10设置在电子设备上的方位,比如电子设备背面、正面、或侧面的某个位置,除此之外,还可以显示电子设备上设置的麦克风10的个数,开启状态等。如此,用户可以直观的看到麦克风10的状态信息。更进一步的,触摸屏上设有触摸开关,用户可以通过触摸开关来关闭任一一个用户想要关闭的麦克风。

在一种可选的实现方式中,该预定区域内的每一点均代表着不同的录音方向和角度,通过把触摸信号划动到预定区域区域内不同的位置,即代表着不同的录音角度和方向,触摸信号代表着用户触摸划动所述区域所生成的有关录音方向和角度的信号。

触摸屏幕上预定区域的形状可以是多式多样的,例如可以是圆形、方形、可以是封闭的形状,也可以是未封闭的形状,用户可以根据自己的喜好来设定。

在一种可选的实现方式中,所述预定区域为圆形区域,如图2~4所示,所述圆形区域内不同位置分别对应不同的录音方向和/或录音角度。具体的,在圆形区域内设置一个可以触摸划动的第一滑块20,第一滑块20可以通过触摸划动到圆形区域内的任意位置,当进入录音功能时,第一滑块20位于圆形区域的圆心A位置,触摸划动第一滑块20,当第一滑块20划动到第一目标位置时,圆形区域的圆心A指向该第一目标位置的的方向即为录音方向,而圆心A与该第一目标位置的距离远近可以用来确定录音角度。

在上述实施方式的基础上,还可以选择性的在圆形区域内设置有一个可以触摸划动的第二滑块(图中未画出),第二滑块划动的第二滑块可以通过触摸划动到圆形区域内的任一位置,触摸划动第二滑块,当第二滑块划动到第二目标位置时,圆形区域的圆心A指向该第二目标位置的方向为需要过滤掉的录音方向,圆心A与第二目标位置的距离远近用来确定需要过滤掉的录音角度。

在有些环境中,有时候用户并不能确定想要录取的声源位置,需要的仅是过滤掉某个方向和角度的噪音,因此,通过第二滑块来操作可以更加便捷的达到上述目的。

其中,上述第一滑块20和第二滑块的存在形式,形状以及触发方式等均不做限制,本领域技术人员可以根据实际情况进行设计。

进一步的,为了使得用户操作更加便捷,在录音功能界面内,还设置有开始和暂停录音按钮。

进一步的,为了使得用户操作选择的多样性,当进入到终端录音功能界面后,在录音界面的除了形成可以触摸操作的预定区域外,还形成有可输入录音方向和角度信息的输入区,通过输入区输入录音方向和角度,即可确定录音方向和角度。例如,输入方向:前;角度:60度,即代表录入正前方60度的声音。

进一步的,所述录音角度随所述触摸距离指令对应的触摸距离值的增大而减小。

也就是说,录音角度随着第一滑块20的触摸距离值的增大而减少。

对应的,可以是定过滤录音的角度随着第二滑块的触摸距离值的增大而减少。

需要说明的是,当触摸区域为一个圆形区域时,该触摸距离指的是圆心A与所述区域内任意位置的距离。也就是说,离圆心A越远,录音的角度越小,离圆心A越近,录音的角度越大,因此,当对定向录音的精度要求较高时,可以把第一滑块20划动到离圆心A相对较远的位置,录音指向性更强。当对录音的精度要求较低时,可以把第一滑块20划动到离圆心A相对较近的位置。

进一步的,所述录音角度为15度-360度。

参见图2~4所示,图中的扇形区域代表需要录音的区域,在上述实施方式的基础上,如图2所示,当第一滑块20位于圆形区域内其他位置时,录音角度为15~360度,扇形区域S1为需要录音的范围;如图3所示,在把第一滑块20滑动到圆形区域的圆周上时,录音角度为15度,扇形区域S3即代表需要录音的范围;如图4所示,当把第一滑块20滑动到圆形区域的圆心A上时,此时可实现全方位录音,此时区域S3为整个圆形区域,即所述录音角度为360度;从而可实现全方位的定向录音。

当然,也可以根据需求设定其他的录音角度方位。

例如在另一种设定方式中,可以规定在第一滑块20滑动到圆形区域的圆周上时,录音角度为15度,当把第一滑块20滑动到圆形区域的圆心A上时,录音角度为360度,当把第一滑块20移动到圆形区域中的其他位置时,录音角度设为15~180度。此种情况下,当需要录制180度~360度之间的声音时,则可通过第二滑块过滤掉不需要录制的角度对应的声音即可实现。

在本实施方式中,所述根据录音方向,控制录音装置上的麦克风进行录音,以得到录音文件,包括:

根据录音方向,确定所述录音方向对应的麦克风10;

获取所述录音方向对应的麦克风10的录音数据,根据所述录音方向和所述录音方向对应的麦克风10的录音数据,生成录音文件。

具体的,当录音装置上设置有三个以上的麦克风10时,电子设备可以根据用户需要的录音方向来选择开启三个以上麦克风10中的至少三个麦克风10来进行录音,用户也可以自行选择开启哪三个或以上麦克风10进行录音,比如,可以选择设置在离需要录音的方向比较接近的麦克风10来进行录音,以得到更清晰的录音效果。同时,在此实施例中,由于没有开启所有的麦克风10进行录音,节约了系统资源。

进一步的,所述根据录音角度,控制录音装置上的麦克风10进行录音,以得到录音文件,包括:

根据录音角度,确定所述录音角度对应的麦克风10;

获取所述录音角度对应的麦克风10的录音数据,根据所述录音角度和所述录音角度对应的麦克风10的录音数据,生成录音文件。

具体的,当录音装置上设置有三个以上的麦克风10时,电子设备可以根据用户需要的录音角度来选择开启三个以上麦克风10中的至少三个麦克风10来进行录音,用户也可以自行选择开启哪三个或以上麦克风10进行录音,比如,可以选择设置在离需要录音的方位角比较接近的麦克风10来进行录音,以得到更清晰的录音效果。

进一步的,所述麦克风10包括设置在所述录音装置正面两端的第一麦克风和第二麦克风,以及设置在所述录音装置背面两端的第三麦克风和第四麦克风。

具体的,第一麦克风设置在手机正面上薄边附近,第二麦克风设置在手机正面下薄边附近,第二麦克风设置在手机背面下薄边附近,第四麦克风设置在手机背面上薄边附近,通过在手机正面和背面均设有两个麦克风,以便能够更准确的判断声音位置的来源,从而更加精准的实现特定角度和方向的录音。

在一种实现方式中,步骤S200根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件还包括以下步骤:

步骤S210、通过所述至少三个麦克风10获取录音信号。

具体的,在步骤S210中,当用户至预设界面操作选定了录音方向和角度后,开启至少三个麦克风10开始录音,三个麦克风获取的录音信号包括人声以及噪音等。

在本实施方式中,终端中的麦克风10可能有不止三个,例如终端中设有五个麦克风10,此时,可以控制五个麦克风10全部开始录音,也可以控制五个麦克风10中的至少三个开始录音。

另外,还可以将至少三个麦克风10获取的录音信号全部存储在电子设备的存储器上,这样当用户后期想要调整录音方向和角度时,只需要从存储器去除数据进行调整即可。这样即使在前期用户没有设定录音方向和/或角度,也可以通过后期针对性的修改。

步骤S220、对所述至少三个麦克风10中的每一个麦克风10对应的录音信号转换为数字信号。

值得注意的是,步骤220中是对每一个麦克风10的录音信号单独进行转换为数字信号。

步骤S230、将所述至少三个麦克风10中的每一个麦克风10对应的数字信号与预先设置的根据束波成型算法建立的数字模型进行对比,辨别出数字信号的混合特性数据,并根据所确定的录音方向和录音角度作为限制,筛选出目标数字信号,其中,所述目标数字信号为所述录音方向和录音角度内的数字信号。

由于每一个麦克风10对应数字信号都有不同的时间域和空间域,因此,通过将每一个麦克风10对应的数字信号与预先设置的根据束波成形算法建立的数字模型进行对比,即可辨别出声音的大致方向、强度、强度、品质等混合特性数据,再根据确定的录音方向和角度作为限制,即可筛选出用户需要的录音方向和角度范围内的目标数字信号。

步骤S240、对所述目标数字信号进行处理,并生成录音文件。

通过上述步骤,即可生成特定方向和角度的定向录音文件。

进一步的,对所述目标数字信号进行处理,并生成录音文件之前还包括步骤:

步骤S231、动态加强所述目标数字信号的相位和幅值。

具体的,通过加强所述目标数字信号的相位和幅值,以放大目标数字信号的强度和响度,使得用户能够更加清晰的录制到自己感兴趣的声音。关于加强的相位和幅值,可以系统默认设置,也可以有用户选择想要加强的相位和幅度值。

步骤S232、过滤和反波抑制所述确定的录音方向和录音角度范围外的数字信号。

具体的,可以设置确定的录音方向和录音角度范围之外的其他人声和噪音都有效的过滤,提高目标数字信号的准确度,从而形成特定角度和方向内声音加强的效果,使得用户更容易辨识特定方向和角度的声音。

上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的录音装置。

本申请实施例提供的一种终端录音装置示意图,该装置可通过执行终端录音方法来对移动终端实现特定角度和方向的录音进行控制,该装置具体包括:

接收模块,用于接收用户指令;

确定模块,用于确定所述用户指令对应的录音信息;

声音录制模块,用于根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件。

本发明实施例提供的终端录音装置,接收模块接收到用户指令,确定模块确定用户指令对应的录音信息,声音录制模块根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件。通过采用上述技术方案,即可实现任意方向和角度的录音,而无需改变终端位置和朝向。

在一个实施例中,提供了一种智能终端,包括:存储器2和处理器1,所述存储器2和所述处理器1之间互相通信连接,所述存储器2中存储有计算机指令,所述处理器1通过执行所述计算机指令,从而执行以完成上述录音方法。

处理器1可以是一个或多个图形处理器(graphics processing unit,GPU),在处理器1是一个GPU的情况下,该GPU可以是单核GPU,也可以是多核GPU。可选的,处理器1可以是多个GPU构成的处理器组,多个处理器之间通过一个或多个总线彼此耦合。可选的,该处理器还可以为其他类型的处理器等等,本申请实施例不作限定。

存储器2可用于存储计算机程序指令,以及用于执行本申请方案的程序代码在内的各类计算机程序代码。可选地,存储器2包括但不限于是随机存储记忆体(random accessmemory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasableprogrammable read only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器用于相关指令及数据。

在一个实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机从而执行以完成上述录音方法的步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。所属领域的技术人员还可以清楚地了解到,本申请各个实施例描述各有侧重,为描述的方便和简洁,相同或类似的部分在不同实施例中可能没有赘述,因此,在某一实施例未描述或未详细描述的部分可以参见其他实施例的记载。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriberline,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digital versatiledisc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-only memory,ROM)或随机存储存储器(random access memory,RAM)、磁碟或者光盘等各种可存储程序代码的介质。

综上,本发明公开了一种录音方法、终端、及存储介质,该方法应用于录音装置,所述录音装置上设置有至少三个麦克风,且各麦克风朝向的方向各不相同;所述录音方法包括:接收用户指令,确定所述用户指令对应的录音信息;根据所录音信息控制录音装置上的麦克风进行录音,以得到录音文件。本发明通过在录音装置上设置至少三个麦克风,以实现定向录音。

应当理解的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 录音方法、录音装置、智能终端及计算机可读存储介质
  • 移动终端的录音方法、装置、存储介质及移动终端
技术分类

06120112789698