掌桥专利:专业的专利平台
掌桥专利
首页

基于LSTM的和弦旋律生成方法、装置、电子装置及介质

文献发布时间:2024-04-18 20:01:23


基于LSTM的和弦旋律生成方法、装置、电子装置及介质

技术领域

本申请涉及AI辅助音乐创造技术领域,特别是基于LSTM的和弦旋律生成方法、装置、电子装置及介质。

背景技术

在AI辅助音乐创作领域,会根据主旋律生成相适配的和弦(背景音乐的主要部分),它具有启发谱曲的作用,且简单和弦序列的智能生成,也为乐器初学者练习曲目提供了更多样化的选择和较低的入门门槛。

在相关技术领域中,深度学习已在语音识别与声源分离领域得以应用,但在音乐生成领域,特别是根据主旋律生成和弦的领域,尚缺少突出的研究及成果,首先,音乐理论的复杂性是一个难以克服的问题,其涉及到节奏、音高、和声等多个方面,要准确地根据主旋律生成和弦,需要对音乐理论有深入的理解和掌握;其次,音乐的美感是主观的,不同的人对于同一首音乐可能会有不同的感受和评价,在生成和弦时需要考虑音乐的主观性,如何考虑这种主观性,存在一定的挑战;并且,和弦与主旋律之间的关系复杂,和弦并非是简单的音符堆叠,它们之间有着规则和逻辑,要准确地生成和弦,需要考虑到和弦进行的规律和音乐的整体结构。

相关技术中的根据旋律生成和弦的方案,因现有模型往往忽略和弦进行的规则,且大多模型体量庞大,模型嵌套多,训练时间长,参数数量多且复杂缺乏智能性;同时,现有模型通常只考虑和弦的音高和节奏,而忽略了和弦的其他特征,例如:色彩、和声,进而使得生成的和弦序列听起来不够自然;再者,相关技术中的模型对旋律的输入特征提取不充分,且生成的和弦种类少,与旋律适配的效果不佳。

目前针对相关技术中利用相关模型进行根据旋律生成和弦的方案,生成的和弦视听不自然、与旋律适配效果不佳的问题,尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种基于LSTM的和弦旋律生成方法、装置、电子装置及介质,以至少解决相关技术中利用相关模型进行根据旋律生成和弦的方案,生成的和弦视听不自然、与旋律适配效果不佳的问题。

第一方面,本申请实施例提供了一种基于LSTM的和弦旋律生成方法,包括:对待匹配和弦旋律的第一旋律片段进行预编码处理,得到第一拟合参数,其中,所述预编码处理用于表征对旋律片段的复杂度的拟合处理;

利用已训备的特征提取模型对所述第一旋律片段进行处理,生成第一前端标签数据,并基于所述第一前端标签数据和所述第一拟合参数,生成第一标签数据,其中,所述第一标签数据用于表征对所述第一旋律片段待配的目标和弦片段的预期,所述特征提取模型是基于长短期记忆网络LSTM,并根据预设的第一样本旋律片段以及所述第一样本旋律片段对应的第一实谱和弦所对应的和弦分类进行训练的神经网络;

对所述第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,并利用已训备的和弦预测模型,处理所述第一旋律向量和所述第一标签数据,得到多个与所述第一旋律片段对应的候选和弦片段,其中,所述和弦预测模型是双向长短期记忆网络BLSTM网络,并根据预设的第二样本旋律片段对应的第二旋律向量、第二实谱和弦和第二标签数据训练的神经网络,所述第二标签数据是根据第二前端标签数据和对所述第二样本旋律片段进行预编码处理生成的第二拟合参数生成的,所述第二前端标签数据是利用所述特征提取模型对所述第二样本旋律片段进行处理生成的;

在多个所述候选和弦片段中,基于预设的选择策略,选取所述目标和弦片段,并将所述目标和弦片段作为所述第一旋律片段匹配的和弦。

第二方面,本申请实施例提供了一种基于LSTM的和弦旋律生成装置,包括:

预处理模块,用于对待匹配和弦旋律的第一旋律片段进行预编码处理,得到第一拟合参数,其中,所述预编码处理用于表征对旋律片段的复杂度的拟合处理;

提取模块,用于利用已训备的特征提取模型对所述第一旋律片段进行处理,生成第一前端标签数据,并基于所述第一前端标签数据和所述第一拟合参数,生成第一标签数据,其中,所述第一标签数据用于表征对所述第一旋律片段待配的目标和弦片段的预期,所述特征提取模型是基于长短期记忆网络LSTM,并根据预设的第一样本旋律片段以及所述第一样本旋律片段对应的第一实谱和弦所对应的和弦分类进行训练的神经网络;

预测模块,用于对所述第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,并利用已训备的和弦预测模型,处理所述第一旋律向量和所述第一标签数据,得到多个与所述第一旋律片段对应的候选和弦片段,其中,所述和弦预测模型是双向长短期记忆网络BLSTM网络,并根据预设的第二样本旋律片段对应的第二旋律向量、第二实谱和弦和第二标签数据训练的神经网络,所述第二标签数据是根据第二前端标签数据和对所述第二样本旋律片段进行预编码处理生成的第二拟合参数生成的,所述第二前端标签数据是利用所述特征提取模型对所述第二样本旋律片段进行处理生成的;

处理模块,用于在多个所述候选和弦片段中,基于预设的选择策略,选取所述目标和弦片段,并将所述目标和弦片段作为所述第一旋律片段匹配的和弦。

第三方面,本申请实施例提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于LSTM的和弦旋律生成方法的步骤。

第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的基于LSTM的和弦旋律生成方法的步骤。

相比于相关技术,本申请实施例提供的基于LSTM的和弦旋律生成方法、装置、电子装置及介质,通过对待匹配和弦旋律的第一旋律片段进行预编码处理,得到第一拟合参数;利用已训备的特征提取模型对所述第一旋律片段进行处理,生成第一前端标签数据,并基于所述第一前端标签数据和所述第一拟合参数,生成第一标签数据;对所述第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,并利用已训备的和弦预测模型,处理所述第一旋律向量和所述第一标签数据,得到多个与所述第一旋律片段对应的候选和弦片段;在多个所述候选和弦片段中,基于预设的选择策略,选取所述目标和弦片段,并将所述目标和弦片段作为所述第一旋律片段匹配的和弦,采用预编码处理对应的旋律片段,能够保留旋律片段的音乐性质,提高模型训练及和弦预测的准确率,同时,采用特征提取模型对第一旋律片段处理,并生成第一标签数据,加快和弦预测模型训练及预测输出速度,解决相关技术中利用相关模型进行根据旋律生成和弦的方案,生成的和弦视听不自然、与旋律适配效果不佳的问题。

本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是本申请实施例的基于LSTM的和弦旋律生成方法的终端的硬件结构框图;

图2是根据本申请实施例的基于LSTM的和弦旋律生成方法的流程图;

图3为曲线拟合示意图;

图4为样本旋律片段示意图;

图5是根据本申请实施例的基于LSTM的和弦旋律生成装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。

除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“多环节”是指大于或者等于两个的环节。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。

本实施例提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。以运行在终端上为例,图1是本申请实施例的基于LSTM的和弦旋律生成方法的终端的硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限定。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的基于LSTM的和弦旋律生成方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。

本实施例提供了一种运行于上述终端的基于LSTM的和弦旋律生成方法,图2是根据本申请实施例的基于LSTM的和弦旋律生成方法的流程图,如图2所示,该流程包括如下步骤:

步骤S201,对待匹配和弦旋律的第一旋律片段进行预编码处理,得到第一拟合参数,其中,预编码处理用于表征对旋律片段的复杂度的拟合处理。

在本实施例中,第一旋律片段是音乐设备数字接口(Musical equipment digitalinterface,简称MIDI)格式的音乐文件中的主旋律,而待匹配的和弦旋律为适配主旋律的伴奏;为了获取第一旋律片段的旋律特征,以通过后续处理生成自然且匹配度高的和弦,在本实施例中,对第一旋律片段采用拟合方式进行预编码处理,以确定表征该第一旋律片段的复杂度的旋律特征,进而得到对应的第一拟合参数;在本实施例中,第一拟合参数表示对第一旋律片段对应的音符的音高按照时间进行拟合,达到预设的拟合优度所需要的拟合次数,并将拟合次数作为对应的第一旋律片段复杂程度的特征体现。

步骤S202,利用已训备的特征提取模型对第一旋律片段进行处理,生成第一前端标签数据,并基于第一前端标签数据和第一拟合参数,生成第一标签数据,其中,第一标签数据用于表征对第一旋律片段待配的目标和弦片段的预期,特征提取模型是基于长短期记忆网络LSTM,并根据预设的第一样本旋律片段以及第一样本旋律片段对应的第一实谱和弦所对应的和弦分类进行训练的神经网络。

在本实施例中,在获得预编码处理生成的第一拟合参数后,利用训练好的特征提取模型,基于第一拟合参数,提取生成的和弦的初步特征,也就是第一前端标签数据是用于表征需要生成的和弦的预期,例如:和弦长度为预设值种类的和弦,具体地,设定第一前端标签数据所对应的值为4,则可以表示需要生成的和弦为4个节段的和弦,也可以是具体和弦种类的和弦;本申请实施例中,设定的和弦种类为38种,且对38中和弦种类分别进行编号,一个编号对应一个和弦种类,具体的和弦种类到整数编码(对应为第一前端标签数据)的映射如下表:

其中,#代表升调,b代表降调,m代表小调。

在本实施例中,为了进一步区分和弦的性质,通过考虑结合表征第一旋律片段对应的复杂程度的第一拟合参数,使的生成的第一标签数据所对应的和弦分类与第一旋律片段的匹配度更高,例如:设定第一前端标签数据所对应的值为4,第一拟合参数所对应的拟合次数为3次,而设定的第一拟合参数对第一标签数据的影响所对应的权重设定为0.1,则第一标签数据所对应的值为4.3,因而在后续预测生成和弦过程中,预测出的和弦的标签上对应有4.3这个值,则是可以作为目标和弦的和弦;需要理解的是,第一标签数据所对应的值,可以表示某种和弦与第一旋律片段的匹配程度,也可以是处于某些种类和弦中的任一种,例如:第一标签数据对应数字为4.3,则与第一旋律片段对应的和弦可以是上述表格中编号4、5对应的和弦。

在本实施例中,训练特征提取模型的过程中,会将第一样本旋律片段所对应的第一实谱和弦进行独热编码,并进行和弦类别的映射,以区分出第一实谱和弦所对应的和弦分类,进而基于对应的和弦分类进行模型训练,当进行特征提取时,利用训练好的特征提取模型,能提取到与第一和弦片段初步匹配的和弦分类。

步骤S203,对第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,并利用已训备的和弦预测模型,处理第一旋律向量和第一标签数据,得到多个与第一旋律片段对应的候选和弦片段,其中,和弦预测模型是双向长短期记忆网络BLSTM,并根据预设的第二样本旋律片段对应的第二旋律向量、第二实谱和弦和第二标签数据训练的神经网络,第二标签数据是根据第二前端标签数据和对第二样本旋律片段进行预编码处理生成的第二拟合参数生成的,第二前端标签数据是利用特征提取模型对第二样本旋律片段进行处理生成的。

在本实施例中,在采用和弦预测模型进行和弦预测之前,需要将第一和弦片段进行向量编码,也就是将第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,之后将第一旋律向量和第一标签数据作为数据输入和弦预测模型,进而输出匹配的多个候选和弦片段。

步骤S204,在多个候选和弦片段中,基于预设的选择策略,选取目标和弦片段,并将目标和弦片段作为第一旋律片段匹配的和弦。

通过上述步骤S201至步骤S204,采用对待匹配和弦旋律的第一旋律片段进行预编码处理,得到第一拟合参数;利用已训备的特征提取模型对第一旋律片段进行处理,生成第一前端标签数据,并基于第一前端标签数据和第一拟合参数,生成第一标签数据;对第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,并利用已训备的和弦预测模型,处理第一旋律向量和第一标签数据,得到多个与第一旋律片段对应的候选和弦片段;在多个候选和弦片段中,基于预设的选择策略,选取目标和弦片段,并将目标和弦片段作为第一旋律片段匹配的和弦,采用预编码处理对应的旋律片段,能够保留旋律片段的音乐性质,提高模型训练及和弦预测的准确率,同时,采用特征提取模型对第一旋律片段处理,并生成第一标签数据,加快和弦预测模型训练及预测输出速度,解决相关技术中利用相关模型进行根据旋律生成和弦的方案,生成的和弦视听不自然、与旋律适配效果不佳的问题。

需要说明的是,本申请实施例中,对于输入特征进行充分提取,并考虑音符序列时间因素,进而使的匹配的和弦自然,与第一旋律片段适配效果好。

需要进一步说明的是,基于拟合方式进行预编码处理和基于LSTM的和弦分类及匹配方法,该编码方式具有一定创造性,可以在编码尽可能简洁的前提下尽可能保留MIDI音乐片段的性质,增加了后续训练的有效性和训练效果;同时,在自然语言处理领域中,音乐方向虽然也属于NLP的范畴,但绝大多数都是音乐生成,很少有针对音乐和弦搭配、简化方向的算法实现,此外,绝大多数音乐生成依靠的都是大模型,有百万甚至千万级别的参数进行训练,虽然同为深度学习,本申请实施例在保证一定效果的情况下,尽可能减少了模型的规模,加快了训练速度。

在其中一些实施例中,预编码处理对应的旋律片段,包括如下步骤:

步骤21,获取待处理的目标旋律片段,其中,目标旋律片段包括第一旋律片段和第二样本旋律片段其中之一。

步骤22,将目标旋律片段中每个音符的开始时间和MIDI音高,转换到统一坐标系,生成二维坐标数据。

在本实施例中,对于训练阶段与和弦生成阶段会分别对样本旋律片段和待配和弦的旋律片段进行预编码处理;在本实施例中,将主旋律上的音符按照时间和音高绘制在图像上,如此,实现转换到统一坐标系,得到多个位于二维坐标系内的点坐标数据,也就是二维坐标数据。

步骤23,对二维坐标数据进行多项式拟合处理,得到达到预设拟合优度阈值的拟合次数,将将拟合次数作为对应的目标拟合参数,其中,目标拟合参数为第一拟合参数、和第二拟合参数其中之一。

在本实施例中,在将主旋律上的音符按照时间和音高绘制在图像上之后,使用n次多项式进行拟合,考虑到拟合次数n越大,拟合的效果肯定越好,在本实施例中,利用拟合优度R

通过上述步骤中的获取待处理的目标旋律片段,其中,目标旋律片段包括第一旋律片段和第二样本旋律片段其中之一;将目标旋律片段中每个音符的开始时间和MIDI音高,转换到统一坐标系,生成二维坐标数据;对二维坐标数据进行多项式拟合处理,得到达到预设拟合优度阈值的拟合次数,将将拟合次数作为对应的目标拟合参数,实现了对相应的旋律片段进行预编码处理,籍以获得旋律片段表征复杂程度的旋律特征,为特征提取模型的训练及利用特征提取模型提取特征提供指引。

在其中一些实施例中,在多个候选和弦片段中,基于预设的选择策略,选取目标和弦片段,通过如下步骤实现:

步骤31,确定每个候选和弦片段所对应的和弦类别标签,其中,和弦类别标签包括候选和弦类别片段对应的和弦类别的第一概率。

步骤32,按概率值由大到小的顺序,选取预设数目的第一概率,并将选取的第一概率所对应的候选和弦片段作为备选和弦片段。

步骤33,利用轮盘赌选择方法,从备选和弦片段中选出目标和弦片段。

在本实施例中,考虑到和弦的走向可能具有不确定性,且流行乐曲中的和弦具有一定的循环、周期性;在本实施例中,在预测的过程中, 选取第一概率排在前五的候选和弦片段作为备选和弦片段,并作为和弦预测模型的潜在输出,之后,采用轮盘赌的形式来确定当前的第一旋律片段对应的最终的目标和弦片段。

通过上述步骤中的确定每个候选和弦片段所对应的和弦类别标签,其中,和弦类别标签包括候选和弦类别片段对应的和弦类别的第一概率;按概率值由大到小的顺序,选取预设数目的第一概率,并将选取的第一概率所对应的候选和弦片段作为备选和弦片段;利用轮盘赌选择方法,从备选和弦片段中选出目标和弦片段,实现了确定出匹配度高且视听自然的目标和弦片段。

在其中一些实施例中,特征提取模型的训练步骤,包括如下步骤:

步骤41,从第一MIDI样本音乐文件中,获取第一样本旋律片段和第一实谱和弦。

在本实施例中,从14612首MIDI音乐片段中筛选出1824个片段,这些片段都是以柱式和弦的伴奏织体为主,取出初步的和弦特征和旋律特征。

步骤42,对第一样本旋律片段对应的音符的音高进行编码,生成第一样本旋律向量,并在从第一样本旋律向量中选取向量长度最长的第一标准旋律向量后,对所有第一样本旋律向量进行填充padding补零、词嵌入处理,生成第二标准旋律向量,其中,第二标准旋律向量的向量长度与第一标准旋律向量的向量长度相等。

在本实施例中,对第一样本旋律片段对应的音符的音高进行编码时,直接将音高转换对应的数字向量,例如:参考图4所示的样本旋律片段,对其音高进行编码后,生成如下的第一样本旋律向量[0,60,60,60,62,64]。

在本实施例中,因生成的第一旋律向量的向量长度有长短,为完成对LSTM的训练,采用先统计出最长的第一旋律向量的向量长度,经过padding补齐每个第一旋律向量的向量长度至最长的第一旋律向量的向量长度;然后,对每个第一旋律向量进行词嵌入操作,以生成向量长度一致的第二标准旋律向量。

步骤43,确定第一实谱和弦所对应的第一独热向量编码参数,其中,第一独热向量编码参数用于表征第一实谱和弦对应的和弦种类与和弦长度。

在本实施例中,对于样本的和弦,采用存储的和弦映射关系表确定对应的独热向量编码参数,进而确定对应的样本和弦片段对应的实谱和弦的和弦分类,例如:该实谱和弦的和弦种类和和弦长度。

步骤44,利用第二标准旋律向量和第一独热向量编码参数,对LSTM进行训练,直至收敛,生成特征提取模型。

在本实施例中,使用AdamW优化器和余弦退火算法动态调整学习率。

在其中一些实施例中,步骤43中的确定第一实谱和弦所对应的第一独热向量编码参数,包括如下步骤:

步骤431,获取独热向量参数表,其中,独热向量参数表包括第三实谱和弦、第二独热向量编码参数以及第三实谱和弦与第二独热向量编码参数两者之间的对应关系信息。

步骤432,在独热向量参数表中,查找与第一实谱和弦相同的第三实谱和弦所对应的第二独热向量编码参数,得到第一独热向量编码参数。

在其中一些实施例中,基于第一前端标签数据和对第一拟合参数,生成第一标签数据,通过如下步骤实现:

步骤51,获取第一前端标签数据和第一拟合参数。

步骤52,按如下公式得到第一标签数据L:

,其中,/>

在本实施例中,针对和弦本身设置了字典用于保存不同和弦的映射关系,同时将预编码处理得到的拟合参数也作为和弦本身的性质,使用上述公式得到第一标签数据作为和弦部分独热向量编码的依据,以更好地反映不同和弦的特征。

在其中一些实施例中,和弦预测模型的训练步骤,包括:

步骤61,从第二MIDI样本音乐文件提取第二样本旋律片段和第二实谱和弦,并利用特征提取模型,从第二样本旋律片段中提取对应的第二前端标签数据。

步骤62,对第二样本旋律片段进行预编码处理,生成第二拟合参数,并根据第二前端标签数据和第二拟合参数,生成第二标签数据。

步骤63,将第二样本旋律片段所对应的音符的音高进行编码,生成第二旋律向量,并将第二旋律向量和第二标签数据作为训练集、将第二实谱和弦作为验证集输入BLSTM网络中进行训练,直至收敛,得到和弦预测模型,其中,训练过程中,采用余弦退火算法对学习率进行调整。

本实施例还提供了基于LSTM的和弦旋律生成装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图5是根据本申请实施例的基于LSTM的和弦旋律生成装置的结构框图,如图5所示,该装置包括预处理模块51、提取模块52、预测模块53和处理模块54,其中,

预处理模块51,用于对待匹配和弦旋律的第一旋律片段进行预编码处理,得到第一拟合参数,其中,预编码处理用于表征对旋律片段的复杂度的拟合处理。

提取模块52,与预处理模块51耦合连接,用于利用已训备的特征提取模型对第一旋律片段进行处理,生成第一前端标签数据,并基于第一前端标签数据和第一拟合参数,生成第一标签数据,其中,第一标签数据用于表征对第一旋律片段待配的目标和弦片段的预期,特征提取模型是基于长短期记忆网络LSTM,并根据预设的第一样本旋律片段以及第一样本旋律片段对应的第一实谱和弦所对应的和弦分类进行训练的神经网络。

预测模块53,分别与预处理模块51和提取模块52耦合连接,用于对第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,并利用已训备的和弦预测模型,处理第一旋律向量和第一标签数据,得到多个与第一旋律片段对应的候选和弦片段,其中,和弦预测模型是双向长短期记忆网络BLSTM网络,并根据预设的第二样本旋律片段对应的第二旋律向量、第二实谱和弦和第二标签数据训练的神经网络,第二标签数据是根据第二前端标签数据和对第二样本旋律片段进行预编码处理生成的第二拟合参数生成的,第二前端标签数据是利用特征提取模型对第二样本旋律片段进行处理生成的。

处理模块54,与预测模块53耦合连接,用于在多个候选和弦片段中,基于预设的选择策略,选取目标和弦片段,并将目标和弦片段作为第一旋律片段匹配的和弦。

通过本申请实施例的基于LSTM的和弦旋律生成装置,采用对待匹配和弦旋律的第一旋律片段进行预编码处理,得到第一拟合参数;利用已训备的特征提取模型对第一旋律片段进行处理,生成第一前端标签数据,并基于第一前端标签数据和第一拟合参数,生成第一标签数据;对第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,并利用已训备的和弦预测模型,处理第一旋律向量和第一标签数据,得到多个与第一旋律片段对应的候选和弦片段;在多个候选和弦片段中,基于预设的选择策略,选取目标和弦片段,并将目标和弦片段作为第一旋律片段匹配的和弦,采用预编码处理对应的旋律片段,能够保留旋律片段的音乐性质,提高模型训练及和弦预测的准确率,同时,采用特征提取模型对第一旋律片段处理,并生成第一标签数据,加快和弦预测模型训练及预测输出速度,解决相关技术中利用相关模型进行根据旋律生成和弦的方案,生成的和弦视听不自然、与旋律适配效果不佳的问题。

在其中一些实施例中,该预处理模块51还用于:获取待处理的目标旋律片段,其中,目标旋律片段包括第一旋律片段和第二样本旋律片段其中之一;将目标旋律片段中每个音符的开始时间和MIDI音高,转换到统一坐标系,生成二维坐标数据;对二维坐标数据进行多项式拟合处理,得到达到预设拟合优度阈值的拟合次数,将将拟合次数作为对应的目标拟合参数,其中,目标拟合参数为第一拟合参数、和第二拟合参数其中之一。

在其中一些实施例中,该处理模块54进一步包括:

第一确定单元,用于确定每个候选和弦片段所对应的和弦类别标签,其中,和弦类别标签包括候选和弦类别片段对应的和弦类别的第一概率。

第一选取单元,与第一确定单元耦合连接,用于按概率值由大到小的顺序,选取预设数目的第一概率,并将选取的第一概率所对应的候选和弦片段作为备选和弦片段。

第一选择单元,与第一选取单元耦合连接,用于利用轮盘赌选择方法,从备选和弦片段中选出目标和弦片段。

在其中一些实施例中,基于LSTM的和弦旋律生成装置用于从第一MIDI样本音乐文件中,获取第一样本旋律片段和第一实谱和弦;对第一样本旋律片段对应的音符的音高进行编码,生成第一样本旋律向量,并在从第一样本旋律向量中选取向量长度最长的第一标准旋律向量后,对所有第一样本旋律向量进行填充padding补零、词嵌入处理,生成第二标准旋律向量,其中,第二标准旋律向量的向量长度与第一标准旋律向量的向量长度相等;确定第一实谱和弦所对应的第一独热向量编码参数,其中,第一独热向量编码参数用于表征第一实谱和弦对应的和弦种类与和弦长度;利用第二标准旋律向量和第一独热向量编码参数,对LSTM进行训练,直至收敛,生成特征提取模型。

在其中一些实施例中,基于LSTM的和弦旋律生成装置还用于获取独热向量参数表,其中,独热向量参数表包括第三实谱和弦、第二独热向量编码参数以及第三实谱和弦与第二独热向量编码参数两者之间的对应关系信息;在独热向量参数表中,查找与第一实谱和弦相同的第三实谱和弦所对应的第二独热向量编码参数,得到第一独热向量编码参数。

在其中一些实施例中,该提取模块52还用于:获取第一前端标签数据和第一拟合参数;按如下公式得到第一标签数据L:

在其中一些实施例中,基于LSTM的和弦旋律生成装置用于从第二MIDI样本音乐文件提取第二样本旋律片段和第二实谱和弦,并利用特征提取模型,从第二样本旋律片段中提取对应的第二前端标签数据;对第二样本旋律片段进行预编码处理,生成第二拟合参数,并根据第二前端标签数据和第二拟合参数,生成第二标签数据;将第二样本旋律片段所对应的音符的音高进行编码,生成第二旋律向量,并将第二旋律向量和第二标签数据作为训练集、将第二实谱和弦作为验证集输入BLSTM网络中进行训练,直至收敛,得到和弦预测模型,其中,训练过程中,采用余弦退火算法对学习率进行调整。

本实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

S1,对待匹配和弦旋律的第一旋律片段进行预编码处理,得到第一拟合参数,其中,预编码处理用于表征对旋律片段的复杂度的拟合处理。

S2,利用已训备的特征提取模型对第一旋律片段进行处理,生成第一前端标签数据,并基于第一前端标签数据和第一拟合参数,生成第一标签数据,其中,第一标签数据用于表征对第一旋律片段待配的目标和弦片段的预期,特征提取模型是基于长短期记忆网络LSTM,并根据预设的第一样本旋律片段以及第一样本旋律片段对应的第一实谱和弦所对应的和弦分类进行训练的神经网络。

S3,对第一旋律片段所对应的音符的音高进行编码,生成第一旋律向量,并利用已训备的和弦预测模型,处理第一旋律向量和第一标签数据,得到多个与第一旋律片段对应的候选和弦片段,其中,和弦预测模型是双向长短期记忆网络BLSTM,并根据预设的第二样本旋律片段对应的第二旋律向量、第二实谱和弦和第二标签数据训练的神经网络,第二标签数据是根据第二前端标签数据和对第二样本旋律片段进行预编码处理生成的第二拟合参数生成的,第二前端标签数据是利用特征提取模型对第二样本旋律片段进行处理生成。

S4,在多个候选和弦片段中,基于预设的选择策略,选取目标和弦片段,并将目标和弦片段作为第一旋律片段匹配的和弦。

需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。

另外,结合上述实施例中的基于LSTM的和弦旋律生成方法,本申请实施例可提供一种存储介质来实现,该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种基于LSTM的和弦旋律生成方法。

本领域的技术人员应该明白,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 一种面向道路场景的三维语义地图构建和存储方法
  • 一种基于PointNet网络优化的语义地图构建方法
  • 一种基于语义逆深度滤波的实时语义地图构建方法
技术分类

06120116553096