掌桥专利:专业的专利平台
掌桥专利
首页

佛乐歌曲推荐方法、装置、设备及存储介质

文献发布时间:2023-06-19 11:32:36


佛乐歌曲推荐方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域,尤其涉及一种佛乐歌曲推荐方法、装置、设备及存储介质。

背景技术

佛乐,追根溯源是佛教徒在佛菩萨前歌诵、供养、止断、赞叹的颂歌。经过几千年的发展,如今其种类与风格众多。如今用户可以随时使用手机等工具播放佛乐,若可以根据用户在不同的环境和心境下的喜好来进行不同风格的佛乐推荐可以使推荐的佛乐更符合用户心理预期,提升用户的好感度。此外,在有关佛学短视频配乐的应用场景下,基于佛乐内容的背景歌曲推荐也存在很大的实用价值,比如基于视频内容进行背景歌曲推荐,需要快速找到与视频内容相关的音乐,用于短视频配乐。

但现有技术中,佛乐大多是以标签或播放列表的形式存在,故对佛乐进行推荐时因为有限的可用数据很少,推荐准确度十分受限,存在推荐精度较低的情况;特别是标有特定活动的歌曲想要准确推荐需要大量的人工标记,十分耗时。

发明内容

本发明的主要目的在于解决现有的技术中通过人工对歌曲标记实现歌曲推荐的方式,推荐精度较低的技术问题。

本发明第一方面提供了一种佛乐歌曲推荐方法,包括:

获取待推荐的佛乐歌曲列表;

利用预置佛乐自动标记模型,对佛乐歌曲列表中的每首佛乐歌曲的关键词进行预测,并基于预测的结果进行标记,得到标记佛乐歌曲列表;

获取当前用户的歌曲需求,并从所述歌曲需求中提取需求关键词信息;

基于所述需求关键词信息从所述标记佛乐歌曲列表选择满足预设条件的佛乐歌曲,推荐给用户。

可选的,在本发明第一方面的第一种实现方式中,所述利用预置佛乐自动标记模型,对佛乐歌曲列表中的每首佛乐歌曲的关键词进行预测,并基于预测的结果进行标记,得到标记佛乐歌曲列表包括:

获取现有佛乐相关的播放列表的信息,对现有佛乐歌曲进行关键词的标记,得到现有佛乐歌曲关键词信息;

对现有佛乐歌曲关键词信息整理并分析,得到现有佛乐数据集;

使用现有佛乐数据集对多层卷积神经网络模型进行训练,构建出佛乐自动标记模型。

可选的,在本发明第一方面的第二种实现方式中,所述基于所述需求关键词信息从所述标记佛乐歌曲列表选择满足需求关键词预设条件的佛乐歌曲,推荐给用户包括:

统计标记佛乐歌曲列表中各歌曲的关键词的分布情况;

基于所述关键词的分布情况,选择与所述需求关键词相关度高的歌曲进行推荐。

可选的,在本发明第一方面的第三种实现方式中,所述获取现有佛乐相关的播放列表的信息,对现有佛乐歌曲进行关键词的标记,得到现有佛乐歌曲关键词信息包括:

获取与佛乐相关的现有播放列表的标题,在所述现有播放列表的标题中提取至少一个关键词;

对现有播放列表进行筛选,将含有大于预设佛乐歌曲数量的播放列表及含有单个艺术家的佛乐歌曲占比过多的播放列表剔除,并将筛选后的现有播放列表根据关键词组成不同的播放列表集;

将所述播放列表集的关键词标记为在所述播放列表集中出现次数大于预设次数的佛乐歌曲的关键词。

可选的,在本发明第一方面的第四种实现方式中,所述对现有佛乐歌曲关键词信息整理并分析,得到现有佛乐数据集包括:

采用样本级加权交叉熵作为损失函数,降低缺失少关键词信息的预测结果的权重,修正关键词预测的结果。

可选的,在本发明第一方面的第五种实现方式中,所述基于分布情况,选择与所述需求关键词相关度高的歌曲进行推荐包括:

计算单首歌曲中各关键词出现的频率,选择所述需求关键词出现频率高的歌曲。

基于所述单首歌曲中出现同类关键词的占比,根据所述需求关键词,选择与所述需求关键词的同类关键词占比较大的歌曲推荐给用户。

可选的,在本发明第一方面的第六种实现方式中,所述基于分布情况,选择相关度高的歌曲进行推荐包括:

基于分布情况,计算单首歌曲中出现同类关键词的占比;

基于所述单首歌曲中出现同类关键词的占比,根据所述需求关键词,选择与所述需求关键词的同类关键词占比较大的歌曲推荐给用户。

本发明第二方面提供了一种佛乐歌曲推荐装置,包括:

获取模块,用于获取待推荐的佛乐歌曲列表;

自动标记模块,用于利用预置佛乐自动标记模型,对佛乐歌曲列表中的每首佛乐歌曲的关键词进行预测,并基于预测的结果进行标记,得到标记佛乐歌曲列表;

需求筛选模块,用于获取当前用户的歌曲需求,并从所述歌曲需求中提取需求关键词信息;

推荐模块,用于基于所述需求关键词信息从所述标记佛乐歌曲列表选择满足预设条件的佛乐歌曲,推荐给用户。

可选的,在本发明第一方面的第一种实现方式中,所述自动标记模块包括:

信息收集单元,用于获取现有佛乐相关的播放列表的信息,对现有佛乐歌曲进行关键词的标记,得到现有佛乐歌曲关键词信息;

数据整理单元,用于对现有佛乐歌曲关键词信息整理并分析,得到现有佛乐数据集;

模型构建单元,使用现有佛乐数据集对多层卷积神经网络模型进行训练,构建出佛乐自动标记模型。

可选的,在本发明第一方面的第二种实现方式中,所述推荐模块包括:

统计单元,用于统计标记佛乐歌曲列表中各歌曲的关键词的分布情况;

自动推荐单元,用于基于所述关键词的分布情况,选择与所述需求关键词相关度高的歌曲进行推荐。

可选的,在本发明第一方面的第三种实现方式中,所述信息收集单元包括:

提取子单元,用于获取与佛乐相关的现有播放列表的标题,在所述现有播放列表的标题中提取至少一个关键词;

筛选子单元,用于对现有播放列表进行筛选,将含有大于预设佛乐歌曲数量的播放列表及含有单个艺术家的佛乐歌曲占比过多的播放列表剔除,并将筛选后的现有播放列表根据关键词组成不同的播放列表集;

标记子单元,用于将所述播放列表集的关键词标记为在所述播放列表集中出现次数大于预设次数的佛乐歌曲的关键词。

可选的,在本发明第一方面的第四种实现方式中,所述数据整理单元包括:

修正子单元,用于采用样本级加权交叉熵作为损失函数,降低缺失少关键词信息的预测结果的权重,修正关键词预测的结果。

可选的,在本发明第一方面的第五种实现方式中,所述统计单元具体用于:

计算单首歌曲中各关键词出现的频率;

所述自动推荐单元具体用于:基于单首歌曲中各关键词出现的频率,选择歌曲进行推荐。

可选的,在本发明第一方面的第六种实现方式中,所述统计单元具体用于:

基于分布情况,计算单首歌曲中出现同类关键词的占比;

所述自动推荐单元具体用于:基于单首歌曲中出现同类关键词的占比,选择歌曲进行推荐。

本发明第三方面提供了一种佛乐歌曲推荐设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述佛乐歌曲推荐设备执行上述的佛乐歌曲推荐方法。

本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的佛乐歌曲推荐方法。

本发明提供的技术方案中,通过预置佛乐自动标记模型,对佛乐歌曲列表中的每首佛乐歌曲的关键词进行预测和标记,基于当前用户的歌曲需求的需求关键词信息;从标记后的佛乐歌曲列表选择满足预设条件的佛乐歌曲,推荐给用户。本发明实施例中,所采用的方案提高了佛乐歌曲的标记准确度,提升歌曲推荐的便利性和佛乐歌曲推荐的准确度,为用户推荐符合心理预期的佛乐,提升用户的体验。

附图说明

图1为本发明实施例中佛乐歌曲推荐方法的第一种实施例的流程示意图;

图2为本发明实施例中佛乐歌曲推荐方法的第二种实施例的流程示意图;

图3为本发明实施例中佛乐歌曲推荐方法的第三种实施例的流程示意图;

图4为本发明实施例中佛乐歌曲推荐方法的第四种实施例的流程示意图;

图5为本发明实施例中佛乐歌曲推荐装置的第一种实施例示意图;

图6为本发明实施例中佛乐歌曲推荐装置的第二种实施例示意图;

图7为本发明实施例中佛乐歌曲推荐设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种佛乐歌曲推荐方法、装置、设备及存储介质,通过预置佛乐自动标记模型,对佛乐歌曲列表中的每首佛乐歌曲的关键词进行预测和标记,基于当前用户的歌曲需求的需求关键词信息;从标记后的佛乐歌曲列表选择满足预设条件的佛乐歌曲,推荐给用户。本发明的技术方案提高了佛乐歌曲的标记准确度,极大提升了佛乐歌曲推荐的准确度,为用户推荐符合心理预期的佛乐歌曲,提升用户的体验。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中佛乐歌曲推荐方法的一个实施例包括以下步骤:

101、获取待推荐的佛乐歌曲列表;

该步骤中,从网络下载或其他方式获取佛乐歌曲。所述佛乐歌曲包括缺失关键词信息的歌曲。在这些歌曲中,很多并无具有意义的中文标题或者歌词,甚至有些佛乐歌曲是以编号作为曲名的纯音乐。将这些从网络上获取到的待推荐的佛乐歌曲组成待推荐佛乐列表。

可以理解的是,本发明的执行主体可以为佛乐歌曲推荐装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

102、对待推荐的佛乐歌曲列表中的关键词进行预测,得到标记佛乐歌曲列表;

该步骤中,首先要进行佛乐自动标记模型的构建。首先获取网络上现有的佛乐相关的播放列表的信息,其中所述播放列表的信息包括播放列表的名称、标签、列表中的佛乐歌曲的作者以及被播放的次数、播放时间等信息。

从获得到的播放列表的信息中提取关键词,在获得的关键词基础上再添加与已获得的关键词语义相似的关键词。随后,将这些关键词分为四个类别,具体地,将关键词分为“曲目类别”、“活动”、“时间”和“情绪”四个类别。在具体实施过程中,选出关于佛乐歌曲的13个最常见的关键词,分别是“放松”、“礼拜”、“睡眠”、“安静”、“讲经”、“纯音乐”、“治愈”、“静心”、“朝时课诵”、“暮时课诵”、“汉传”、“藏传”、“器乐”。

确定好关于佛乐歌曲的关键词后,接下来对现有的佛乐歌曲标记关键词。首先收集包含以上13个关键词中的任意一个关键词的公开播放列表数据,根据获得到的播放列表的关键词,对播放列表中的佛乐歌曲进行关键词的标记。具体地,若在这些公开的播放列表中,某一佛乐歌曲同时在3个含有“睡眠”的播放列表中,4个含有“静心”的播放列表中,1个含有“礼拜”的播放列表中,那么这首佛乐歌曲将会被标记上“睡眠”和“静心”两个关键词。

对已经标记好关键词的佛乐歌曲进行整理并分析,得到现有佛乐数据集;随后,利用整理得到的现有佛乐数据集作为训练数据,对多层卷积神经网络模型进行训练,构建出佛乐自动标记模型。

在获得佛乐自动标记模型后,即可对未知的佛乐歌曲基于歌曲歌词或音轨特征内容识别来进行关键词的预测。对上步骤中获得到的待推荐佛乐歌曲列表中的歌曲做好关键词的预测与标注,将标记好关键词的佛乐歌曲组成标记佛乐歌曲列表。

103、获取用户歌曲需求,从歌曲需求中提取需求关键词信息;

具体地,歌曲需求可能与用户曾经收藏或者标记喜爱的歌曲风格、当前播放歌曲的时间、地点以及上一曲播放过的歌曲风格等信息有关,根据这些信息,从中提取出当前用户可能歌曲需求关键词信息。

104、选择满足预设条件的佛乐歌曲推荐给用户。

在本步骤中,根据提取出的当前用户的歌曲需求关键词,将满足歌曲需求关键词条件的佛乐歌曲推荐给用户。

本发明实施例中,使用构建出的自动标记模型将无关键词标记的佛乐歌曲进行内容识别与关键词标记,根据用户的当前需求关键词推荐具有所述关键词的歌曲,提高了佛乐歌曲的标记准确度,提升歌曲推荐的便利性和佛乐歌曲推荐的准确度,为用户推荐符合心理预期的佛乐歌曲,提升用户的体验。

请参阅图2,本发明实施例中佛乐歌曲推荐方法的另一个实施例包括:

201、获取待推荐的佛乐歌曲列表;

该步骤中,从网络下载或其他方式获取佛乐歌曲。所述佛乐歌曲包括缺失关键词信息的歌曲。在这些歌曲中,很多并无具有意义的中文标题或者歌词,甚至有些佛乐歌曲是以编号作为曲名的纯音乐。将这些从网络上获取到的待推荐的佛乐歌曲组成待推荐佛乐列表。

可以理解的是,本发明的执行主体可以为佛乐歌曲推荐装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

202、获取并筛选现有佛乐播放列表信息,建立佛乐自动标记模型;

该步骤中,首先要进行佛乐自动标记模型的构建。首先获取网络上现有的佛乐相关的播放列表的信息,其中所述播放列表的信息包括播放列表的名称、标签、列表中的佛乐歌曲的作者以及被播放的次数、播放时间等信息。

从获得到的播放列表的信息中提取关键词,在获得的关键词基础上再添加与已获得的关键词语义相似的关键词。随后,将这些关键词分为四个类别,具体地,将关键词分为“曲目类别”、“活动”、“时间”和“情绪”四个类别。在具体实施过程中,选出关于佛乐歌曲的13个最常见的关键词,分别是“放松”、“礼拜”、“睡眠”、“安静”、“讲经”、“纯音乐”、“治愈”、“静心”、“朝时课诵”、“暮时课诵”、“汉传”、“藏传”、“器乐”。

确定好关于佛乐歌曲的关键词后,接下来将根据关键词筛选佛乐歌曲的播放列表。首先收集包含以上13个关键词中的任意一个关键词的公开播放列表数据,考虑到包含很多佛乐歌曲的播放列表中歌曲之间的关联不大,这些列表作为数据时会导致噪声过大的问题,从收集到的佛乐歌曲播放列表中删除了包含歌曲超过150首的佛乐歌曲播放列表。此外,还删除了所有单个艺术家的歌曲或专辑在其中超过30%的佛乐歌曲播放列表,以确保该佛乐歌曲播放列表不是针对某一位艺术家的。从而剔除这些容易产生噪声的播放列表,可以减少获得的数据噪声。

根据获得到的播放列表的关键词,对播放列表中的佛乐歌曲进行关键词的标记。具体地,若在这些公开的播放列表中,某一佛乐歌曲同时在3个含有“睡眠”的播放列表中,4个含有“静心”的播放列表中,1个含有“礼拜”的播放列表中,那么这首佛乐歌曲将会被标记上“睡眠”和“静心”两个关键词。

对已经标记好关键词的佛乐歌曲进行整理并分析,得到现有佛乐数据集。其中,佛乐数据集中包含佛乐歌曲的音轨特征、歌词内容、歌曲节奏、歌曲长度等信息。随后,利用整理得到的现有佛乐数据集作为训练数据,对多层卷积神经网络模型进行训练,构建出佛乐自动标记模型。

203、对待推荐的佛乐歌曲列表中的关键词进行预测,得到标记佛乐歌曲列表;

在获得佛乐自动标记模型后,利用佛乐自动标记模型,根据未知关键词的佛乐歌曲的音轨特征、歌词内容、歌曲节奏、歌曲长度等信息对未知的佛乐歌曲来进行关键词的预测。

具体地,对上步骤中获得到的待推荐佛乐歌曲列表中的歌曲做好关键词的预测与标注,将标记好关键词的佛乐歌曲组成标记佛乐歌曲列表。

204、获取用户歌曲需求,从歌曲需求中提取需求关键词信息;

具体地,歌曲需求可能与用户曾经收藏或者标记喜爱的歌曲风格、当前播放歌曲的时间、地点以及上一曲播放过的歌曲风格等信息有关,根据这些信息,从中提取出当前用户可能歌曲需求关键词信息。

205、计算单首歌曲中各关键词出现的频率,选择所述需求关键词出现频率高的歌曲推荐给用户;

在步骤203中,对未知歌曲的标记可以进行多次,通过识别不同歌曲选段进行识别和关键词的标记,同时记录下被标记的关键词的频率。在进行推荐时,计算并比较待推荐佛乐列表中的佛乐歌曲的各关键词出现的频率,在获得到需求关键词时,选择需求关键词出现的频率高的歌曲进行推荐。

本发明实施例中,使用构建出的自动标记模型将无关键词标记的佛乐歌曲进行内容识别与关键词标记,根据用户的当前需求关键词推荐具有所述关键词的歌曲。提高了佛乐歌曲的标记准确度,提升歌曲推荐的便利性和佛乐歌曲推荐的准确度,为用户推荐符合心理预期的佛乐歌曲,提升用户的体验。

请参阅图3,本发明实施例中佛乐歌曲推荐方法的另一个实施例包括:

301、获取待推荐的佛乐歌曲列表;

该步骤中,从网络下载或其他方式获取佛乐歌曲。所述佛乐歌曲包括缺失关键词信息的歌曲。在这些歌曲中,很多并无具有意义的中文标题或者歌词,甚至有些佛乐歌曲是以编号作为曲名的纯音乐。将这些从网络上获取到的待推荐的佛乐歌曲组成待推荐佛乐列表。

可以理解的是,本发明的执行主体可以为佛乐歌曲推荐装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

302、获取并筛选现有佛乐播放列表信息,建立佛乐自动标记模型;

该步骤中,首先要进行佛乐自动标记模型的构建。首先获取网络上现有的佛乐相关的播放列表的信息,其中所述播放列表的信息包括播放列表的名称、标签、列表中的佛乐歌曲的作者以及被播放的次数、播放时间等信息。

从获得到的播放列表的信息中提取关键词,在获得的关键词基础上再添加与已获得的关键词语义相似的关键词。随后,将这些关键词分为四个类别,具体地,将关键词分为“曲目类别”、“活动”、“时间”和“情绪”四个类别。在具体实施过程中,选出关于佛乐歌曲的13个最常见的关键词,分别是“放松”、“礼拜”、“睡眠”、“安静”、“讲经”、“纯音乐”、“治愈”、“静心”、“朝时课诵”、“暮时课诵”、“汉传”、“藏传”、“器乐”。

确定好关于佛乐歌曲的关键词后,接下来将根据关键词筛选佛乐歌曲的播放列表。首先收集包含以上13个关键词中的任意一个关键词的公开播放列表数据,考虑到包含很多佛乐歌曲的播放列表中歌曲之间的关联不大,这些列表作为数据时会导致噪声过大的问题,从收集到的佛乐歌曲播放列表中删除了包含歌曲超过150首的佛乐歌曲播放列表。此外,还删除了所有单个艺术家的歌曲或专辑在其中超过30%的佛乐歌曲播放列表,以确保该佛乐歌曲播放列表不是针对某一位艺术家的。从而剔除这些容易产生噪声的播放列表,可以减少获得的数据噪声。

根据获得到的播放列表的关键词,对播放列表中的佛乐歌曲进行关键词的标记。具体地,若在这些公开的播放列表中,某一佛乐歌曲同时在3个含有“睡眠”的播放列表中,4个含有“静心”的播放列表中,1个含有“礼拜”的播放列表中,那么这首佛乐歌曲将会被标记上“睡眠”和“静心”两个关键词。

其中,佛乐数据集中包含佛乐的音轨特征、歌词内容、歌曲节奏、歌曲长度等信息。随后,利用整理得到的现有佛乐数据集作为训练数据,对多层卷积神经网络模型进行训练,构建出佛乐自动标记模型。

303、对待推荐的佛乐歌曲列表中的歌曲进行关键词预测,对预测结果进行修正,得到标记佛乐歌曲列表;

在获得佛乐自动标记模型后,利用佛乐自动标记模型,根据未知关键词的佛乐歌曲的音轨特征、歌词内容、歌曲节奏、歌曲长度等信息对未知的佛乐歌曲来进行关键词的预测。

在具体的实施例中,考虑到某些佛乐歌曲关键词的判断还需要关于用户的额外信息以及缺失关键词的负标签的问题,我们将使用样本级加权交叉熵替代现有技术的二元交叉熵作为损失函数对获取到的佛乐歌曲的关键词信息进行修正。

在本实施例中,通过在损失函数中添加加权因子的方式来考虑缺失负标签的关键词的置信度,为正负标签的每个佛乐歌曲样本加上基于置信度的权重,可以通过降低对关键词标签置信度不高的佛乐歌曲样本的权重来提高模型预测正确歌曲关键词的性能。

现有技术中,交叉熵由两项组成,其中一项在具有相关关键词时即标签为正时起作用,另一项在不具有相关关键词时即标记为零时起作用。本实施例中修改每一项以增加一个权重因子,一个权重因子与每个佛乐歌曲样本对拥有正标签(即符合相关关键词)时的置信度相关,另一个权重因子与对负标签(即不符合相关关键词)时的置信度相关;下式为构建出的佛乐自动标记模型进行佛乐歌曲关键词自动标记时的损失函数:

其中,ω

由于一般情况下不缺少关键词的正标签,所以只需要给关键词的负标签增加置信权值。本实施例中,采用检测一首佛乐歌曲中关键词之间的相关性来判断是否缺少负标签。

对于负权值,置信度定义为:

对于正权值,建议使用词频-逆文本频率指数(TF-IDF,term frequency inversedocument frequency):

与非现有技术相比,使用特定的加权方案可以改善预测的结果。将标记好关键词的佛乐歌曲组成标记佛乐歌曲列表。

305、计算单首歌曲中各关键词出现的频率,选择所述需求关键词出现频率高的歌曲推荐给用户;

在本实施例中,步骤303中,对未知歌曲的标记可以进行多次,通过识别不同歌曲选段进行识别和关键词的标记,同时记录下被标记的关键词的频率。在进行推荐时,计算并比较待推荐佛乐列表中的佛乐歌曲的各关键词出现的频率,在获得到需求关键词时,选择需求关键词出现的频率高的歌曲进行推荐。

本发明实施例中,使用构建出的自动标记模型将无关键词标记的佛乐歌曲进行内容识别与关键词标记,根据用户的当前需求关键词推荐具有所述关键词的歌曲。其中,自动标记模型还利用了样本级加权交叉熵作为损失函数来修正了关键词预测的性能。本实施例的方案提高了佛乐歌曲的标记准确度,大大提高了佛乐歌曲推荐的准确性,同时提升歌曲推荐的便利性,为用户推荐符合心理预期的佛乐歌曲,提升用户的体验。

请参阅图4,本发明实施例中佛乐歌曲推荐方法的另一个实施例包括:

401、获取待推荐的佛乐歌曲列表;

该步骤中,从网络下载或其他方式获取佛乐歌曲。所述佛乐歌曲包括缺失关键词信息的歌曲。在这些歌曲中,很多并无具有意义的中文标题或者歌词,甚至有些佛乐歌曲是以编号作为曲名的纯音乐。将这些从网络上获取到的待推荐的佛乐歌曲组成待推荐佛乐列表。

可以理解的是,本发明的执行主体可以为佛乐歌曲推荐装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

402、获取并筛选现有佛乐播放列表信息,建立佛乐自动标记模型;

该步骤中,首先要进行佛乐自动标记模型的构建。首先获取网络上现有的佛乐相关的播放列表的信息,其中所述播放列表的信息包括播放列表的名称、标签、列表中的佛乐歌曲的作者以及被播放的次数、播放时间等信息。

从获得到的播放列表的信息中提取关键词,在获得的关键词基础上再添加与已获得的关键词语义相似的关键词。随后,将这些关键词分为四个类别,具体地,将关键词分为“曲目类别”、“活动”、“时间”和“情绪”四个类别。在具体实施过程中,选出关于佛乐歌曲的13个最常见的关键词,分别是“放松”、“礼拜”、“睡眠”、“安静”、“讲经”、“纯音乐”、“治愈”、“静心”、“朝时课诵”、“暮时课诵”、“汉传”、“藏传”、“器乐”。

确定好关于佛乐歌曲的关键词后,接下来将根据关键词筛选佛乐歌曲的播放列表。首先收集包含以上13个关键词中的任意一个关键词的公开播放列表数据,考虑到包含很多佛乐歌曲的播放列表中歌曲之间的关联不大,这些列表作为数据时会导致噪声过大的问题,从收集到的佛乐歌曲播放列表中删除了包含歌曲超过150首的佛乐歌曲播放列表。此外,还删除了所有单个艺术家的歌曲或专辑在其中超过30%的佛乐歌曲播放列表,以确保该佛乐歌曲播放列表不是针对某一位艺术家的。从而剔除这些容易产生噪声的播放列表,可以减少获得的数据噪声。

根据获得到的播放列表的关键词,对播放列表中的佛乐歌曲进行关键词的标记。具体地,若在这些公开的播放列表中,某一佛乐歌曲同时在3个含有“睡眠”的播放列表中,4个含有“静心”的播放列表中,1个含有“礼拜”的播放列表中,那么这首佛乐歌曲将会被标记上“睡眠”和“静心”两个关键词。

其中,佛乐数据集中包含佛乐的音轨特征、歌词内容、歌曲节奏、歌曲长度等信息。随后,利用整理得到的现有佛乐数据集作为训练数据,对多层卷积神经网络模型进行训练,构建出佛乐自动标记模型。

403、对待推荐的佛乐歌曲列表中的歌曲进行关键词预测,对预测结果进行修正,得到标记佛乐歌曲列表;

在获得佛乐自动标记模型后,利用佛乐自动标记模型,根据未知关键词的佛乐歌曲的音轨特征、歌词内容、歌曲节奏、歌曲长度等信息对未知的佛乐歌曲来进行关键词的预测。

在具体的实施例中,考虑到某些佛乐歌曲关键词的判断还需要关于用户的额外信息以及缺失关键词的负标签的问题,我们将使用样本级加权交叉熵替代现有技术的二元交叉熵作为损失函数对获取到的佛乐歌曲的关键词信息进行修正。

在本实施例中,通过在损失函数中添加加权因子的方式来考虑缺失负标签的关键词的置信度,为正负标签的每个佛乐歌曲样本加上基于置信度的权重,可以通过降低对关键词标签置信度不高的佛乐歌曲样本的权重来提高模型预测正确歌曲关键词的性能。

现有技术中,交叉熵由两项组成,其中一项在具有相关关键词时即标签为正时起作用,另一项在不具有相关关键词时即标记为零时起作用。本实施例中修改每一项以增加一个权重因子,一个权重因子与每个佛乐歌曲样本对拥有正标签(即符合相关关键词)时的置信度相关,另一个权重因子与对负标签(即不符合相关关键词)时的置信度相关;下式为构建出的佛乐自动标记模型进行佛乐歌曲关键词自动标记时的损失函数:

其中,ω

由于一般情况下不缺少关键词的正标签,所以只需要给关键词的负标签增加置信权值。本实施例中,采用检测一首佛乐歌曲中关键词之间的相关性来判断是否缺少负标签。

对于负权值,置信度定义为:

对于正权值,建议使用词频-逆文本频率指数(TF-IDF,term frequency inversedocument frequency):

与非现有技术相比,使用特定的加权方案可以改善预测的结果。将标记好关键词的佛乐歌曲组成标记佛乐歌曲列表。

404、获取用户歌曲需求,从歌曲需求中提取需求关键词信息;

具体地,歌曲需求可能与用户曾经收藏或者标记喜爱的歌曲风格、当前播放歌曲的时间、地点以及上一曲播放过的歌曲风格等信息有关,根据这些信息,从中提取出当前用户可能歌曲需求关键词信息。

405、基于所述单首歌曲中出现同类关键词的占比,选择与所述需求关键词的同类关键词占比较大的歌曲推荐给用户;

获取待推荐佛乐歌曲列表中歌曲关键词的分布情况,计算单首歌曲中出现同类关键词的占比;基于所述单首歌曲中出现同类关键词的占比,根据所述需求关键词,选择与所述需求关键词的同类关键词占比较大的歌曲推荐给用户。具体地,在实施过程中,“放松”、“安静”和“静心”为“情绪”类的关键词,当获取到用户的需求关键词为“放松”时,在待推荐歌曲列表中获得到具有“放松”和“安静”两个关键词的待推荐佛乐歌曲以及“放松”、“安静”和“静心”三个关键词的待推荐佛乐歌曲,则在向用户推荐佛乐歌曲时,优先选择具有“放松”、“安静”和“静心”三个关键词的待推荐佛乐歌曲对用户进行推荐。

本发明实施例中,使用构建出的自动标记模型将无关键词标记的佛乐歌曲进行内容识别与关键词标记,根据用户的当前需求关键词推荐具有所述关键词的歌曲。其中,自动标记模型还利用了样本级加权交叉熵作为损失函数来修正了关键词预测的性能。本实施例的方案提高了佛乐歌曲的标记准确度,大大提高了佛乐歌曲推荐的准确性,同时提升歌曲推荐的便利性,为用户推荐符合心理预期的佛乐歌曲,提升用户的体验。

上面对本发明实施例中佛乐歌曲推荐方法进行了描述,下面对本发明实施例中佛乐歌曲推荐装置进行描述,请参阅图5,本发明实施例中佛乐歌曲推荐装置一个实施例包括:

获取模块501,用于获取待推荐的佛乐歌曲列表;

自动标记模块502,用于利用预置佛乐自动标记模型,对佛乐歌曲列表中的每首佛乐歌曲的关键词进行预测,并基于预测的结果进行标记,得到标记佛乐歌曲列表;

需求筛选模块503,用于获取当前用户的歌曲需求,并从所述歌曲需求中提取需求关键词信息;

推荐模块504,用于基于所述需求关键词信息从所述标记佛乐歌曲列表选择满足预设条件的佛乐歌曲,推荐给用户。

本实施例中,利用构建出的自动标记模型将无关键词标记的佛乐歌曲进行内容识别与关键词标记,根据用户的当前需求关键词推荐具有所述关键词的歌曲。提高了歌曲推荐的准确性,一定程度上按照用户的心理预期推荐佛乐歌曲,提升用户的便利性和体验。

请参阅图6,本发明实施例中佛乐歌曲推荐装置的另一个实施例包括:

获取模块501,用于获取待推荐的佛乐歌曲列表;

自动标记模块502,用于利用预置佛乐自动标记模型,对佛乐歌曲列表中的每首佛乐歌曲的关键词进行预测,并基于预测的结果进行标记,得到标记佛乐歌曲列表;

需求筛选模块503,用于获取当前用户的歌曲需求,并从所述歌曲需求中提取需求关键词信息;

推荐模块504,用于基于所述需求关键词信息从所述标记佛乐歌曲列表选择满足预设条件的佛乐歌曲,推荐给用户。

在本实施例中,所述自动标记模块502还包括:

信息收集单元5021,用于获取现有佛乐相关的播放列表的信息,对现有佛乐歌曲进行关键词的标记,得到现有佛乐歌曲关键词信息;

数据整理单元5022,用于对现有佛乐歌曲关键词信息整理并分析,得到现有佛乐数据集;

模型构建单元5023,使用现有佛乐数据集对多层卷积神经网络模型进行训练,构建出佛乐自动标记模型。

在本实施例中,所述推荐模块504包括:

统计单元5041,用于统计标记佛乐歌曲列表中各歌曲的关键词的分布情况;

自动推荐单元5042,用于基于所述关键词的分布情况,选择与所述需求关键词相关度高的歌曲进行推荐。

在本实施例中,所述信息收集单元5021包括:

提取子单元,用于获取与佛乐相关的现有播放列表的标题,在所述现有播放列表的标题中提取至少一个关键词;

筛选子单元,用于对现有播放列表进行筛选,将含有大于预设佛乐歌曲数量的播放列表及含有单个艺术家的佛乐歌曲占比过多的播放列表剔除,并将筛选后的现有播放列表根据关键词组成不同的播放列表集;

标记子单元,用于将所述播放列表集的关键词标记为在所述播放列表集中出现次数大于预设次数的佛乐歌曲的关键词。

在本实施例中,所述数据整理单元5022包括:

修正子单元,用于采用样本级加权交叉熵作为损失函数,降低缺失少关键词信息的预测结果的权重,修正关键词预测的结果。

在本实施例中,所述统计单元5041具体用于:

计算单首歌曲中各关键词出现的频率;

所述自动推荐单元5042具体用于基于单首歌曲中各关键词出现的频率,选择歌曲进行推荐。

在本实施例中,所述统计单元5041具体用于:

基于分布情况,计算单首歌曲中出现同类关键词的占比

所述自动推荐单元5042,具体用于基于单首歌曲中出现同类关键词的占比,选择歌曲进行推荐。

本发明实施例中,使用构建出的自动标记模型将无关键词标记的佛乐歌曲进行内容识别与关键词标记,根据用户的当前需求关键词推荐具有所述关键词的歌曲。提高了佛乐歌曲的标记准确度,提升歌曲推荐的便利性和佛乐歌曲推荐的准确度,为用户推荐符合心理预期的佛乐歌曲,提升用户的体验。

上面图5和图6从模块化功能实体的角度对本发明实施例中的佛乐歌曲推荐装置进行详细描述,下面从硬件处理的角度对本发明实施例中佛乐歌曲推荐设备进行详细描述。

图7是本发明实施例提供的一种佛乐歌曲推荐设备的结构示意图,该佛乐歌曲推荐设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对佛乐歌曲推荐设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在佛乐歌曲推荐设备600上执行存储介质630中的一系列指令操作。

佛乐歌曲推荐设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图7示出的佛乐歌曲推荐设备结构并不构成对佛乐歌曲推荐设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本发明还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述佛乐歌曲推荐方法的步骤。

本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述佛乐歌曲推荐方法的步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 佛乐歌曲推荐方法、装置、设备及存储介质
  • 基于注意力模型的佛乐生成方法、装置、设备及存储介质
技术分类

06120112965724