掌桥专利:专业的专利平台
掌桥专利
首页

一种音频推荐方法、装置、系统及存储介质

文献发布时间:2023-06-19 10:32:14


一种音频推荐方法、装置、系统及存储介质

技术领域

本发明涉及音频技术领域,更具体地涉及音频推荐的处理。

背景技术

音频推荐是根据用户对音频的偏好的估计,为用户推荐潜在的用户偏好音乐。目前音频推荐的方式主要是基于音乐风格,标题,专辑等人工标注信息或通过用户行为分析得到的计算进行推荐。其中,通过用户行为分析进行音频推荐是基于用户的协同过滤和基于音频的协同过滤。以基于音乐的协同过滤算法为例,一个音频可能被许多用户喜欢,如果喜欢两首音乐的人的集合分别为A和B,如果A和B的人群高度重合,甚至是同一批人,那么可以认为这两个音乐是相似音乐,因此如果一个人喜欢其中一个音乐,就会根据协同过滤结果为此人推荐另一个相似音乐。可见,传统方法都是基于人工标注信息和用户的行为信息,与音频本身的音质特性是无关的,与音频本身的波形信息也是无关的。但是如果一个音频无法取得相应的人工标注标签,如专辑,标题,或者一个音频没有用户听过,也就不会有相应的用户行为信息,那么就无法进行音频推荐。

对此,还有一种音频推荐方式将用户的音频波形映射到协同过滤的隐藏因子(latent factor)特征上,即使不知道音频的标签,且音频没人听过,也可以从波形中得到音乐的协同过滤隐藏因子特征,然后以其他音乐库中已知的音频特征匹配,为用户推荐音乐。这种方法虽然解决了无需标注信息的音频推荐,但是仍然无法实现基于用户音质特性偏好的推荐,比如无法知道用户对于低音强度这种音质的偏好程度,也就无法基于对这种音质特性的偏好程度进行音频推荐;此外,这种方法的输出仍是协同过滤的隐藏因子特征,需要利用用户的行为信息然后去跟音乐库中的其他音乐的特征匹配,而音乐库仍需要通过协同过滤方法分析大量客户的行为信息才能学习到这些音乐的特征。这对于用户较多的音乐门户网站来说,可以获得很多用户之间行为信息,但对于其它音乐平台或个人,是不易实现的。

因此,现有技术中的音频推荐方式仍然需要依赖用户之间的行为信息进行,且无法实现基于用户对音质特性的偏好进行个性化推荐的问题。

发明内容

考虑到上述问题而提出了本发明。本发明提供了一种音频推荐方法、装置、系统及计算机存储介质,以解决需要依赖用户行为信息且无法实现基于用户对音质特性的偏好进行音频推荐的问题。

根据本发明的第一方面,提供了一种音频推荐方法,包括:

获取待推荐音频;

对所述待推荐音频进行特征提取,得到所述待推荐音频的音质特征编码向量;

基于所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集得到推荐结果,其中,所述推荐结果包括所述待推荐音频与用户音质特性偏好的匹配度。

可选地,对所述待推荐音频进行特征提取,得到所述待推荐音频的音质特征编码向量,包括:

对所述待推荐音频进行特征提取,得到所述待推荐音频的音质特征;

将所述待推荐音频的音质特征进行聚类,得到所述待推荐音频的音质特征分布向量;

对所述待推荐音频的音质特征分布向量进行编码,得到所述待推荐音频的音质特征编码向量。

可选地,所述音质特征包括MFCC、一帧时域波形、多帧时域波形或人工设计特征中的至少一种。

可选地,对所述待推荐音频的音质特征分布向量进行编码包括:

将所述待推荐音频的音质特征分布向量输入训练好的编码网络进行所述编码;其中,得到所述训练好的编码网络的训练方法包括:

将用户偏好音频进行特征提取并聚类,得到所述用户偏好音频的音质特征分布向量;

基于所述用户偏好音频的音质特征分布向量训练无监督神经网络得到训练后的无监督神经网络;

选取所述训练后的无监督神经网络中至少一个隐层作为所述训练好的编码网络。

可选地,所述方法还包括:

将所述用户偏好音频的音质特征分布向量输入所述训练好的编码网络得到所述用户偏好的音质特征编码向量集。

可选地,基于所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集得到所述推荐结果,包括:

计算所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集之间的匹配度;

将所述匹配度满足预设条件的所述待推荐音频以及对应的匹配度作为所述推荐结果。

可选地,所述预设条件包括:所述匹配度大于或等于推荐阈值。

可选地,计算所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集之间的匹配度,包括:

对所述用户偏好的音质特征编码向量集中的用户偏好的音质特征编码向量求平均得到平均编码向量,并计算所述待推荐音频的音质特征编码向量与所述平均编码向量的匹配度作为所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量之间的匹配度;

或,

计算所述待推荐音频的音质特征编码向量与所述用户偏好的音质特征编码向量集中每个用户偏好的音质特征编码向量的子匹配度,对所有所述子匹配度求平均得到所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量之间的匹配度。

可选地,在获取待推荐音频之前还包括:获取待推荐音频列表,依次计算所述待推荐音频列表中的每个待推荐音频与用户音质特性偏好的匹配度;所述推荐结果包括:按与用户音质特性偏好的匹配度进行排序的所述待推荐音频的列表。

根据本发明的第二方面,提供了一种音频推荐装置,所述装置包括:

获取模块,用于获取待推荐音频;

特征编码模块,用于对所述待推荐音频进行特征提取,得到所述待推荐音频的音质特征编码向量;

计算模块,用于基于所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集得到推荐结果,其中,所述推荐结果包括所述待推荐音频与用户音质特性偏好的匹配度。

根据本发明的第三方面,提供了一种音频推荐系统,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现第一方面所述方法的步骤。

根据本发明的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机执行时实现第一方面所述方法的步骤。

根据本发明实施例的音频推荐方法、装置、系统及计算机存储介质,基于用户对音质特性的偏好,无需依赖与其它用户之间的行为信息和音频的标注信息,完成对用户的音频推荐,实现了音频的个性化推荐,提升了用户体验。

附图说明

通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1是根据本发明实施例的音频推荐方法的示意性流程图;

图2是根据本发明实施例的音频推荐方法的示例;

图3是根据本发明实施例的音频推荐装置的示意性框图;

图4是根据本发明实施例的音频推荐系统的示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。

音质是人对音频质量的主观评价,对音质每个人有不同的偏好,比如有的人喜欢低音澎湃的音乐,有人喜欢中高频较多甚至尖刺的声音。随时间,环境变化这种主观声音评价也可能发生改变,比如在高噪声环境下,很多人会偏向于提高响度,而睡前的音乐一般会被调低音量。为了实现对用户的个性化音频推荐,需要根据用户对音质特性的偏好向用户推荐音频。

下面,将参照图1描述根据本发明实施例的音频推荐方法100。如图1所示,一种音频推荐方法100,包括:

首先,在步骤S110中,获取待推荐音频;

在步骤S120中,对所述待推荐音频进行特征提取,得到所述待推荐音频的音质特征编码向量;

在步骤S130中,基于所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集得到推荐结果,其中,所述推荐结果包括所述待推荐音频与用户音质特性偏好的匹配度。

其中,通过对待推荐音频进行音质特征提取并统计音质特征分布,对音质特征分布向量进行编码后与用户偏好的音质特征分布的编码进行匹配,将匹配程度高的音频推荐给用户。整个过程无需基于用户之间的行为信息,基于用户偏好音频数据对用户的音质特性偏好进行学习,然后根据学习到的特性从已有音频库中找到与之有相似特性的其他音乐推荐给用户,实现了音频的个性化推荐,提升了用户体验。适合广泛应用于各种需要进行音频推荐的场合,提升音频推荐的有效性,无需获取标注信息或用户之间的行为信息,节省了大量的时间和人力成本。

可选地,根据本发明实施例的音频推荐方法可以在具有存储器和处理器的设备、装置或者系统中实现。

根据本发明实施例的音频推荐方法可以全部部署或分布部署在个人终端处或服务器端(或云端)。所述个人终端处诸如智能电话、平板电脑、个人计算机等。

根据本发明实施例,在所述步骤S110中,获取待推荐音频可以包括:从本地音频数据获取待推荐音频,或从其他数据源获取所述待推荐音频。其中,所述其它数据源可以包括存储于设备或云端的可以与用户设备进行数据交换的音频数据源。

在一些实施例中,所述待推荐的音频数据的选取方法包括且不限于:随机从音频库中选取的音频数据和/或通过音乐门户网站的推荐算法推荐的音乐数据。

根据本发明实施例,在步骤S120中,对所述待推荐音频进行特征提取,得到所述待推荐音频的音质特征编码向量,包括:

对所述待推荐音频进行特征提取,得到所述待推荐音频的音质特征;

将所述待推荐音频的音质特征进行聚类,得到所述待推荐音频的音质特征分布向量;

对所述待推荐音频的音质特征分布向量进行编码,得到所述待推荐音频的音质特征编码向量。

可选地,对所述待推荐音频进行特征提取的方法可以包括:FFT(Fast FourierTransform,快速傅里叶变换),STFT(Short-Time Fourier Transform,短时傅里叶变换),DFT(Discrete Fourier Transform,离散傅里叶变换)中的至少一种。

可选地,所述音质特征可以包括:MFCC(Mel Frequency Cepstrum Coefficient,梅尔频率倒谱系数),一帧或多帧的时域波形,和(其他)人工设计特征中的至少一种。例如,所述音质特征可以是音质特性的特征向量或强度。

在一些实施例中,所述音质特性的特征向量可以是一个m维度的向量。

在一个实施例中,以低音强度这个音质特性为例,低音强度是表征音乐低音部分是否强劲有力的音质特性,一般可以通过低频带的能量和全频带能量占比求出,是一个数值;设低频带有m个频点,全频带k个频点,每个频点幅度是S(i),i=1,2……k,则全频带幅度

在一些实施例中,所述音质特征可以是音质特性的强度,所述音质特性的强度包括且不限于数值数据。那么,此时音质特性的特征向量是计算音质特征强度的中间结果。

在一些实施例中,所述对音频训练数据进行特征提取得到所述音频训练数据的音质特征,可以包括:将所述音频训练数据分帧后进行特征提取得到所述音频训练数据的音质特征。

可选地,将所述音频训练数据的音质特征进行聚类包括且不限于Kmeans聚类算法。其中,可以根据需要设置聚类参数为N类。

可选地,将所述待推荐音频的音质特征进行聚类,得到所述待推荐音频的音质特征分布向量,包括:

将所述待推荐音频的音质特征输入训练好的聚类网络进行所述聚类;其中,得到所述训练好的聚类网络的训练方法包括:

对音频训练数据进行特征提取得到所述音频训练数据的音质特征,并将所述音频训练数据的音质特征进行聚类得到所述聚类网络。

其中,所述音频训练数据包括且不限于用于训练神经网络的音频波形,且所述音频训练数据应该涵盖了目前已知的音质特性类别。所述音质特征分布向量表示所述音频数据的音质特征的分布。例如,对于一个音频,共有c个帧,这些帧进行特征提取后,会被归纳进N类,用一个特征向量表示c个帧的类分布,记为向量U=[U1,U2,U3……UN],其中Ui=音频中属于第i个类别的帧的数量,比如U=[3,4,7,9……],音质特征属于1类的帧有3个,2类有4个,3类有7个,并且

应了解,本发明实施例的音频推荐方法不受特征提取方法和聚类方法的限制,不论是已有的特征提取方法和聚类方法,还是将来开发的特征提取方法和聚类方法均适用于本发明实施例的音频推荐方法,在此不做限制。

可选地,对所述待推荐音频的音质特征分布向量进行编码包括:

将所述待推荐音频的音质特征分布向量输入训练好的编码网络进行所述编码;其中,得到所述训练好的编码网络的训练方法包括:

将用户偏好音频进行特征提取并聚类,得到所述用户偏好音频的音质特征分布向量;

基于所述用户偏好音频的音质特征分布向量训练无监督神经网络得到训练后的无监督神经网络;

选取所述训练后的无监督神经网络中至少一个隐层作为所述编码网络。

其中,将用户偏好音频进行特征提取后的聚类可以是基于训练好的聚类网络进行。基于对用户偏好音频的学习可以得到用户偏好音频的音质分布特征,在此基础上训练一个无监督神经网络,该无监督神经网络对输入特征进行压缩编码,并选取训练后的无监督神经网络中的若干隐层作为编码网络。基于所述编码网络,以用户偏好音频的音质特征分布作为输入特征,该隐层的输出可以看作输入特征的编码。如果训练的是单隐层的无监督神经网络,例如单隐层的自编码器或受限玻尔兹曼机,则隐层是唯一的;如果训练的是多隐层的无监督神经网络,例如多隐层的自编码器或深度信念网络,则可以在多个隐层选择至少一个。

可选地,所述无监督神经网络可以包括且不限于自编码器,受限玻尔兹曼机,深度信念网络。

在一些实施例中,所述用户偏好音频的搜集方式包括且不限于选取用户经常播放的音频数据,和/或常驻播放列表的音频数据,和/或点赞的音频数据。

可选地,基于所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集得到所述推荐结果,包括:

计算所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集之间的匹配度;

将所述匹配度满足预设条件的所述待推荐音频以及对应的匹配度作为所述推荐结果。

在一些实施例中,所述方法还包括:

将所述用户偏好音频的音质特征分布向量输入所述训练好的编码网络得到所述用户偏好的音质特征编码向量集。

其中,用户偏好音频可以包括一个或多个音频,每一个用户偏好音频的音质特征分布向量均对应一个编码向量,多个用户偏好音频数据特征的编码向量组成了用户偏好的音质特征编码集。这些编码特征向量可以看作用户对该音质特性的偏好的抽象表征模型。

可选地,所述匹配度包括余弦相似度,或欧式距离。

可选地,所述预设条件包括:所述匹配度大于或等于推荐阈值。

其中,推荐阈值可以根据需要进行设置,当待推荐的音频数据的音质特征编码向量与用户偏好的音质特征编码向量集之间的匹配度大于或等于推荐阈值,说明所述待推荐的音频数据的音质特性与用户偏好的音质特性比较接近,适合推荐给用户。

根据本发明实施例,在步骤S110,获取待推荐音频之前,所述方法还包括:获取待推荐音频列表,依次计算所述待推荐音频列表中的每个待推荐音频与用户音质特性偏好的匹配度;

所述推荐结果包括:按与用户音质特性偏好的匹配度进行排序的所述待推荐音频的列表。

其中,待推荐音频列表包括多个待推荐音频对匹配度由高到低进行排序,然后选取其中匹配度最高的前若干个(即预设范围,如前m个,m为正整数)组成音频推荐列表,表示这些是在获取的所有待推荐音频中与用户偏好的音质特性最接近的若干音频以推荐给用户。应了解,也可以将之前待推荐音频列表中所有的待推荐音频按照匹配度进行排序,再推荐给用户,在此不做限制。

在一些实施例中,计算所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集之间的匹配度,包括:

对所述用户偏好的音质特征编码向量集中的用户偏好的音质特征编码向量求平均得到平均编码向量,并计算所述待推荐音频的音质特征编码向量与所述平均编码向量的匹配度作为所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量之间的匹配度;

或,

计算所述待推荐音频的音质特征编码向量与所述用户偏好的音质特征编码向量集中的每个用户偏好的音质特征编码向量的子匹配度,对所述子匹配度求平均得到所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量之间的匹配度;

或,

计算所述待推荐音频的音质特征编码向量与所述用户偏好的音质特征编码向量集中的用户偏好的音质特征编码向量的子匹配度,对所述子匹配度中满足预设要求的子匹配度求平均得到所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量之间的匹配度。

其中,所述预设要求可以根据需要进行设置,可以包括:所述子匹配度由高到低排序前n个子匹配度,n为正整数。

可选地,所述方法100还可以包括:

基于所述推荐结果更新所述用户偏好音频的音质特征分布向量;

采用更新后的所述用户偏好音频的音质特征分布向量更新无监督神经网络得到更新后的无监督神经网络;

选取所述更新后的无监督神经网络中至少一个隐层更新所述编码网络。

可选地,基于所述推荐结果更新所述用户偏好音频的音质特征分布向量,可以包括:

将所述推荐结果增加至所述用户偏好音频得到更新后的用户偏好音频;

将更新后的用户偏好音频进行特征提取后输入所述聚类网络得到更新后的所述用户偏好音频的音质特征分布向量。

可选地,基于所述推荐结果更新所述用户偏好音频的音质特征分布向量,还可以包括:基于用户对所述推荐结果的操作信息更新所述用户偏好音频的音质特征分布向量。

可选地,所述用户对所述推荐结果的操作信息可以包括:在预设时间范围内删除或不播放所述推荐结果中的至少一个。

可选地,基于用户对所述推荐结果的操作信息更新所述用户偏好音频的音质特征分布向量,可以包括:

将所述推荐结果增加至所述用户偏好音频;

当用户在预设时间范围内删除或不播放所述推荐结果中至少一个,则将所述至少一个从所述用户偏好音频中删除得到更新后的用户偏好音频;

将更新后的用户偏好音频进行特征提取后输入所述聚类网络得到更新后的所述用户偏好音频的音质特征分布向量。

在一个实施例中,所述方法还可以包括:

将所述推荐结果增加至所述用户偏好音频得到更新后的用户偏好音频,其中,如果用户在预设时间范围内删除或不播放所述推荐结果中至少一个,则将所述至少一个从所述用户偏好音频中删除以更新后的用户偏好音频;

每隔预定时间间隔,基于更新后的用户偏好音频进行特征提取后输入所述聚类网络得到更新后的所述用户偏好音频的音质特征分布向量;

采用更新后的所述用户偏好音频的音质特征分布向量更新无监督神经网络得到更新后的无监督神经网络;

选取所述更新后的无监督神经网络中至少一个隐层更新所述编码网络。

可替代地,上述实施例中,也可以是人工根据需要随时基于更新后的用户偏好音频进行特征提取后输入所述聚类网络得到更新后的所述用户偏好音频的音质特征分布。

在一个实施例中,参见图2,图2示出了根据本发明实施例的音频推荐方法的示例。如图2所示,根据本发明实施例的音频推荐方法包括:

在步骤S210中,获取音频数据库中的训练音频数据(200),分帧后进行特征提取得到训练音频数据的音质特征(201),将所述训练音频数据的音质特征进行聚类训练得到聚类器,将所述音质特征聚类成N类(202);

在步骤S220中,基于用户的用户偏好列表获取用户偏好音频数据(203),将所述用户偏好音频数据进行特征提取得到用户偏好的音质特征(204),并输入步骤S210中的所述聚类器,得到用户偏好音频的音质特征分布向量(205);基于所述用户偏好音频的音质特征分布向量训练一个无监督神经网络,选取训练后的无监督神经网络中的一个隐层作为编码器(206);将用户偏好音频的音质特征分布向量输入所述编码器,得到用户偏好的音质特征编码集(207);

在步骤S230中,获取至少一个待推荐音频(208),分帧后进行特征提取生成待推荐音频的音质特征(209),并输入步骤S210中的所述聚类器,得到待推荐音频的音质特征分布向量(210);将所述待推荐音频的音质特征分布向量输入步骤S220中的所述编码器(211),得到所述待推荐音频的音质特征编码(212);

计算所述待推荐音频的音质特征编码与用户偏好的音质特征编码集的匹配度(213);

将所述匹配度最高的预定数量或所述匹配度大于推荐阈值的待推荐音频作为推荐结果推荐给用户(214)。

上述实施例中,所述方法200还可以进一步包括:将所述推荐结果增加至所述用户偏好音频得到更新后的用户偏好音频,其中,如果用户不喜欢所述推荐结果中的至少一个音频(比如用户在一定时间内删除或者不播放该音频),则将用户不喜欢的所述至少一个音频从用户偏好音频中删除以更新后的用户偏好音频;在合适的时候基于当前更新后的用户偏好音频重复训练新的所述编码器。

图3示出了根据本发明实施例的音频推荐装置300的示意性框图。以下仅对该音频推荐装置300的各部件的主要功能进行描述,而省略以上已经描述过的细节内容。

如图3所示,根据本发明实施例的音频推荐装置300包括:

获取模块310,用于获取待推荐音频;

特征编码模块320,用于对所述待推荐音频进行特征提取,得到所述待推荐音频的音质特征编码向量;

计算模块330,用于基于所述待推荐音频的音质特征编码向量和用户偏好的音质特征编码向量集得到推荐结果,其中,所述推荐结果包括所述待推荐音频与用户音质特性偏好的匹配度。

其中,对待推荐的音频进行音质特征提取并统计音质特征分布,对音质特征分布向量进行编码后与用户偏好的音质特征分布的编码进行匹配,将匹配程度高的音频推荐给用户。整个过程无需基于用户之间的行为信息,基于用户偏好音频数据对用户的音质特性偏好进行学习,然后根据学习到的特性从已有音频库中找到与之有相似特性的其他音乐推荐给用户,实现了音频的个性化推荐,提升了用户体验。适合广泛应用于各种需要进行音频推荐的场合,提升音频推荐的有效性,无需获取标注信息或用户之间的行为信息,节省了大量的时间和人力成本。

图4示出了根据本发明实施例的音频推荐系统400的示意性框图。音频推荐系统400包括存储装置410、以及处理器420。

所述存储装置410存储用于实现根据本发明实施例的音频推荐方法中的相应步骤的程序代码。

所述处理器420用于运行所述存储装置410中存储的程序代码,以执行根据本发明实施例的音频推荐方法的相应步骤,并且用于实现根据本发明实施例的音频推荐装置中的相应模块。

此外,根据本发明实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本发明实施例的音频推荐方法的相应步骤,并且用于实现根据本发明实施例的音频推荐装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述存储介质可以是一个或多个计算机可读存储介质的任意组合,例如一个计算机可读存储介质包含用于随机地生成动作指令序列的计算机可读的程序代码,另一个计算机可读存储介质包含用于进行音频推荐的计算机可读的程序代码。

在一个实施例中,所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的音频推荐装置的各个功能模块,并且/或者可以执行根据本发明实施例的音频推荐方法。

根据本发明实施例的音频推荐系统中的各模块可以通过根据本发明实施例的音频推荐的电子设备的处理器运行在存储器中存储的计算机程序指令来实现,或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。

根据本发明实施例的音频推荐方法、装置、系统以及存储介质,基于用户对音质特性的偏好,无需依赖与其它用户之间的行为信息和音频的标注信息,完成对用户的音频推荐,实现了音频的个性化推荐,提升了用户体验。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

以上所述,仅为本发明的具体实施方式或对具体实施方式的说明,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

相关技术
  • 一种音频推荐方法、装置、系统及存储介质
  • 一种基于音频识别的节目推荐方法、系统及存储介质
技术分类

06120112587202