基于语音的本地媒体筛选播放方法、装置、终端设备及介质

文献发布时间：2023-06-19 11:32:36

技术领域

本发明涉及音频播放技术领域，尤其涉及基于语音的本地媒体筛选播放方法、装置、终端设备及存储介质。

背景技术

随着科技的发展和人们生活水平的不断提高，各种智能终端的使用越来越普及，智能终端已经成为人们生活中不可缺少的通信工具。大部分的智能终端都具有媒体播放功能，也基本会存储些本地媒体资源或外插移动存储设备的媒体资源，现有技术的智能终端本地媒体筛选不方便。目前市面上有许多存放了大量音乐或者有声资源的移动存储设备售卖，可以在没有网络的情况下接到某个主机上播放音乐或者有声资源，这种移动存储设备因为便宜外加资源丰富受到许多人的喜爱，在淘宝搜索可看到月销量超过10万。但正因为其内容多，所以对资源的筛选变成一件困难的事，有时不方便用户使用。

因此，现有技术还有待改进和提高。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种基于语音的本地媒体筛选播放方法、装置、终端设备及存储介质，本发明解决了本地存储设备中有声资源筛选不方便的问题；本发明可通过语音指令查找并播放想要听的本地有声资源。本发明使智能终端对本地媒体资源筛选更方便，为用户的使用提供了方便。

为了解决上述技术问题，本发明所采用的技术方案如下：

一种基于语音的本地媒体筛选播放方法，其中，包括：

获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令；

根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源；

对筛选出的所述媒体资源进行播放。

所述的基于语音的本地媒体筛选播放方法，其中，所述获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令的步骤之前包括：

预先设置一个预定大小的数据库表，用于存储所有解析过的文件信息，文件大小和文件头尾部MD5值都相同的视为相同的文件；其中，所述文件信息包括：文件名，专辑名，类别，歌手名，时长，文件大小。

所述的基于语音的本地媒体筛选播放方法，其中，所述获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令的步骤包括：

通过麦克风获取语音信号，对所述语音信号进行识别；

识别出对应的语音指令。

所述的基于语音的本地媒体筛选播放方法，其中，所述根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源的步骤之前包括：

预先对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；

根据扫描得到的资源路径读取媒体文件的文件信息，和资源路径一起存储到对应的本地数据库；

同时将文件头部和文件尾部的MD5值存储到数据库。

所述的基于语音的本地媒体筛选播放方法，其中，所述根据扫描得到的资源路径读取媒体文件的文件信息，和资源路径一起存储到对应的本地数据库的步骤还包括：

当对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描，扫描到信息不全的媒体文件时，从预先设置预定大小的数据库表搜索，补齐相关的信息；

当从所述预定大小的数据库表中也没有搜索到相关的文件信息，则控制通过爬虫算法从网络资源上获取，并存储到对应的本地数据库中。

所述的基于语音的本地媒体筛选播放方法，其中，所述根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源的步骤包括：

根据所述语音指令，提取出对应的语音关键词；

根据提取出的语音关键词，对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；

扫描查找与所述语音关键词对应匹配的媒体文件；

将与所述语音关键词对应匹配的媒体文件筛选输出。

所述的基于语音的本地媒体筛选播放方法，其中，所述对筛选出的所述媒体资源进行播放的步骤包括：

获取筛选输出的媒体文件；

按预定顺序对筛选出的所述媒体资源进行播放。

一种基于语音的本地媒体筛选播放装置，其中，所述装置包括：

获取模块，用于获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令；

筛选模块，用于根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源；

播放控制模块，用于对筛选出的所述媒体资源进行播放；

预先设置模块，用于预先设置一个预定大小的数据库表，用于存储所有解析过的文件信息，文件大小和文件头尾部MD5值都相同的视为相同的文件；其中，所述文件信息包括：文件名，专辑名，类别，歌手名，时长，文件大小；

预扫描模块，用于预先对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；根据扫描得到的资源路径读取媒体文件的文件信息，和资源路径一起存储到对应的本地数据库；同时将文件头部和文件尾部的MD5值存储到数据库。

一种终端设备，其中，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于语音的本地媒体筛选播放程序，所述处理器执行所述基于语音的本地媒体筛选播放程序时，实现任一项所述的基于语音的本地媒体筛选播放方法的步骤。

一种计算机可读存储介质，其中，其上存储有基于语音的本地媒体筛选播放程序，所述基于语音的本地媒体筛选播放程序被处理器执行时，实现任一项所述的基于语音的本地媒体筛选播放方法的步骤。

有益效果：与现有技术相比，本发明提供了一种基于语音的本地媒体筛选播放方法，本发明利用主机的麦克风实现语音功能，并利用算法对移动存储设备里的内容进行快速筛选，使用户可以通过语音指令快速的听到自己想要听的内容，比如说我想听摇滚歌曲，会把存储设备里的所有摇滚歌曲筛选出来播放，为用户的使用提供了方便。

附图说明

图1为本发明实施例1提供的基于语音的本地媒体筛选播放方法的具体实施方式的流程图。

图2为本发明实施例1提供的基于语音的本地媒体筛选播放方法中语音识别流程图。

图3为本发明实施例1提供的基于语音的本地媒体筛选播放方法中媒体文件扫描筛选流程图。

图4为本发明实施例2提供的基于语音的本地媒体筛选播放方法的交互流程图。

图5为本发明实施例2提供的基于语音的本地媒体筛选播放方法的数据更新流程图。

图6是本发明实施例提供的基于语音的本地媒体筛选播放装置的原理框图。

图7是本发明实施例提供的终端设备的内部结构原理框图。

具体实施方式

为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

需要说明，若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……)，则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。

另外，若本发明实施例中有涉及“第一”、“第二”等的描述，则该“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

在科技助力生活的今天，人们和各种智能终端如影随形，生活中早已被诸如手机，平板，电脑，电视所围绕。智能终端已经慢慢渗入到人们生活的各个角落。

为了解决现有技术中的问题，本实施例提供一种基于语音的本地媒体筛选播放方法，通过本实施例的方法，方法包括：获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令；根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源；对筛选出的所述媒体资源进行播放。本发明解决了本地存储设备中有声资源筛选不方便的问题；本发明可通过语音指令查找并播放想要听的本地有声资源。本发明使智能终端对本地媒体资源筛选更方便，给用户的使用提供了方便。

本实施例的基于语音的本地媒体筛选播放方法可应用于终端设备中，具体如图1中所示，所述基于语音的本地媒体筛选播放方法包括如下步骤：

步骤S100、获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令。

现有技术中，如果用户已经下载了很多自己喜欢的媒体音乐文件存储在音乐文件夹或网上买的带很多音乐文件的U盘需通过智能播放终端播放时，如果用户想播放某一具体的歌，例如“冰雨”，需要一个一个翻，查找非常麻烦。

本发明实施例中，以智能播放终端为例进行说明，当用户需要播放哪首歌时可以通过语音说出来，例如，当用户相听冰雨，可以语音说出“请打开刘德华的冰雨”，则本发明实施例中，智能播放终端会获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令。

具体地，如图2所示，所述步骤S100具体包括：

步骤S101、通过麦克风获取语音信号，对所述语音信号进行识别；

步骤S102、识别出对应的语音指令。

具体地，例如用户想听“谢谢你的爱1999”，则可以语音说出“请打开谢霆锋的谢谢你的爱1999”，则本发明的智能播放终端通过麦克风获取语音信号，对所述语音信号进行识别，识别出对应的语音指令是“打开谢霆锋的谢谢你的爱1999”

步骤S200、根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源；

本发明实施例中，在具体实施前需要，预先设置一个预定大小的数据库表，即设置一个大的数据库表，例如比本地的媒体资源的数据库大的50％的，方便用于存储所有解析过的文件信息，文件大小和文件头尾部MD5值都相同的视为相同的文件；其中，所述文件信息包括：文件名，专辑名，类别，歌手名，时长，文件大小。

另外，本发明在具体实施时也会对本地媒体文件和新接入的U盘设备的媒体文件进行扫描建档，建立对应数据库关系表。

具体地，预先对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；即本发明中会对每个新存储在本地的媒体文件或新接入的移动存储设备内的媒体文件进行扫描；并根据扫描得到的资源路径读取媒体文件的文件信息，和资源路径一起存储到对应的本地数据库；同时将文件头部和文件尾部的MD5值存储到数据库。以对新的媒体文件进行扫描建档，建立对应数据库关系表。方便后面语音查找搜索。

其中，所述根据扫描得到的资源路径读取媒体文件的文件信息，和资源路径一起存储到对应的本地数据库的步骤还包括(即本发明实施例中扫描媒体文件具体包括)：

当对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描，扫描到信息不全的媒体文件时，从预先设置预定大小的数据库表搜索(即大的数据库表，本发明中大的数据库表中会预先存储很多媒体文件的文件名，专辑名，类别，歌手名，时长，文件大小)，然后补齐相关的信息；

而当从所述预定大小的数据库表中也没有搜索到相关的文件信息，则控制通过爬虫算法从网络资源上获取，并存储到对应的本地数据库中。即本发明在本地小的数据库和预先设置的媒体文件信息比较全的大的数据库列表(即预定大小的数据库表)都没有搜索到当前媒体文件相关的文件信息，则控制通过爬虫算法从网络资源上获取，网上获取后并存储到对应的本地数据库中。

在一种实施方式中，如图3所示，所述步骤S200具体包括：

步骤S201、根据所述语音指令，提取出对应的语音关键词；

步骤S202、根据提取出的语音关键词，对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；

步骤S203、扫描查找与所述语音关键词对应匹配的媒体文件；

步骤S204、将与所述语音关键词对应匹配的媒体文件筛选输出。

即本发明实施例中，根据所述语音指令，提取出对应的语音关键词；根据提取出的语音关键词，对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；扫描查找与所述语音关键词对应匹配的媒体文件；将与所述语音关键词对应匹配的媒体文件筛选输出；例如当用户想听“冰雨”这首歌时，可以通过语音说出“请打开刘德华的冰雨”的语音，本发明会提取“打开刘德华的冰雨”的语音关键词，并会根据提取出的“打开刘德华的冰雨”语音关键词，对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；扫描查找与所述语音关键词“打开刘德华的冰雨”语音关键词”对应匹配的媒体文件“刘德华冰雨这首歌”；将与所述语音关键词对应匹配的媒体文件筛选输出。并进入步骤S300。

步骤S300、对筛选出的所述媒体资源进行播放。

本步骤中会获取筛选输出的媒体文件；按预定顺序对筛选出的所述媒体资源进行播放。例如当提取出刘德华冰雨这首歌，则根据所述语音指令控制播放这首歌。

在进一步地具体实施例中，如图4和图5所示，本具体应用实施例的一种基于语音的本地媒体筛选播放方法，包括以下步骤：

本具体实施例以智能播放设备为车载播放终端10为例，车载播放终端10设置有麦克风11，和喇叭12、并内；置有语音识别模块、播放器，处理器，可以外接移动存储设备30例如存储有歌曲的U盘，车载播放终端10通过网络与服务器20连接。车载播放终端10利用主机麦克风，实现语音功能，通过语音对存储设备内资源的扫描，将资源目录和路径上传到云服务器；(云端)服务器20可以实现对资源的标签分类功能，对资源的筛选功能。音频播放器功能，支持常见的音频格式，如mp3,wav,flac,aac等。

具体地，如图5所示，本发明实施例中数据更新流程具体包括以下步骤：

S11、读取文件信息并存储到对应数据库；然后进入S12；

S12、扫描的媒体文件的文件信息是否有空字段，即预先扫描的媒体文件是否没查找到对应的文件信息，当是进入步骤S13,当否进入S15；

S13、从大数据库中查找，并进入S14，

S14、将信息写回到应用数据库；

S15、新的媒体文件的文件信息，是否在大数据库中不存在该新媒体文件的文信息，当是进入步骤S16，当否进入S17；

S16、更新大数据库表，并进入步骤S17；

S17、结束。

即本发明具体实施例中服务端利用自有策略算法对资源进行处理，通过本发明实施例的方法制成一对应的APP安装在车载播放终端10。首先根据app上传的资源目录和路径读取音频文件的信息，包括文件名，专辑名，类别，歌手名，时长，文件大小等存储到与此存储设备对应的数据库当中(空字段就为少一个信息就为空字段)，同时会将文件头部和文件尾部的MD5值存储到数据库。同时服务器端会维持一个大的数据库表，将所有解析过的文件信息存储起来，文件大小和文件头尾部MD5值都相同的视为相同的文件。如果遇到信息不全的文件，可以从大的数据库表中搜索(如图5的步骤S13)，补齐相关的信息。如果大的数据库表中也没有相关信息，服务器可使用爬虫算法从网络资源上获取。比如某个文件缺乏类别信息，可用文件名先在大数据库表中搜索同样名字的文件，找到对应的类别，并将该类别填写到该存储设备对应的数据库中。

本发明实施例中通过识别语音指令后将结果传送到云服务器，服务器端根据指令从对应的数据库中做筛选，并将结果返回给车载播放终端10app,app将返回的资源送到播放器播放。比如语音指令识别到我想听摇滚歌曲，就会从对应的数据库中挑选类别为摇滚的歌曲，并形成列表返回给app，app根据列表信息播放。

本发明利用现有硬件设备，软件层面上实现对本地大量资源的分类筛选，并利用语音技术方便用户使用。

如图6中所示，本发明实施例提供一种基于语音的本地媒体筛选播放装置，该装置包括：

获取模块10，用于获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令；

筛选模块20，用于根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源；

播放控制模块30，用于对筛选出的所述媒体资源进行播放；

预先设置模块40，用于预先设置一个预定大小的数据库表，用于存储所有解析过的文件信息，文件大小和文件头尾部MD5值都相同的视为相同的文件；其中，所述文件信息包括：文件名，专辑名，类别，歌手名，时长，文件大小；

预扫描模块50，用于预先对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；根据扫描得到的资源路径读取媒体文件的文件信息，和资源路径一起存储到对应的本地数据库；同时将文件头部和文件尾部的MD5值存储到数据库，具体如上所述。

基于上述实施例，本发明还提供了一种终端设备，其原理框图可以如图7所示。该终端设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、语音识别模块。其中，该终端设备的处理器用于提供计算和控制能力。该终端设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于语音的本地媒体筛选播放方法。该终端设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该终端设备的语音识别模块是预先在终端设备内部设置。

本领域技术人员可以理解，图7中示出的原理框图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的终端设备的限定，具体的终端设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种终端设备，终端设备包括存储器、处理器及存储在存储器上并可在处理器上运行的基于语音的本地媒体筛选播放程序，处理器执行基于语音的本地媒体筛选播放程序时，实现如下操作指令：

获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令；

根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源；

对筛选出的所述媒体资源进行播放，具体如上所述。

其中，所述获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令的步骤之前包括：

其中，所述获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令的步骤包括：

通过麦克风获取语音信号，对所述语音信号进行识别；

识别出对应的语音指令。

其中，所述根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源的步骤之前包括：

预先对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；

根据扫描得到的资源路径读取媒体文件的文件信息，和资源路径一起存储到对应的本地数据库；

同时将文件头部和文件尾部的MD5值存储到数据库。

其中，所述根据扫描得到的资源路径读取媒体文件的文件信息，和资源路径一起存储到对应的本地数据库的步骤还包括：

当从所述预定大小的数据库表中也没有搜索到相关的文件信息，则控制通过爬虫算法从网络资源上获取，并存储到对应的本地数据库中。

其中，所述根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源的步骤包括：

根据所述语音指令，提取出对应的语音关键词；

根据提取出的语音关键词，对本地媒体文件或新接入的移动存储设备内的媒体文件进行扫描；

扫描查找与所述语音关键词对应匹配的媒体文件；

将与所述语音关键词对应匹配的媒体文件筛选输出。

其中，所述对筛选出的所述媒体资源进行播放的步骤包括：

获取筛选输出的媒体文件；

按预定顺序对筛选出的所述媒体资源进行播放。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

综上，本发明公开了一种基于语音的本地媒体筛选播放方法、装置、终端设备及存储介质，方法包括：获取语音信号，对所述语音信号进行识别，确定出所对应的语音指令；根据所述语音指令对本地媒体资源进行筛选，筛选出与所述语音指令对应的媒体资源；对筛选出的所述媒体资源进行播放。本发明解决了本地存储设备中有声资源筛选不方便的问题；本发明可通过语音指令查找并播放想要听的本地有声资源。本发明使智能终端对本地媒体资源筛选更方便，为用户的使用提供了方便。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：晋晓琼;王玉斌;
专利申请人：深圳创维-RGB电子有限公司;南京创维信息技术研究院有限公司;