一种可穿戴婴幼儿语音录入系统

文献发布时间：2024-04-18 19:59:31

技术领域

本发明涉及婴幼儿语音录入技术领域，具体是一种可穿戴婴幼儿语音录入系统。

背景技术

目前，公知的婴幼儿声音录音装置(也有重力加速度传感器等其它数据，但语音数据最大，后面以讨论语音为主)对声音的采集都或非联网的、或固定类的、或大体积的，如录音笔、录音机、含录音功能监控摄像头、录音盒等。

在家长对婴幼儿的呵护程度日益加深，家长希望婴幼儿的活动处于保障之中，但人力成本不断攀升，越来越需求智能化产品能分担起这部分压力。这样的场景有很多，如：当婴幼儿睡着，家长去阳光晒衣服或在厨房做饭时，婴幼儿突然醒来哭闹、打嗝，甚至在家长不在场情况下发生坠床等危险状况。

如今成人语音识别非常成熟的情况下，相对简单的婴幼儿语音，但迟迟未能破解。主要是因为婴幼儿语音数据难以获取及重复的原因，缺乏广泛的采样手段。此时由于婴幼儿可穿戴产品体积不可能过大，所以处理器的处理能力、电池的续航能力都极为有限；处理能力、续航能力、体积、实时性是互相制约的，如通常的处理手段，现有技术无法在可穿戴婴儿语音录入器上实现。

发明内容

本发明的目的在于提供一种可穿戴婴幼儿语音录入系统，以解决现有技术中的问题。

为实现上述目的，本发明提供如下技术方案：一种可穿戴婴幼儿语音录入系统，包括可穿戴端、信息中转端、云端服务器和其它终端；

所述可穿戴端通过运算将语音在本地进行粗筛，然后将语音数据直接发送给信息中转端进行缓存；

所述信息中转端将数据转发给其它终端或云端服务器；

所述云端服务器将数据进行深度处理后转发给其它终端。

优选的，所述可穿戴端包括处理器、麦克风、3D加速度传感器、无线传输模块；采集的语音数据经处理器计算粗筛后，通过无线传输模块转发至信息中转端，同时其它轻数量级传感器存储一段后再转发。

优选的，所述无线传输模块采用wifi、蓝牙、4G、5G、RF中的一种或多种。

优选的，所述信息中转端包括无线传输模块，提供数据缓存和转发功能。

优选的，所述其它终端包括蓝牙手环、局域网电脑、ipad、手机、监视器中的一种或多种。

优选的，其语音录入方法包括以下步骤：

S1：可穿戴端通过较简单的运算将语音在本地进行粗筛，挑选基频高于一定阀值且元音为主的声音进行发送，发送到信息中转端；

S2：信息中转端对数据进行缓存，信息中转端将数据转发给其它终端或云端服务器；

S3：云端服务器将原始数据利用算力强大的服务进行深度处理，并将稀缺的婴儿大数据备份到云端；

S4：云端服务器将数据进行深度处理后转发给其它终端。

优选的，所述S1中粗筛的标准是音量大于40dB、基音频率大于300Hz、一段语音中不间断元音。

优选的，所述中文元音一般持续30-200ms，啼哭持续3300-2000ms。

与现有技术相比，本发明的有益效果是：

1、可穿戴信息自动录入方便随时随地保护婴幼儿，防止突发情况，不局限于特定环境；

2、可穿戴端处理能力弱，但只需要粗筛便可过滤大部分无用数据，当发现数据满足条件时，便开始实时上传数据到信息中转站，节省大量电量，缩小电池体积；解决了、续航能力、体积和实时性相互制约的问题，还能发挥云端的超级处理能力；

3、可以收集更多数据加入到云端作为科研和深度学习的数据。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明的原理图。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。

请参阅图1，本发明实施例中，一种可穿戴婴幼儿语音录入系统，包括可穿戴端、信息中转端、云端服务器和其它终端；

所述可穿戴端通过运算将语音在本地进行粗筛，然后将语音数据直接发送给信息中转端进行缓存；

所述信息中转端将数据转发给其它终端或云端服务器；

所述云端服务器将数据进行深度处理后转发给其它终端。

优选的，所述无线传输模块采用wifi、蓝牙、4G、5G、RF中的一种或多种。

优选的，所述信息中转端包括无线传输模块，提供数据缓存和转发功能。

优选的，所述其它终端包括蓝牙手环、局域网电脑、ipad、手机、监视器中的一种或多种。

优选的，其语音录入方法包括以下步骤：

S1：可穿戴端通过较简单的运算将语音在本地进行粗筛，挑选基频高于一定阀值且元音为主的声音进行发送，发送到信息中转端；粗筛的标准是音量大于40dB、基音频率大于300Hz、一段语音中不间断元音；所述中文元音一般持续30-200ms，啼哭持续3300-2000ms；

S2：信息中转端对数据进行缓存，信息中转端将数据转发给其它终端或云端服务器；

S3：云端服务器将原始数据利用算力强大的服务进行深度处理，并将稀缺的婴儿大数据备份到云端；

S4：云端服务器将数据进行深度处理后转发给其它终端。

可穿戴端核心部件包括：处理器、麦克风(MIC)、3D加速度传感器、无线传输模块。MIC采集的语音数据经处理器计算粗筛后，通过无线传输模块(wifi、蓝牙、4G、5G、RF)转发至信息中转端，同时其它轻数量级传感器存储一段后再转发。语音数据计算粗筛标准：音量大于一定阀值(默认40dB)、基音频率大于一定阀值(主要针对0-6个月，默认300Hz)、一段语音中不间断元音为主(成人中文元音一般持续30-200ms，啼哭持续3300-2000ms)。

信息中转端主要部件包括无线传输模块，提供数据缓存(当网络不通时，啼哭原始数据将缓存在本地信息中转端。当网络不通时间过长，本地啼哭原始数据先进行压缩。压缩后，存储容量仍超过预设值85％，将删除最早的内容(语音数据是时间片会单位存储，如5分钟))和转发功能。为了网络更稳定，上传可以选用有线网传输。在简单方案中，信息中转端也可以进行本地婴幼儿小语库分析(边缘运算是信息中转端做预处理，以减少服务器的计算压力和并发数据量)，并在自己的显示屏上显示，同时，把处理结果短距无线传输给其它终端(蓝牙手环、局域网电脑/ipad/手机、监视器等)。

在完整解决方案中，信息中转端最理想的传输还是云端服务器；这样便于利用服务器的超强计算能力和超大数据库，同时上传的数据又能再次补充婴幼儿语音数据。

考虑到最重要的语音信息并不一定是一直需要上传，可以用单片机(以ARM为例，cortex-M1系列已经能很好的胜任，主频40M以上，RAM 64K以上，ROM128K以上)通过较简单的运算将语音在本地进行粗筛，挑选基频高于一定阀值且元音为主的声音进行发送。这样可以让通讯模块在绝大部分时间进行休眠以节省电量。

另外在工作范围内放置一个一直在线的信息中转站。可穿戴采集器将语音数据直接发送给信息中转站进行缓存。然后由信息中转站发云端发送。这样可以减少数据重发重连造成的电量损失。(信息中转站不惧电量和体积，也可以用一些强大的处理器在本地处理(RK3128已经能很好的胜任，主频800M以上，RAM 1GB以上，ROM4GB以上)，处理完成后将结果在本机或短距离无线连接设备上显示，但数据库大小和互联网能力会受限)。

粗筛过的数据上传至云端。一方面将原始数据利用算力强大的服务进行深度处理(深度处理包括婴儿啼哭类型分类、情绪分析、疾病粗筛)，另一方面可以将稀缺的婴儿大数据备份到云端。

最后再将处理好的结果(婴幼儿突发/哭闹事件、连续打嗝、哭闹原因等)通过互联网传输到其它终端(手机、监控台、手环等)。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载