掌桥专利:专业的专利平台
掌桥专利
首页

预测婴幼儿的发育语言和交流能力的方法和工具

文献发布时间:2024-04-18 19:53:33


预测婴幼儿的发育语言和交流能力的方法和工具

相关申请

本申请是中国专利申请202010692253.5号的分案申请。

技术领域

本申请大体涉及医学和人工智能的融合领域,更具而言,本申请提供了基于脑电图(EEG)或脑磁图(MEG)检测以及人工智能训练来预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的方法、工具和系统。

背景技术

语言和交流能力是人类个体发展的基础,影响着儿童后期和成年期的各个方面。据报道,语言和交流能力不仅影响儿童的学业方面的成功,而且也对于日后的就业和薪资水平的也具有显著预测意义。如果能在生命早期对于语言和交流能力正常性的发展水平进行预测,并根据预测结果进行有针对性的主动干预和训练,对于个体的发展会是有利的。

发明概述

第一方面,本申请提供了一种预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的方法,所述方法包括:

获得所述健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据;

从所述EEG或MEG波形数据中提取定量数据,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

使用机器学习分类器分析所述定量数据,所述机器学习分类器被训练为能预测所述健康婴儿或幼儿所属人群的语言和交流能力正常性的发展水平差异的预测评分,其中所述训练是基于从具有已知语言和交流能力正常性的发展水平的多个健康婴儿或幼儿获得的训练数据集的对应定量数据;以及

基于所述机器学习分类器输出的结果,生成所述健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的预测评分。

在一些实施方案中,该方法还包括:获得处于静息状态下的所述健康婴儿或幼儿的脑电图(EEG)或脑磁图(MEG)波形数据;和

从处于静息状态的所述健康婴儿或幼儿的EEG或MEG波形中提取相应的定量数据,其中所述定量数据包括指示中枢神经系统处于静息状态下的测量指标数据。

在一些实施方案中,外部听觉刺激包括多个不同的刺激。在一些实施方案中,定量数据包括指示中枢神经系统对所述多个外部听觉刺激中一个或多个的反应与处于静息状态下的测量指标数据。

在一些实施方案中,定量数据包括表征听觉中枢相关的处理通路功能活动的数据。

在一些实施方案中,定量数据包括表征下丘及与其连接的中心的功能活动的数据。

在一些实施方案中,定量数据包括表征初级听觉皮层的功能活动的数据,所述初级听觉皮层包括赫氏脑回或与其连接的中心。

在一些实施方案中,外部听觉刺激来自使用音高模式来在词汇水平表达含义的语言和语音信号。在一些实施方案中,外部听觉刺激来自汉语,包括普通话和粤语等。

在一些实施方案中,外部听觉刺激来自使用音高模式来在短语水平表达含义的语言和语音信号。在一些实施方案中,外部听觉刺激来自汉语,包括普通话和粤语等。

在一些实施方案中,外部听觉刺激是一个或多个声调的汉语拼音。

在一些实施方案中,在所述健康婴儿或幼儿处于自然睡眠时或处于清醒状态下执行所述EEG或MEG。

在一些实施方案中,所述健康婴儿或幼儿的月龄为18个月以下。在一些实施方案中,关于训练数据集的获取,当从所述多个健康婴儿或幼儿获得所述训练数据集时,所述多个健康婴儿或幼儿的月龄为18个月以下。

在一些实施方案中,机器学习分类器是支持向量机(SVM),并且所述预测的语言和交流能力的正常性的发展水平差异是高水平或低水平,或连续性评价方式。

在一些实施方案中,机器学习分类器是支持向量回归算法(SVR)或排序支持向量机(RankSVM),并且所预测的语言和交流能力正常性的发展水平差异是量化的。

在一些实施方案中,分析所述定量数据还包括分析与语言和交流能力正常性的发展水平差异相关的一个或多个变量,例如性别和出生数据。

在一些实施方案中,通过选自以下的方法从所述EEG或MEG波形提取定量数据:自动峰值检测(Automatic peak detection),快速傅立叶变换(Fast Fourier Transform),自相关(Autocorrelation),均方根(Root-Mean-Square,RMS),Morlet小波变换(MorletWavelet Transform),离散小波变换(Discrete Wavelet Transform),小波散射(WaveletScattering),刺激响应互相关(Stimulus-Response Cross-correlation),经验模式分解的处理(Empirical Mode Decomposition),希尔伯特-黄变换(Hilbert-HuangTransform)。在一些实施方案中,定量数据包括以下中的一个或多个:时域峰值幅度(time-domain peak amplitude),时域峰值时延(time-domain peak latency),基频(fundamental frequency,F0),谐波(harmonics),信噪比(signal-to-noise ratio),RMS幅度(RMS amplitude),相关系数(correlation coefficient),试验间相位相干(inter-trial phase coherence),锁相系数(phase-locking coefficient),响应一致性(response consistency),音高强度(pitch strength),音高误差(pitch error),音高跟踪精度(pitch-tracking accuracy)。

在一些实施方案中,从所述EEG波形提取定量数据包括:通过刺激起始标记将所述EEG波形分割成节段,并且在具有重叠窗口的滑动时间窗口中,利用快速傅立叶变换(FFT)将每个节段变换到频域(frequency domain)。在一些实施方案中,定量数据包括所述健康婴儿或幼儿的T*(E*3)*F张量表示的矩阵,其中T是所述时间窗口的数量,E是每个刺激(例如,一个汉语拼音的一个声调)的节段的数量,F是来自FFT分析的频率间隔(frequencybin)的数量,并且每个T的(E*3)*F矩阵首先在行内被归一化,然后在列中被归一化,从而消除频谱的绝对幅度的影响并且仅保留频率相关随时间变化的模式。在一些实施方案中,机器学习分类器是使用包括高斯核、C和伽马的参数的支持向量机(SVM)。

在一些实施方案中,由所述机器学习分类器进行的分类是通过交叉验证的,并且交叉验证的结果是在一定倍数(例如5倍、10倍或更多倍)的平均准确度、特异性、灵敏度、AUC、奇偶率、相关系数或以上的组合。

第二方面,本申请提供了一种计算机可读介质,其存储多个指令,所述多个指令当被计算机系统的处理器执行时控制计算机系统执行多种操作以实施第一方面的方法。

第三方面,本申请提供了一种计算机系统,包括:

第二方面所述的计算机可读介质;和

用于执行存储在所述计算机可读介质上的指令一个或多个处理器。

第四方面,本申请提供了一种计算机系统,包括:

存储器;和

处理器,所述处理器与所述存储器可通讯地连接并且被配置为执行多种操作以实施第一方面的方法。

第五方面,本申请提供了一种预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的系统,包括用于实施第一方面的方法的多种装置。

第六方面,本申请提供了一种生成用于预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的机器学习分类器的方法,所述方法包括:

获得一名或多名健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据,并且从所述EEG或MEG波形数据中提取定量数据,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

在一定时间(例如6-12个月)后,对所述一名或多名健康婴儿或幼儿进行语言和交流能力测试,并获得表征语言和交流能力的定性或定量数据;

将从所述EEG或MEG波形数据中提取的定量数据和所述表征语言和交流能力的定性或定量数据输入机器学习分类器进行训练,以生成用于预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的机器学习分类器。

作为非限制性的实例,本申请提供了以下实施方案:

1.一种预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的方法,所述方法包括:

获得所述健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据;

从所述EEG或MEG波形数据中提取定量数据,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

使用机器学习分类器分析所述定量数据,所述机器学习分类器被训练为能预测所述健康婴儿或幼儿所属人群的语言和交流能力正常性的发展水平差异的预测评分,其中所述训练是基于从具有已知语言和交流能力正常性的发展水平的多个健康婴儿或幼儿获得的训练数据集的对应定量数据;以及

基于所述机器学习分类器输出的结果,生成所述健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的预测评分。

2.根据实施方案1所述的方法,还包括:

获得处于静息状态下的所述健康婴儿或幼儿的脑电图(EEG)或脑磁图(MEG)波形数据;和

从处于静息状态的所述健康婴儿或幼儿的EEG或MEG波形中提取相应的定量数据,其中所述定量数据包括指示中枢神经系统处于静息状态下的测量指标数据。

3.根据实施方案2所述的方法,其中所述外部听觉刺激包括多个不同的刺激,并且所述定量数据包括指示中枢神经系统对所述多个外部听觉刺激中一个或多个的反应与处于静息状态下的测量指标数据。

4.根据实施方案1至3中任一项所述的方法,其中所述定量数据包括表征听觉中枢相关的处理通路功能活动的数据。

5.根据实施方案1至4中任一项所述的方法,其中所述定量数据包括表征下丘及与其连接的中心的功能活动的数据。

6.根据实施方案1至5中任一项所述的方法,其中所述定量数据包括表征初级听觉皮层的功能活动的数据,所述初级听觉皮层包括赫氏脑回或与其连接的中心。

7.根据实施方案1至6中任一项所述的方法,其中所述外部听觉刺激来自使用音高模式来在词汇水平表达含义的语言和语音信号,优选地,所述外部听觉刺激来自汉语。

8.根据实施方案1至6中任一项所述的方法,其中所述外部听觉刺激来自使用音高模式来在短语水平表达含义的语言和语音信号,优选地,所述外部听觉刺激来自汉语。

9.根据实施方案1至8中任一项所述的方法,其中所述外部听觉刺激是一个或多个声调的汉语拼音。

10.根据实施方案1至9中任一项所述的方法,其中在所述健康婴儿或幼儿处于自然睡眠时或处于清醒状态下执行所述EEG或MEG。

11.根据实施方案1至10中任一项所述的方法,其中所述健康婴儿或幼儿的月龄为18个月以下,并且其中当从所述多个健康婴儿或幼儿获得所述训练数据集时,所述多个健康婴儿或幼儿的月龄为18个月以下。

12.根据实施方案1至11中任一项所述的方法,其中所述机器学习分类器是支持向量机(SVM),并且所述预测的语言和交流能力的正常性的发展水平差异是高水平或低水平,或连续性评价方式。

13.根据实施方案1至11中任一项所述的方法,其中所述机器学习分类器是支持向量回归算法(SVR)或排序支持向量机(RankSVM),并且所预测的语言和交流能力正常性的发展水平差异是量化的。

14.根据实施方案1至13中任一项所述的方法,其中分析所述定量数据还包括分析与语言和交流能力正常性的发展水平差异相关的一个或多个变量,例如性别和出生数据。

15.根据实施方案1至14中任一项所述的方法,其中通过选自以下的方法从所述EEG或MEG波形提取定量数据:自动峰值检测(Automatic peak detection),快速傅立叶变换(Fast Fourier Transform),自相关(Autocorrelation),均方根(Root-Mean-Square,RMS),Morlet小波变换(Morlet Wavelet Transform),离散小波变换(Discrete WaveletTransform),小波散射(Wavelet Scattering),刺激响应互相关(Stimulus-ResponseCross-correlation),经验模式分解的处理(Empirical Mode Decomposition),希尔伯特-黄变换(Hilbert-Huang Transform);和/或

其中所述定量数据包括以下中的一个或多个:时域峰值幅度(time-domain peakamplitude),时域峰值时延(time-domain peak latency),基频(fundamental frequency,F0),谐波(harmonics),信噪比(signal-to-noise ratio),RMS幅度(RMS amplitude),相关系数(correlation coefficient),试验间相位相干(inter-trial phase coherence),锁相系数(phase-locking coefficient),响应一致性(response consistency),音高强度(pitch strength),音高误差(pitch error),音高跟踪精度(pitch-tracking accuracy)。

16.根据实施方案1至15中任一项所述的方法,其中从所述EEG波形提取定量数据包括:通过刺激起始标记将所述EEG波形分割成节段,并且在具有重叠窗口的滑动时间窗口中,利用快速傅立叶变换(FFT)将每个节段变换到频域(frequency domain)。

17.如实施方案16所述的方法,其中所述定量数据包括所述健康婴儿或幼儿的T*(E*3)*F张量表示的矩阵,其中T是所述时间窗口的数量,E是每个刺激(例如,一个汉语拼音的一个声调)的节段的数量,F是来自FFT分析的频率间隔(frequency bin)的数量,并且每个T的(E*3)*F矩阵首先在行内被归一化,然后在列中被归一化,从而消除频谱的绝对幅度的影响并且仅保留频率相关随时间变化的模式。

18.如实施方案17所述的方法,其中所述机器学习分类器是使用包括高斯核、C和伽马的参数的支持向量机(SVM)。

19.根据实施方案1至18中任一项所述的方法,其中由所述机器学习分类器进行的分类是通过交叉验证的,并且交叉验证的结果是在一定倍数的平均准确度、特异性、灵敏度、AUC、奇偶率、相关系数或以上的组合。

20.一种计算机可读介质,其存储多个指令,所述多个指令当被计算机系统的处理器执行时控制计算机系统执行包括以下操作:

获得所述健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据;

从所述EEG或MEG波形数据中提取定量数据,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

使用机器学习分类器分析所述定量数据,所述机器学习分类器被训练为能预测所述健康婴儿或幼儿所属人群的语言和交流能力正常性的发展水平差异的预测评分,其中所述训练是基于从具有已知语言和交流能力正常性的发展水平的多个健康婴儿或幼儿获得的训练数据集的对应定量数据;以及

基于所述机器学习分类器输出的结果,生成所述健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的预测评分。

21.根据实施方案20所述的计算机可读介质,其中所述操作还包括:

获得处于静息状态下的所述健康婴儿或幼儿的脑电图(EEG)或脑磁图(MEG)波形数据;和

从处于静息状态的所述健康婴儿或幼儿的EEG或MEG波形中提取相应的定量数据,其中所述定量数据包括指示中枢神经系统处于静息状态下的测量指标数据。

22.根据实施方案20或21所述的计算机可读介质,其中所述外部听觉刺激包括多个不同的刺激,并且所述定量数据包括指示中枢神经系统对所述多个外部听觉刺激中一个或多个的反应与处于静息状态下的测量指标数据。

23.根据实施方案20至22中任一项所述的计算机可读介质,其中所述定量数据包括表征听觉中枢相关的处理通路功能活动的数据。

24.根据实施方案20至23中任一项所述的计算机可读介质,其中所述定量数据包括表征下丘及与其连接的中心的功能活动的数据。

25.根据实施方案20至24中任一项所述的计算机可读介质,其中所述定量数据包括表征初级听觉皮层的功能活动的数据,所述初级听觉皮层包括赫氏脑回或与其连接的中心。

26.根据实施方案20至25中任一项所述的计算机可读介质,其中所述外部听觉刺激来自使用音高模式来在词汇水平表达含义的语言和语音信号,优选地,所述外部听觉刺激来自汉语。

27.根据实施方案20至25中任一项所述的计算机可读介质,其中所述外部听觉刺激来自使用音高模式来在短语水平表达含义的语言和语音信号,优选地,所述外部听觉刺激来自汉语。

28.根据实施方案20至27中任一项所述的计算机可读介质,其中所述外部听觉刺激是一个或多个声调的汉语拼音。

29.根据实施方案20至28中任一项所述的计算机可读介质,其中在所述健康婴儿或幼儿处于自然睡眠时或处于清醒状态下执行所述EEG或MEG。

30.根据实施方案20至29中任一项所述的计算机可读介质,其中所述健康婴儿或幼儿的月龄为18个月以下,并且其中当从所述多个健康婴儿或幼儿获得所述训练数据集时,所述多个健康婴儿或幼儿的月龄为18个月以下。

31.根据实施方案20至30中任一项所述的计算机可读介质,其中所述机器学习分类器是支持向量机(SVM),并且所述预测的语言和交流能力的正常性的发展水平差异是高水平或低水平,或连续性评价方式。

32.根据实施方案20至30中任一项所述的计算机可读介质,其中所述机器学习分类器是支持向量回归算法(SVR)或排序支持向量机(RankSVM),并且所预测的语言和交流能力正常性的发展水平差异是量化的。

33.根据实施方案20至32中任一项所述的计算机可读介质,其中分析所述定量数据还包括分析与语言和交流能力正常性的发展水平差异相关的一个或多个变量,例如性别和出生数据。

34.根据实施方案20至33中任一项所述的计算机可读介质,其中通过选自以下的方法从所述EEG或MEG波形提取定量数据:自动峰值检测(Automatic peak detection),快速傅立叶变换(Fast Fourier Transform),自相关(Autocorrelation),均方根(Root-Mean-Square,RMS),Morlet小波变换(Morlet Wavelet Transform),离散小波变换(Discrete Wavelet Transform),小波散射(Wavelet Scattering),刺激响应互相关(Stimulus-Response Cross-correlation),经验模式分解的处理(Empirical ModeDecomposition),希尔伯特-黄变换(Hilbert-Huang Transform);和/或

其中所述定量数据包括以下中的一个或多个:时域峰值幅度(time-domain peakamplitude),时域峰值时延(time-domain peak latency),基频(fundamental frequency,F0),谐波(harmonics),信噪比(signal-to-noise ratio),RMS幅度(RMS amplitude),相关系数(correlation coefficient),试验间相位相干(inter-trial phase coherence),锁相系数(phase-locking coefficient),响应一致性(response consistency),音高强度(pitch strength),音高误差(pitch error),音高跟踪精度(pitch-tracking accuracy)。

35.根据实施方案20至34中任一项所述的计算机可读介质,其中从所述EEG波形提取定量数据包括:通过刺激起始标记将所述EEG波形分割成节段,并且在具有重叠窗口的滑动时间窗口中,利用快速傅立叶变换(FFT)将每个节段变换到频域(frequency domain)。

36.如实施方案35所述的计算机可读介质,其中所述定量数据包括所述健康婴儿或幼儿的T*(E*3)*F张量表示的矩阵,其中T是所述时间窗口的数量,E是每个刺激(例如,一个汉语拼音的一个声调)的节段的数量,F是来自FFT分析的频率间隔(frequency bin)的数量,并且每个T的(E*3)*F矩阵首先在行内被归一化,然后在列中被归一化,从而消除频谱的绝对幅度的影响并且仅保留频率相关随时间变化的模式。

37.如实施方案36所述的计算机可读介质,其中所述机器学习分类器是使用包括高斯核、C和伽马的参数的支持向量机(SVM)。

38.根据实施方案20至37中任一项所述的计算机可读介质,其中由所述机器学习分类器进行的分类是通过交叉验证的,并且交叉验证的结果是在一定倍数的平均准确度、特异性、灵敏度、AUC、奇偶率、相关系数或以上的组合。

39.一种计算机系统,包括:

如实施方案20-38中任一项所述的计算机可读介质;和

用于执行存储在所述计算机可读介质上的指令一个或多个处理器。

40.一种计算机系统,包括:

存储器;和

处理器,所述处理器与所述存储器可通讯地连接并且被配置为执行以下操作:

获得所述健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据;

从所述EEG或MEG波形数据中提取定量数据,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

使用机器学习分类器分析所述定量数据,所述机器学习分类器被训练为能预测所述健康婴儿或幼儿所属人群的语言和交流能力正常性的发展水平差异的预测评分,其中所述训练是基于从具有已知语言和交流能力正常性的发展水平的多个健康婴儿或幼儿获得的训练数据集的对应定量数据;以及

基于所述机器学习分类器输出的结果,生成所述健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的预测评分。

41.根据实施方案40所述的计算机系统,所述处理器还被配置为执行以下操作:

获得处于静息状态下的所述健康婴儿或幼儿的脑电图(EEG)或脑磁图(MEG)波形数据;和

从处于静息状态的所述健康婴儿或幼儿的EEG或MEG波形中提取相应的定量数据,其中所述定量数据包括指示中枢神经系统处于静息状态下的测量指标数据。

42.根据实施方案40或41所述的计算机系统,其中所述外部听觉刺激包括多个不同的刺激,并且所述定量数据包括指示中枢神经系统对所述多个外部听觉刺激中一个或多个的反应与处于静息状态下的测量指标数据。

43.根据实施方案40至42中任一项所述的计算机系统,其中所述定量数据包括表征听觉中枢相关的处理通路功能活动的数据。

44.根据实施方案40至43中任一项所述的计算机系统,其中所述定量数据包括表征下丘及与其连接的中心的功能活动的数据。

45.根据实施方案40至44中任一项所述的计算机系统,其中所述定量数据包括表征初级听觉皮层的功能活动的数据,所述初级听觉皮层包括赫氏脑回或与其连接的中心。

46.根据实施方案40至45中任一项所述的计算机系统,其中所述外部听觉刺激来自使用音高模式来在词汇水平表达含义的语言和语音信号,优选地,所述外部听觉刺激来自汉语。

47.根据实施方案40至45中任一项所述的计算机系统,其中所述外部听觉刺激来自使用音高模式来在短语水平表达含义的语言和语音信号,优选地,所述外部听觉刺激来自汉语。

48.根据实施方案40至47中任一项所述的计算机系统,其中所述外部听觉刺激是一个或多个声调的汉语拼音。

49.根据实施方案40至48中任一项所述的计算机系统,其中在所述健康婴儿或幼儿处于自然睡眠时或处于清醒状态下执行所述EEG或MEG。

50.根据实施方案40至49中任一项所述的计算机系统,其中所述健康婴儿或幼儿的月龄为18个月以下,并且其中当从所述多个健康婴儿或幼儿获得所述训练数据集时,所述多个健康婴儿或幼儿的月龄为18个月以下。

51.根据实施方案40至50中任一项所述的计算机系统,其中所述机器学习分类器是支持向量机(SVM),并且所述预测的语言和交流能力的正常性的发展水平差异是高水平或低水平,或连续性评价方式。

52.根据实施方案40至51中任一项所述的计算机系统,其中所述机器学习分类器是支持向量回归算法(SVR)或排序支持向量机(RankSVM),并且所预测的语言和交流能力正常性的发展水平差异是量化的。

53.根据实施方案40至52中任一项所述的计算机系统,其中分析所述定量数据还包括分析与语言和交流能力正常性的发展水平差异相关的一个或多个变量,例如性别和出生数据。

54.根据实施方案40至53中任一项所述的计算机系统,其中通过选自以下的方法从所述EEG或MEG波形提取定量数据:自动峰值检测(Automatic peak detection),快速傅立叶变换(Fast Fourier Transform),自相关(Autocorrelation),均方根(Root-Mean-Square,RMS),Morlet小波变换(Morlet Wavelet Transform),离散小波变换(DiscreteWavelet Transform),小波散射(Wavelet Scattering),刺激响应互相关(Stimulus-Response Cross-correlation),经验模式分解的处理(Empirical Mode Decomposition),希尔伯特-黄变换(Hilbert-Huang Transform);和/或

其中所述定量数据包括以下中的一个或多个:时域峰值幅度(time-domain peakamplitude),时域峰值时延(time-domain peak latency),基频(fundamental frequency,F0),谐波(harmonics),信噪比(signal-to-noise ratio),RMS幅度(RMS amplitude),相关系数(correlation coefficient),试验间相位相干(inter-trial phase coherence),锁相系数(phase-locking coefficient),响应一致性(response consistency),音高强度(pitch strength),音高误差(pitch error),音高跟踪精度(pitch-tracking accuracy)。

55.根据实施方案40至54中任一项所述的计算机系统,其中从所述EEG波形提取定量数据包括:通过刺激起始标记将所述EEG波形分割成节段,并且在具有重叠窗口的滑动时间窗口中,利用快速傅立叶变换(FFT)将每个节段变换到频域(frequency domain)。

56.如实施方案55所述的计算机系统,其中所述定量数据包括所述健康婴儿或幼儿的T*(E*3)*F张量表示的矩阵,其中T是所述时间窗口的数量,E是每个刺激(例如,一个汉语拼音的一个声调)的节段的数量,F是来自FFT分析的频率间隔(frequency bin)的数量,并且每个T的(E*3)*F矩阵首先在行内被归一化,然后在列中被归一化,从而消除频谱的绝对幅度的影响并且仅保留频率相关随时间变化的模式。

57.如实施方案56所述的计算机系统,其中所述机器学习分类器是使用包括高斯核、C和伽马的参数的支持向量机(SVM)。

58.根据实施方案40至57中任一项所述的计算机系统,其中由所述机器学习分类器进行的分类是通过交叉验证的,并且交叉验证的结果是在一定倍数的平均准确度、特异性、灵敏度、AUC、奇偶率、相关系数或以上的组合。

59.一种预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的系统,包括:

用于获得所述健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据的装置;

用于从所述EEG或MEG波形数据中提取定量数据的装置,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

用于使用机器学习分类器分析所述定量数据的装置,所述机器学习分类器被训练为能预测所述健康婴儿或幼儿所属人群的语言和交流能力正常性的发展水平差异的预测评分,其中所述训练是基于从具有已知语言和交流能力正常性的发展水平的多个健康婴儿或幼儿获得的训练数据集的对应定量数据;以及

用于基于所述机器学习分类器输出的结果,生成所述健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的预测评分的装置。

60.根据实施方案59所述的系统,还包括:

用于获得处于静息状态下的所述健康婴儿或幼儿的脑电图(EEG)或脑磁图(MEG)波形数据的装置;和

用于从处于静息状态的所述健康婴儿或幼儿的EEG或MEG波形中提取相应的定量数据的装置,其中所述定量数据包括指示中枢神经系统处于静息状态下的测量指标数据。

61.根据实施方案59或60所述的系统,其中所述外部听觉刺激包括多个不同的刺激,并且所述定量数据包括指示中枢神经系统对所述多个外部听觉刺激中一个或多个的反应与处于静息状态下的测量指标数据。

62.根据实施方案59至61中任一项所述的系统,其中所述定量数据包括表征听觉中枢相关的处理通路功能活动的数据。

63.根据实施方案59至62中任一项所述的系统,其中所述定量数据包括表征下丘及与其连接的中心的功能活动的数据。

64.根据实施方案59至63中任一项所述的系统,其中所述定量数据包括表征初级听觉皮层的功能活动的数据,所述初级听觉皮层包括赫氏脑回或与其连接的脑区。

65.根据实施方案59至64中任一项所述的系统,其中所述外部听觉刺激来自使用音高模式来在词汇水平表达含义的语言和语音信号,优选地,所述外部听觉刺激来自汉语。

66.根据实施方案59至64中任一项所述的系统,其中所述外部听觉刺激来自使用音高模式来在短语水平表达含义的语言和语音信号,优选地,所述外部听觉刺激来自汉语。

67.根据实施方案59至66中任一项所述的系统,其中所述外部听觉刺激是一个或多个声调的汉语拼音。

68.根据实施方案59至67中任一项所述的系统,其中在所述健康婴儿或幼儿处于自然睡眠时或处于清醒状态下执行所述EEG或MEG。

69.根据实施方案59至68中任一项所述的系统,其中所述健康婴儿或幼儿的月龄为18个月以下,并且其中当从所述多个健康婴儿或幼儿获得所述训练数据集时,所述多个健康婴儿或幼儿的月龄为18个月以下。

70.根据实施方案59至69中任一项所述的系统,其中所述机器学习分类器是支持向量机(SVM),并且所述预测的语言和交流能力的正常性的发展水平差异是高水平或低水平,或连续性评价方式。

71.根据实施方案59至70中任一项所述的系统,其中所述机器学习分类器是支持向量回归算法(SVR)或排序支持向量机(RankSVM),并且所预测的语言和交流能力正常性的发展水平差异是量化的。

72.根据实施方案59至71中任一项所述的系统,其中分析所述定量数据还包括分析与语言和交流能力正常性的发展水平差异相关的一个或多个变量,例如性别和出生数据。

73.根据实施方案59至72中任一项所述的系统,其中通过选自以下的方法从所述EEG或MEG波形提取定量数据:自动峰值检测(Automatic peak detection),快速傅立叶变换(Fast Fourier Transform),自相关(Autocorrelation),均方根(Root-Mean-Square,RMS),Morlet小波变换(Morlet Wavelet Transform),离散小波变换(Discrete WaveletTransform),小波散射(Wavelet Scattering),刺激响应互相关(Stimulus-ResponseCross-correlation),经验模式分解的处理(Empirical Mode Decomposition),希尔伯特-黄变换(Hilbert-Huang Transform);和/或

其中所述定量数据包括以下中的一个或多个:时域峰值幅度(time-domain peakamplitude),时域峰值时延(time-domain peak latency),基频(fundamental frequency,F0),谐波(harmonics),信噪比(signal-to-noise ratio),RMS幅度(RMS amplitude),相关系数(correlation coefficient),试验间相位相干(inter-trial phase coherence),锁相系数(phase-locking coefficient),响应一致性(response consistency),音高强度(pitch strength),音高误差(pitch error),音高跟踪精度(pitch-tracking accuracy)。

74.根据实施方案59至73中任一项所述的系统,其中从所述EEG波形提取定量数据包括:通过刺激起始标记将所述EEG波形分割成节段,并且在具有重叠窗口的滑动时间窗口中,利用快速傅立叶变换(FFT)将每个节段变换到频域(frequency domain)。

75.如实施方案74所述的系统,其中所述定量数据包括所述健康婴儿或幼儿的T*(E*3)*F张量表示的矩阵,其中T是所述时间窗口的数量,E是每个刺激(例如,一个汉语拼音的一个声调)的节段的数量,F是来自FFT分析的频率间隔(frequency bin)的数量,并且每个T的(E*3)*F矩阵首先在行内被归一化,然后在列中被归一化,从而消除频谱的绝对幅度的影响并且仅保留频率相关随时间变化的模式。

76.如实施方案75所述的系统,其中所述机器学习分类器是使用包括高斯核、C和伽马的参数的支持向量机(SVM)。

77.根据实施方案59至76中任一项所述的系统,其中由所述机器学习分类器进行的分类是通过交叉验证的,并且交叉验证的结果是在一定倍数的平均准确度、特异性、灵敏度、AUC、奇偶率、相关系数或以上的组合。

78.一种生成用于预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的机器学习分类器的方法,所述方法包括:

获得一名或多名健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据,并且从所述EEG或MEG波形数据中提取定量数据,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

在一定时间(例如6-12个月)后,对所述一名或多名健康婴儿或幼儿进行语言和交流能力测试,并获得表征语言和交流能力的定性或定量数据;

将从所述EEG或MEG波形数据中提取的定量数据和所述表征语言和交流能力的定性或定量数据输入机器学习分类器进行训练,以生成用于预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的机器学习分类器。

附图简要描述

图1显示了从婴儿获得听觉诱发EEG数据的操作示意图,在婴儿头部上放置电极,在婴儿自然睡眠时(或清醒状态下)通过插入耳机传递听觉刺激。

图2显示了在本申请的示例性方案中,对汉语不同声调的EEG应答。在外部听觉刺激中,将三种声调嵌入音节/ga/:粤语声调/ga2/,普通话声调/ga3/和粤语声调/ga4/(本研究中的婴儿在粤语家庭中成长)。早期EEG反应真实地反映了听觉刺激的时程和频谱组成。图A显示听觉刺激(左栏)和其对应的平均EEG响应(中间栏)的时间进程以及其对应的EEG响应的平均谱图(右栏)。EEG响应的频谱幅度密度集中在听觉刺激谱密度的上四分位位置。图B显示了听觉刺激的频谱(最左栏)和在1、3、6、9和15月龄的婴儿的对听觉刺激的平均EEG谱图(其余五栏)。婴儿月龄越大,听觉频谱结构和EEG频谱结构之间的重叠越明显。

图3显示了通过将支持向量机(SVM)分类器应用于不同月龄婴儿对三个汉语词汇音/ga2/、/ga3/和/ga4/的EEG反应的预测分类结果,可以反映婴儿大脑对这些语音的辨别能力。向SVM分类器输入对三个声调响应的EEG数据,数据每50ms间隔单元经过傅立叶变换。对于随机分割数据的10份中的每一份,通过对9/10的数据进行训练和对其余1/10的数据进行测试,对分类进行交叉验证。对于3个声调的分类精度的随机水平是33%。该图说明分类准确度沿着EEG反应的时间进程具有两个峰值,并且准确度随着婴儿的月龄增大而增长。该图说明了对个体的分类预测。在每个单独个体中进行相同的操作。

图4显示了机器学习模型(SVM分类器)以高于80%的精确度预测两种语言和交流能力测量(来自汉语沟通发展评定量表(Chinese Communication DevelopmentInventories)的后期姿态(Later Gestures)和交互动作(Interactive Acts)),该机器学习模型(SVM分类器)基于约6月龄取得的EEG数据进行训练并进行交叉验证。图中显示了用于将个体15月龄时的两种语言和交流能力测量归于下半部或上半部(中值分割)的分类准确度的自举分布(bootstrapped distribution)(10000倍)。对真实的(左侧)和置换的个体标记(右侧)进行分类。置换标记分类准确度的平均值为50%的随机水平。真实标记分类的平均值在两种情况下都高于置换标记分类的95%(水平虚线),这表明分类显著高于随机水平(p<0.05)。

发明详细描述

如前文所述,对于个体而言,语言和交流能力是非常重要的素质,对学业和事业等多个方面会产生显著影响。汉语和英语是世界上使用者最多的2种语言,但是它们具有显著不同的语言结构。一个显著的区别是在汉语中使用词汇声调或词汇意义层面的音高模式。例如,对于一个音节来说,汉语普通话通常会有平上去入4个声调,而在一些汉语地方话中的声调可能会更多(例如粤语可以包括6个声调)。因此,人体的神经系统精确地编码音调的能力对于语言发育是至关重要的。已有研究发现,学习汉语的婴儿的听觉神经系统具有显著的追踪音调的能力。

本申请希望解决的问题之一是在婴幼儿时期对个体语言和交流能力正常性的发展水平差异进行预测,根据得到的预测结果可以进行有针对性的主动干预和训练。针对这样的技术问题,本申请提供了一个技术平台,主要依靠来自婴幼儿期的神经数据(例如EEG或MEG提取数据)来预测以后的语言和交流能力的发展趋势。机器学习技术被用于训练分类器以进行这种预测。为了获得训练分类器所需要的训练数据集,需要获得一定量的婴幼儿样本的神经数据,随后进行语言和交流能力的评定,将两部分结果进行交叉验证和训练。一旦训练完成,机器学习分类器就可以被用于预测其他婴幼儿的语言和交流能力的正常性的发展水平差异。

大体而言,本申请的方法可以括在婴幼儿头部周围放置表面电极同时进行EEG记录,当婴幼儿在自然睡眠中施加听觉刺激(参见图1);测量来自皮层下听觉脑干的神经响应,特别是婴幼儿的听觉脑干如何跟随刺激的频率(音调)(示例性结果参见图2),从而利用在皮层下听觉脑干和连接的神经结构中观察音调跟踪的能力来预测婴幼儿未来的语言和交流能力发育。

因此,第一方面,本申请提供了一种预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的方法,所述方法包括:

获得所述健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据;

从所述EEG或MEG波形数据中提取定量数据,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

使用机器学习分类器分析所述定量数据,所述机器学习分类器被训练为能预测所述健康婴儿或幼儿所属人群的语言和交流能力正常性的发展水平差异的预测评分,其中所述训练是基于从具有已知语言和交流能力正常性的发展水平的多个健康婴儿或幼儿获得的训练数据集的对应定量数据;以及

基于所述机器学习分类器输出的结果,生成所述健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的预测评分。

在一些实施方案中,该方法还包括:获得处于静息状态下的所述健康婴儿或幼儿的脑电图(EEG)或脑磁图(MEG)波形数据;和从处于静息状态的所述健康婴儿或幼儿的EEG或MEG波形中提取相应的定量数据,其中所述定量数据包括指示中枢神经系统处于静息状态下的测量指标数据。

在一些实施方案中,在所述健康婴儿或幼儿处于自然睡眠时或处于清醒状态下执行所述EEG或MEG。在一些实施方案中,本申请的健康婴儿或幼儿的月龄为18个月以下。在一些实施方案中,关于训练数据集的获取,当从多个健康婴儿或幼儿获得所述训练数据集时,多个健康婴儿或幼儿的月龄为18个月以下。

本文中的“健康”指至少在听、说、智力等与语言和交流能力方面相关方面的健康状态,并且包括但不限于完全健康状态。

本文所述的“婴儿”和“幼儿”按照通常的年龄标准,婴儿为0-12月龄,幼儿为1-3岁。

本文中的“外部听觉刺激”是指语言方面的听觉刺激,并且根据不同语言的结构和组成可以相应地选择。应当理解,外部听觉刺激的语言应当与测试个体未来成长环境中接触的语言相匹配。通常,单个外部听觉刺激应当为相对简单的语言单元,例如,字母/拼音、单词/单字(不同声调)、短语等。在一些实施方案中,外部听觉刺激来自使用音高模式来在词汇水平表达含义的语言和语音信号。在一些实施方案中,外部听觉刺激来自汉语,包括普通话和粤语等。在一些实施方案中,外部听觉刺激来自使用音高模式来在短语水平表达含义的语言和语音信号。在一些实施方案中,外部听觉刺激来自汉语,包括普通话和粤语等。虽然本申请的研究针对的示例性语言为汉语,但是本申请的各项发明的应用并不局限于此。

在一些实施方案中,外部听觉刺激包括多个不同的刺激。在一些实施方案中,定量数据包括指示中枢神经系统对所述多个外部听觉刺激中一个或多个的反应与处于静息状态下的测量指标数据。作为非限制性的例子,多个外部听觉刺激可以是一个汉语拼音的多个声调。

在获得脑电图(EEG)或脑磁图(MEG)波形之后,需要从中提取表征中枢神经系统对外部听觉刺激的响应的数据。例如,定量数据可以包括表征听觉中枢相关的处理通路功能活动的数据;或表征下丘及与其连接的中心的功能活动的数据;或表征初级听觉皮层的功能活动的数据,所述初级听觉皮层包括赫氏脑回或与其连接的中心。

从EEG或MEG波形提取上述定量数据的可用方法有多种,包括但不限于,自动峰值检测(Automatic peak detection),快速傅立叶变换(Fast Fourier Transform),自相关(Autocorrelation),均方根(Root-Mean-Square,RMS),Morlet小波变换(Morlet WaveletTransform),离散小波变换(Discrete Wavelet Transform),小波散射(WaveletScattering),刺激响应互相关(Stimulus-Response Cross-correlation),经验模式分解的处理(Empirical Mode Decomposition),希尔伯特-黄变换(Hilbert-HuangTransform),或以上方法的组合。

可从EEG或MEG波形提取的可用定量数据的形式有多种,包括但不限于,时域峰值幅度(time-domain peak amplitude),时域峰值时延(time-domain peak latency),基频(fundamental frequency,F0),谐波(harmonics),信噪比(signal-to-noise ratio),RMS幅度(RMS amplitude),相关系数(correlation coefficient),试验间相位相干(inter-trial phase coherence),锁相系数(phase-locking coefficient),响应一致性(response consistency),音高强度(pitch strength),音高误差(pitch error),音高跟踪精度(pitch-tracking accuracy),或上述数据的组合。

作为非限制性实例,从EEG波形提取定量数据的过程可以包括:通过刺激起始标记将所述EEG波形分割成节段,并且在具有重叠窗口的滑动时间窗口中,利用快速傅立叶变换(FFT)将每个节段变换到频域(frequency domain)。在一些实施方案中,定量数据包括所述健康婴儿或幼儿的T*(E*3)*F张量表示的矩阵,其中T是所述时间窗口的数量,E是每个刺激(例如,一个汉语拼音的一个声调)的节段的数量,F是来自FFT分析的频率间隔(frequencybin)的数量,并且每个T的(E*3)*F矩阵首先在行内被归一化,然后在列中被归一化,从而消除频谱的绝对幅度的影响并且仅保留频率相关随时间变化的模式。

在获得定量数据之后,使用机器学习分类器分析所述定量数据。机器学习分类器(machine-learning classifier)的大体工作原理是已知的。本申请的机器学习分类器工作所基于的训练数据集来自于与测试个体属于相同人群的多个类似个体。本文中所指的“相同人群”或“相同群体”是指处于相同语言文化层面的个体的集合。例如,如果测试个体会在说普通话的环境中生长,则应当使用基于普通话的训练数据集;类似得,如果测试个体会在说粤语的环境中生长,则应当使用基于粤语的训练数据集;以此类推。用于创建训练数据集的多个个体可以与测试个体进行过相同的外部听觉刺激和EEG/MEG定量数据提取,并且所述多个个体还在随后(例如6-12个月后)经过语言和交流能力的实际评价并将结果用于创建训练数据集。评价儿童语言和交流能力的测试有多种,例如汉语沟通发展评定量表(Chinese Communication Development Inventories)中的后期姿态(Later Gestures)和交互动作(Interactive Acts)。

在一些实施方案中,机器学习分类器是使用包括高斯核、C和伽马的参数的支持向量机(SVM)。

在一些实施方案中,机器学习分类器是支持向量机(SVM),并且所述预测的语言和交流能力正常性的发展水平差异是高水平或低水平,或连续性评价方式。

在一些实施方案中,机器学习分类器是支持向量回归算法(SVR)或排序支持向量机(RankSVM),并且所预测的语言和交流能力正常性的发展水平差异是量化的。

在一些实施方案中,由所述机器学习分类器进行的分类是通过交叉验证的,并且交叉验证的结果是在一定倍数(例如5倍、10倍或更多倍)的平均准确度、特异性、灵敏度、AUC、奇偶率、相关系数或以上的组合。

在一些实施方案中,分析所述定量数据还包括分析与语言发育相关的一个或多个变量,例如性别和出生数据。

本申请的实施例描述了一种具体的第一方面的方法,应当理解,实施例中的技术特征,在不存在技术矛盾的情况下,也可以适用于上述实施方案。

第二方面,本申请提供了一种计算机可读介质,其存储多个指令,所述多个指令当被计算机系统的处理器执行时控制计算机系统执行多种操作以实施第一方面的方法。

第三方面,本申请提供了一种计算机系统,包括:

第二方面所述的计算机可读介质;和

用于执行存储在所述计算机可读介质上的指令一个或多个处理器。

第四方面,本申请提供了一种计算机系统,包括:

存储器;和

处理器,所述处理器与所述存储器可通讯地连接并且被配置为执行多种操作以实施第一方面的方法。

第五方面,本申请提供了一种预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的系统,包括用于实施第一方面的方法的多种装置。

第六方面,本申请提供了一种生成用于预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的机器学习分类器的方法,所述方法包括:

获得一名或多名健康婴儿或幼儿对外部听觉刺激引发的脑电图(EEG)或脑磁图(MEG)波形数据,并且从所述EEG或MEG波形数据中提取定量数据,其中所述定量数据包括表征中枢神经系统对所述外部听觉刺激所引起的测量指标数据;

在一定时间(例如6-12个月)后,对所述一名或多名健康婴儿或幼儿进行语言和交流能力测试,并获得表征语言和交流能力的定性或定量数据;

将从所述EEG或MEG波形数据中提取的定量数据和所述表征语言和交流能力的定性或定量数据输入机器学习分类器进行训练,以生成用于预测健康婴儿或幼儿的语言和交流能力正常性的发展水平差异的机器学习分类器。

在不发生矛盾或进行适应性调整的情况下,第一方面的各个技术方案和技术特征也适用于第二至第六方面。还应当理解,第六方面的发明涉及EEG或MEG波形数据中的定量数据的获取和后期表征语言和交流能力的定性或定量数据的获取,前者的实施可以参照第一方面的方法;后者的实施具有多种方式,例如本文示例性采用的汉语沟通发展评定量表(Chinese Communication Development Inventories)中的多种与语言和沟通能力相关的模块,无论是获得定性还是定量的结果,均可以将其进行适当的数据变换应用于机器学习分类器进行训练。

应理解,本发明的任何实施方式可以以模块化或集成方式使用硬件(例如专用集成电路或现场可编程门阵列)和/或使用具有通用可编程处理器的计算机软件以控制逻辑的形式来实施。如本文所用,处理器包括单核处理器、在同一集成芯片上的多核处理器,或在单个电路板上或网络化的多个处理单元。基于本公开和本文所提供的教示,本领域的普通技术人员将知道并且理解使用硬件和硬件与软件的组合来实施本发明实施方式的其它方式和/或方法。

在本申请中所述的任何软件组件或功能可以实施为以待通过处理器使用任何合适的计算机语言如例如Java、C、C++、C#、面向对象的C语言、Swift或脚本语言(如使用例如常规或面向对象技术的Perl或Python)而执行的软件代码。软件代码可以存储为用于存储和/或传输的计算机可读介质上的一系列指令或命令,合适的介质包括随机存取存储器(RAM)、只读存储器(ROM)、磁性介质(如硬盘驱动器或软性磁盘)或光学介质(如光盘(CD)或DVD(数字通用光盘))、快闪存储器等。计算机可读介质可以是这类存储或传输装置的任何组合。

还可以使用适合于经由符合多种方案的有线、光学和/或无线网络(包括因特网)传输的载波信号来编码和传输这类程序。因此,根据本发明一个实施方式的计算机可读介质可以使用利用这类程序编码的数据信号产生。利用程序代码编码的计算机可读介质可以与兼容装置一起封装或与其它装置分开提供(例如经由因特网下载)。任何这类计算机可读介质可驻存于单个计算机产品(例如硬盘驱动器、CD或整个计算机系统)上或其内部,并且可以存在于系统或网络内的不同计算机产品上或其内部。。计算机系统可包括用于向用户提供本文所提及的任何结果的监视器、打印机或其它合适的显示器。

本文中所述的任何方法可完全或部分用计算机系统执行,所述计算机系统包括一个或多个处理器,所述处理器可以经配置以执行所述步骤。因此,实施方式可以涉及经配置以执行本文所述的任何方法的步骤的计算机系统,可能用不同组件执行相应步骤或相应步骤群组。尽管本文中方法的步骤以经编号步骤的形式呈现,但其可以同时或以不同顺序执行。另外,这些步骤的部分可以与其它方法的其它步骤部分一起使用。此外,步骤的全部或部分可以是任选的。另外,任何方法的任何步骤都可以用执行这些步骤的模块、电路或其它构件来执行。

可在不脱离本发明实施方式的精神和范围的情况下,以任何合适方式组合特定实施方式的具体细节。然而,本发明的其它实施方式可以涉及与每个个别方面或这些个别方面的具体组合相关的具体实施方式。

对本发明的实例性实施方式的以上描述已经为了说明和描述的目的而呈现。其并非旨在是穷尽性的或将本发明限制于所描述的精确形式,并且鉴于以上教示许多修改和变化都是可能的。

实施例

本研究涉及使用神经学测量来构建预测算法,用于在个体水平进行语言和交流能力正常性的发展水平结果的预测。作为示例,本研究使用EEG数据作为神经学测量指标。本研究主要需要:1)EEG测试流程,并且该流程最好是简短的并且包含最有信息的听觉刺激,2)来自一组已经在这种EEG流程上进行过测试的儿童的现有数据,并且这些儿童随后的语言和交流结果是已知的,以及3)用于将EEG和语言和交流的实际评价结果数据相关联的算法,在进行预测中具有较高的特异性和敏感性。

数据源

本研究基于从30个学习汉语的儿童的数据来构建算法。这些儿童在婴儿期进行EEG神经学测量,并使用汉语沟通发展评定量表(Chinese Communicative DevelopmentInventory,CCDI,Tardif et al.,2008)在EEG测量之后几个月评价语言发展结果。

刺激和EEG程序

听觉诱发的EEG程序在多篇文献已有报道(例如,Lau,J.C.Y.,Wong,P.C.M.,&Chandrasekaran,B.(2017).Context-dependent Plasticity in the SubcorticalEncoding ofLinguistic Pitch Patterns.Journal of Neurophysiology,117(2),594–603;Liu,F.,Maggu,A.R.,Lau,J.C.Y.,&Wong,P.C.M.(2015).Brainstem Encoding ofSpeech and Musical Stimuli in Congenital Amusia:Evidence from CantoneseSpeakers.Frontiers in Human Neuroscience,8;Maggu,A.R.,Liu,F.,Antoniou,M.,&Wong,P.C.M.(2016).Neural Correlates of Indicators of Sound Change inCantonese:Evidence from Cortical and Subcortical Processes.Frontiers in HumanNeuroscience,10.,通过引用的方式将上述文献的内容整体并入本文,用于全部目的)(基本设置参见图1)。在本研究中,婴儿接受听觉刺激,本研究中的刺激特别设计为反映汉语中词汇音的特性(图2)。在本研究的外部听觉刺激中,将三种声调嵌入音节/ga/:粤语声调/ga2/,普通话声调/ga3/和粤语声调/ga4/(本研究中的婴儿在粤语家庭中成长)。早期延时EEG反应真实地反映了听觉刺激的时程和谱组成。图A显示听觉刺激(左栏)和平均EEG响应(中间栏)的时间进程以及与包围听觉刺激谱的上四分位数的轮廓重叠的EEG响应的平均谱图(右栏)。EEG响应的谱幅度密度集中在听觉刺激谱密度的上四分位数内。图B显示了在1、3、6、9和15月龄的婴儿的听觉刺激的谱图(左栏)和其对应的平均EEG谱图(其余五栏)。婴儿月龄越大,听觉谱结构和EEG谱结构之间的重叠越明显。收集的听觉诱发的神经EEG响应根据Matlab中执行的一系列自动过程进行分析,例如快速傅立叶变换,自相关和均方根(RMS)。按照报道的程序提取诸如基频(F0)、谐波、信噪比和RMS幅度的测量值。

其他变量

除了神经学测量差异之外,其它变量也可能会影响语言发育(例如,性别,出生数据等)。因此,这些变量也可以输入到预测模型中以实现更优的预测性能。

机器学习

本研究的算法使用神经EEG测量,用于在婴儿期间进行EEG记录之后几个月,将个体婴儿分类为较好或较差的语言结果组。本研究使用具有10倍交叉验证和自举-置换统计的支持向量机(SVM)程序来实现二进制分类。

本研究执行了两步法SVM分类:在个体受试者水平和在88个受试者的组水平,其中30名受试者约6月龄时进行了EEG数据收集,并在约1周岁时进行语言和交流结果(CCDI)评估和数据收集。本研究用EEG数据预测6个月后的语言和交流结果。

在个体受试者的水平上,通过刺激起始标记将经滤波的EEG分割成节段。三个声调中的每一个得到一组1000个EEG节段。在50ms的滑动窗口中利用FFT将每个节段变换到频域,其中窗口之间有50%的重叠。得到每个受试者的T*(E*3)*F张量的矩阵,其中T是时间窗口的数目,E是每个声调的节段的数目,F是来自FFT分析的频率间隔(frequency bin)的数目。每个T的(E*3)*F矩阵首先在行内被归一化,然后在列中被归一化,从而消除谱的绝对幅度的影响,并且仅留下频率相关的模式。然后将T矩阵输入在LIBSVM软件包中执行的三向SVM分类器中作为声调类别的预测器。使用高斯核、C=100、γ=1/F。以10倍的方式交叉验证分类,即,数据被随机地分成10份,并且对于每一份,分类器在90%的数据上被训练并且在10%的数据上被测试。交叉验证过程的结果是跨越倍数的平均精确度。结果,对于每个受试者,获得了T分类精度的矢量。图3显示了通过将支持向量机(SVM)分类器应用于对三个汉语词汇音/ga2/、/ga3/和/ga4/的EEG响应的预测分类结果,可以反映婴儿大脑的辨别能力。向SVM分类器输入沿着对三个声调的EEG响应的时间过程的50ms间隔单元的傅立叶变换。对于随机分割数据的10份中的每一份,通过对9/10的数据进行训练和对其余1/10的数据进行测试,对分类进行交叉验证。对于3个声调的分类精度的机会水平是33%。该图说明分类准确度沿着反应的时间进程具有两个峰值,并且准确度随着婴儿的月龄增大而增长。该图说明了跨越个体的分类。在每个单独个体中进行相同的操作。

在组水平,这些矢量被组合成S*T矩阵,其中S是具有来自EEG记录和CCDI语言和交流结果的受试者的数目。这些矩阵是为EEG记录时间和语言和交流结果产生时间的每个可能的组合创建的,并且在每个时间区间内被归一化。这些组合覆盖了原始83个受试者的部分重叠的子集。这些年龄组合的每一个内的语言和交流结果被转换成具有中值分裂的二进制变量。每个预测器矩阵在每个时间区间内被归一化。然后对每个语言和交流结果以及语言和交流结果时间和EEG记录时间的每个可能的组合执行二进制SVM。SVM参数为高斯核,C=100,γ=1/T。用10倍法交叉验证分类的准确性。使用自举和置换的组合来计算每个分类的置信区间。对于每个预测器-响应组合,用置换对矩阵(受试者)的行进行重新采样,对实际的和随机置换的受试者标记进行10倍交叉验证的SVM分类。重复该过程10000次,获得实际预测精度和置换预测精度的分布(参见图4)。真实标签精确度的平均值高于置换标签精确度的分布的95%,认为精确度显著高于机会水平。

技术分类

06120116338949