一种面向儿童的阶段性身高预测方法
文献发布时间:2023-06-19 11:49:09
技术领域
本发明涉及儿童阶段性身高预测方法。
背景技术
儿童青少年阶段性身高是评估儿童青少年生长发育情况的一项重要指标,一直是国家、医生和家长关心的重点。
通过对儿童青少年阶段性身高的预测,能其生长发育阶段出现的异常情况进行及时干预,还能使儿童青少年在成长过程中养成良好的生活习惯。但是阶段性身高预测存在需要长时间观测、数据难以获得、准确度不高等难点。因此,如何提高儿童阶段性预测身高的准确率是值得深入研究的重要问题。
本发明将基于kmeans聚类算法,提出一种面向儿童的阶段性身高预测方法,能够及时发现青少年儿童在生长发育期间出现的身高问题。
发明内容
本发明要克服现有技术的上述缺点,提供一种面向儿童的阶段性身高预测方法。
本发明解决技术问题采用如下技术方案:
一种面向儿童的阶段性身高预测方法,包括以下步骤:
步骤1:将数据进行归类;
步骤2:对kmeans聚类算法改进,并分类;
步骤3:计算检测者到每个类聚类中心的相似度距离,找出最相似的那一类;
步骤4:计算检测者到该类每个数据的相似度距离,找出最接近的3条数据,取平均值。
优选地,步骤1具体包括:将数据按照男生和女生分成两个组别,在每个组别中依照骨龄进行归类。
优选地,步骤2具体包括:
1)使用肘部法则和轮廓系数相结合的方法确定k值。肘部法则计算公式如下:
其中,SSE表示的是所有样本的聚类误差,C
轮廓系数的公式如下表示:
其中,S(j)表示轮廓系数,a(j)表示第j个样本到同一簇内其他点不相似程度的平均值,b(j)表示第j个样本到其他簇的平均不相似程度的最小值。S(j)越接近1,说明样本聚类效果越好。
选择一个变化率急剧下降的点作为最优k值。选择方式以肘部法则为主,肘部法则无法确定,再辅以轮廓系数确定,选择最大时的轮廓系数作为k值。
2)获取检测者的体成分信息(当前身高,当前体重,年龄,骨龄),作为其中一个聚类中心。举例说明,假设检测者的性别为男,骨龄在6.0~6.9之间,那么属于该检测者的骨龄段为男性数据集中骨龄范围为[6.0,6.9]之间的数据集合。
F={H,W,A,BA} (3-3)
其中,F表示第一个质心,H表示检测者的当前身高,W表示检测者的当前体重,A表示检测者的年龄,BA表示检测者的骨龄。
在相应的骨龄段,利用马氏距离来计算被检测者和该骨龄段所有数据的体成分相似度。距离越小,表示相似度越高。
其中,D
利用公式(3-5)选取k-1个最不相似的数据作为剩下的聚类中心。
K
其中,K
2)根据检测者的骨龄,将该骨龄所属的骨龄段进行分类。
优选地,步骤3具体包括:
1)使用公式(4-1)计算检测者到每个类聚类中心的距离。
其中,Similar
2)选择相似度距离最小的三条数据。
步骤4具体包括:
1)根据公式(5-1)将选取到的三条数据取平均值。
(BA
=(Y
其中,BA
2)重复以上步骤,直到检测者年龄超过18岁,这时检测者当前年龄到成年的阶段性身高就都可以表示出来。
本发明具有如下有益效果:
(1)对kmeans聚类算法改进,使其适用阶段性身高预测。
(2)儿童阶段性身高的准确率提高。
附图说明
图1是本发明的流程图。
图2是本发明其中一个男生预测结果。
图3是本发明其中一个女生预测结果。
具体实施方式
下面结合附图对本发明的技术方案作进一步阐述。
一种面向儿童的阶段性身高预测方法,包括以下步骤:
步骤1:将数据进行归类;
步骤2:对kmeans聚类算法改进,并分类;
步骤3:计算检测者到每个类聚类中心的相似度距离,找出最相似的那一类;
步骤4:计算检测者到该类每个数据的相似度距离,找出最接近的3条数据,取平均值。
步骤1具体包括:
将数据按照男生和女生分成两个组别,在每个组别中依照骨龄进行归类。
步骤2具体包括:
1)使用肘部法则和轮廓系数相结合的方法确定k值。肘部法则计算公式如下:
其中,SSE表示的是所有样本的聚类误差,C
轮廓系数的公式如下表示:
其中,S(j)表示轮廓系数,a(j)表示第j个样本到同一簇内其他点不相似程度的平均值,b(j)表示第j个样本到其他簇的平均不相似程度的最小值。S(j)越接近1,说明样本聚类效果越好。
选择一个变化率急剧下降的点作为最优k值。选择方式以肘部法则为主,肘部法则无法确定,再辅以轮廓系数确定,选择最大时的轮廓系数作为k值。
2)获取检测者的体成分信息(当前身高,当前体重,年龄,骨龄),作为其中一个聚类中心。举例说明,假设检测者的性别为男,骨龄在6.0~6.9之间,那么属于该检测者的骨龄段为男性数据集中骨龄范围为[6.0,6.9]之间的数据集合。
F={H,W,A,BA} (3-3)
其中,F表示第一个质心,H表示检测者的当前身高,W表示检测者的当前体重,A表示检测者的年龄,BA表示检测者的骨龄。
在相应的骨龄段,利用马氏距离来计算被检测者和该骨龄段所有数据的体成分相似度。距离越小,表示相似度越高。
其中,D
利用公式(3-5)选取k-1个最不相似的数据作为剩下的聚类中心。K
其中,K
2)根据检测者的骨龄,将该骨龄所属的骨龄段进行分类。
步骤3具体包括:
1)使用公式(4-1)计算检测者到每个类聚类中心的距离。
其中,Similar
2)选择相似度距离最小的三条数据。
步骤4具体包括:
1)根据公式(5-1)将选取到的三条数据取平均值。
(BA
=(Y
其中,BA
2)重复以上步骤,直到检测者年龄超过18岁,这时检测者当前年龄到成年的阶段性身高就都可以表示出来。
一般的儿童的阶段性身高预测需要长时间的观测。但是这种方法耗时,无法跟上儿童身体素质的提升。本发明提出一种面向儿童的阶段性身高预测方法,利用kmeans聚类算法,结合大量横向儿童数据,构成儿童阶段性身高预测方法。
最后应说明的是:以上实施方式仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施方式对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施方式技术方案的精神和范围。
- 一种面向儿童的阶段性身高预测方法
- 一种基于生长激素治疗的儿童阶段身高预测方法