掌桥专利:专业的专利平台
掌桥专利
首页

基于监督学习的神经网络的健康训练数据生成方法及装置

文献发布时间:2024-04-18 20:02:40


基于监督学习的神经网络的健康训练数据生成方法及装置

技术领域

本申请涉及数据处理技术领域,尤其涉及一种基于监督学习的神经网络的健康训练数据生成方法及装置。

背景技术

在健身运动健康领域,评估模型的运用已经成为了评估用户健康状况和制定个性化健康计划的重要手段。通过收集和分析用户的生理数据,包括心率、血压、血糖水平、体温等,模型可以全面评估用户的生理状况,进而为其制定出符合个人需求的健康计划。

然而,在构建评估模型的过程中,面临着数据私密性的问题。用户对于自身数据的隐私保护意识越来越强,这使得难以获取到足够多且具有代表性的数据来构建高精度的评估模型。此外,由于健身运动健康领域的特殊性,用户的生理数据往往存在着个体差异大、动态变化快等特点,这使得数据收集和分析的难度进一步加大。

发明内容

本申请针对现有的问题,提出了一种基于监督学习的神经网络的健康训练数据生成方法及装置,具体技术方案如下:

在本申请的第一方面,提供一种基于监督学习的神经网络的健康训练数据生成方法,方法包括:

获取历史健康数据,并确定历史健康数据的分类标签和评价分数,其中,分类标签用于表征历史健康数据的属性特征,评价分数用于表征历史健康数据的优劣程度;

根据分类标签将历史健康数据分为多个子训练集;

根据评价分数确定每个训练子集中的标准健康数据和待优化健康数据,并根据标准健康数据和待优化健康数据进行数据增强,生成多个重构健康数据,其中,标准健康数据的评价分数大于待优化健康数据的评价分数;

确定每个重构健康数据的评价分数和模版匹配度,并根据重构健康数据的评价分数、模版匹配度以及待优化健康数据的评价分数,对待优化健康数据进行更新;

基于更新后的待优化健康数据,继续执行根据标准健康数据和待优化健康数据进行数据增强的步骤。

可选地,确定历史健康数据的分类标签和评价分数,包括:

将历史健康数据输入第一模型,以获得历史健康数据的分类标签;

将历史健康数据输入第二模型,以获得历史健康数据的评价分数,其中,第一模型为分类模型,第二模型为评价模型。

可选地,将历史健康数据输入第二模型,以获得历史健康数据的评价分数包括:

获取历史健康数据的特征序列以及历史健康数据的评价标准;

根据特征序列与评价标准的匹配度,计算历史健康数据的评价分数。

可选地,根据标准健康数据和待优化健康数据进行数据增强,生成多个重构健康数据,包括:

确定目标重构维度,其中,目标重构维度至少包括:时序维度、数值维度、文本维度以及图像维度中的一种;

基于目标重构维度,以标准健康数据为重构目标,对待优化健康数据进行重构,生成多个重构健康数据。

可选地,基于目标重构维度,以标准健康数据为重构目标,对待优化健康数据进行重构,生成多个重构健康数据,包括:

将标准健康数据映射为第一向量,将待优化健康数据映射为第二向量;

基于目标重构维度确定第二向量相当于第一向量的调整位置;

基于调整位置的随机变量,生成多个第三向量;

基于多个第三向量,生成多个重构健康数据。

可选地,方法还包括:

在重构健康数据的评价分数大于标准健康数据的评价分数的情况下,将重构健康数据确定为目标健康数据。

可选地,在将重构健康数据确定为目标健康数据之后,方法还包括:

任意组合每个子训练集的目标健康数据,以获得至少一组用于训练神经网络的健康训练数据。

第二方面,本发明实施例提供了一种基于监督学习的神经网络的健康训练数据生成装置,装置包括:

获取模块,用于获取历史健康数据,并确定历史健康数据的分类标签和评价分数,其中,分类标签用于表征历史健康数据的属性特征,评价分数用于表征历史健康数据的优劣程度;

划分模块,用于根据分类标签将历史健康数据分为多个子训练集;

重构模块,用于根据评价分数确定每个训练子集中的标准健康数据和待优化健康数据,并根据标准健康数据和待优化健康数据进行数据增强,生成多个重构健康数据,其中,标准健康数据的评价分数大于待优化健康数据的评价分数;

更新模块,用于确定每个重构健康数据的评价分数,并根据重构健康数据的评价分数与待优化健康数据的评价分数的大小关系,对待优化健康数据进行更新;

迭代模块,用于基于更新后的待优化健康数据,继续执行根据标准健康数据和待优化健康数据进行数据增强的步骤。

可选地,获取模块,包括:

第一输入子模块,用于将历史健康数据输入第一模型,以获得历史健康数据的分类标签;

第二输入子模块,用于将历史健康数据输入第二模型,以获得历史健康数据的评价分数,其中,第一模型为分类模型,第二模型为评价模型。

可选地,第二输入子模块包括:

获取单元,用于获取历史健康数据的特征序列以及历史健康数据的评价标准;

评价单元,用于根据特征序列与评价标准的匹配度,计算历史健康数据的评价分数。

可选地,重构模块,包括:

目标维度确定子模块,用于确定目标重构维度,其中,目标重构维度至少包括:时序维度、数值维度、文本维度以及图像维度中的一种;

重构子模块,用于基于目标重构维度,以标准健康数据为重构目标,对待优化健康数据进行重构,生成多个重构健康数据。

可选地,重构子模块,包括:

第一映射单元,用于将标准健康数据映射为第一向量,将待优化健康数据映射为第二向量;

第二映射单元,用于基于目标重构维度确定第二向量相当于第一向量的调整位置;

生成单元,用于基于调整位置的随机变量,生成多个第三向量;

重构单元,用于基于多个第三向量,生成多个重构健康数据。

可选地,装置还包括更新模块,用于在重构健康数据的评价分数大于标准健康数据的评价分数的情况下,将重构健康数据确定为目标健康数据。

可选地,装置还包括组合模块,用于任意组合每个子训练集的目标健康数据,以获得至少一组用于训练神经网络的健康训练数据。

本发明实施例第三方面提出一种电子设备,电子设备包括:

至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,

存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本发明实施例第一方面提出方法步骤。

本发明实施例第四方面提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例第一方面提出方法。

本申请具有以下有益效果:

在本申请的方案中,通过获取历史健康数据并确定分类标签和评价分数,可以对数据进行有效分类和评估。这样可以充分利用有限的历史健康数据,将其转化为具有属性特征和优劣程度的信息,从而更好地理解和利用这些数据。将历史健康数据根据分类标签分为多个子训练集,能够保留不同属性特征的数据样本,并使每个子训练集都具有一定的代表性。这样可以提高数据样本的多样性,使得模型能够学习到更全面和广泛的健康数据特征。根据评价分数确定每个训练子集中的标准健康数据和待优化健康数据,并进行数据增强,生成多个重构健康数据。这样可以通过扩充数据量,增加训练样本的数量,提供更多的数据样本供模型学习和训练,从而提高模型的泛化能力和准确性。通过确定每个重构健康数据的评价分数,并与待优化健康数据的评价分数进行比较,可以进一步优化待优化数据。根据评价分数的大小关系,对待优化健康数据进行更新,使其更接近标准健康数据,从而提高模型的效果和性能。基于更新后的待优化健康数据,继续执行数据增强的步骤,可以生成更多、更具多样性的健康数据样本。这样可以不断优化模型,改进模型的训练效果,并在有限的历史健康数据基础上,获取更多有效数据,提高模型的预测准确性和可靠性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1为本申请实施例涉及的硬件运行环境的电子设备结构示意图。

图2是本申请实施例提供的一种基于监督学习的神经网络的健康训练数据生成方法的步骤流程图。

图3是本申请实施例提供的一种基于监督学习的神经网络的健康训练数据生成装置的功能模块示意图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

下面结合附图对本申请的方案进一步说明。

参照图1,图1为本申请实施例方案涉及的硬件运行环境的电子设备结构示意图。

如图1所示,该电子设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种存储介质的存储器1005中可以包括操作装置、数据存储模块、网络通信模块、用户接口模块以及电子程序。

在图1所示的电子设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明电子设备中的处理器1001、存储器1005可以设置在电子设备中,电子设备通过处理器1001调用存储器1005中存储的基于监督学习的神经网络的健康训练数据生成装置,并执行本申请实施例提供的基于监督学习的神经网络的健康训练数据生成方法。

参照图2,基于前述硬件运行环境,本申请的实施例提供了一种基于监督学习的神经网络的健康训练数据生成方法,具体可以包括以下步骤:

S201:获取历史健康数据,并确定历史健康数据的分类标签和评价分数。

在本实施方式中,历史健康数据包括用户的历史运动数据和用户的历史身体数据,由于健康数据的有限可用性,历史健康数据的真实样本可能相对较小。导致在监督学习任务中缺乏足够的多样性和数量的数据,因此需要根据有限的历史健康数据,来尽可能的生成多的用于训练高精度健康诊断模型的训练数据。历史健康数据可以包括各种信息,例如病历文本、实验室结果、影像报告等。历史健康数据的分类标签用于表征历史健康数据的属性特征,评价分数于表征历史健康数据的优劣程度。在生成的训练数据的过程中,分类标签的准确定义变得尤为重要。此外,为了更全面地反映历史健康数据的质量和健康信息,引入评价分数用于量化历史健康数据的可靠性和信息量。评价分数的制定需要考虑到不同数据来源的特点,以便更准确地反映历史健康数据在诊断模型训练中的重要性。

而确定历史健康数据的分类标签和评价分数的具体步骤可以包括:

S2011:将历史健康数据输入第一模型,以获得历史健康数据的分类标签。

在本实施方式中,将数据输入模型之前,通常需要进行一些数据预处理步骤,以确保数据的格式和结构适用于模型的输入要求。这可能包括数据标准化、缺失值填充、或者文本数据的向量化等处理。第一模型是一个分类模型,其架构包括输入层、隐藏层和输出层。输入层接收历史健康数据,隐藏层通过一系列神经网络层对数据进行学习和特征提取,最后的输出层产生对应于不同类别的分类结果。第一模型通过监督学习进行训练,使其能够准确地对新的历史健康数据进行分类。第一模型可以将新的历史健康数据映射到特定的类别标签。类型标签是用来标识或分类数据的标签,其具体类型取决于数据的性质和任务的要求。在运动健康数据的上下文中,可以使用各种类型标签,包括但不限于:

影像分类:对于健康图像数据,类型标签可以表示不同的组织或器官,例如肺部、心脏、脑部等,或者标记图像中是否存在病变或异常。

文本分类:对于健康文本数据,标签可以表示文档的主题,例如临床报告的类型,或者文本中是否存在特定的健康条件或关键词。需要说明的是,图像数据是最为缺乏的数据,因此也是本申请应用最广泛的数据。

S2012:将历史健康数据输入第二模型,以获得历史健康数据的评价分数。

在本实施方式中,评价分数被用来表征历史健康数据的优劣程度,即该数据在某个方面的质量或重要性。从第一模型中获得的历史健康数据(通常是已经附有分类标签的数据)被输入到第二模型进行进一步的分析和评估。第二模型是一个用于评价历史健康数据的模型。它的结构可能与第一模型不同,因为它的任务是产生一个评价分数而不是分类标签。该模型可能包括输入层、隐藏层和输出层,其中输出层的值表示历史健康数据的评价分数。

评价分数被设计为表征历史健康数据的优劣程度。高评价分数可能表示数据具有高质量、重要性或临床关联性,而低评价分数则可能表示数据质量较低或在某些方面缺乏信息价值。评价分数的具体应用取决于任务需求。例如,对于健康图像,评价分数可能与图像的清晰度、准确性或对于诊断的关联性相关;对于文本数据,评价分数可能与文档的详实性、临床关键信息的提供程度相关。

通过这个过程,第二模型能够为历史健康数据提供一个量化的评价有助于提高数据的信息利用率。

而获得历史健康数据的评价分数的具体步骤可以包括:

S20121:获取历史健康数据的特征序列以及历史健康数据的评价标准;

S20122:根据特征序列与评价标准的匹配度,计算历史健康数据的评价分数。

在S20121至S20122的实施方式中,特征序列是从历史健康数据中提取的关键特征的有序集合。这些特征可能包括各种健康参数、实验室数据、症状描述、图像特征等。获取特征序列的目的是为了对历史健康数据进行更详细的描述,以便更准确地进行评估。评价标准是用于衡量历史健康数据优劣的一组标准或规范。反映了数据在运动健康诊断或研究中的重要性。评价标准可能涵盖数据的准确性、完整性、临床相关性等方面。将特征序列与评价标准进行匹配度计算,以量化历史健康数据在各个方面的符合程度。涉及到特征与标准之间的相似性度量,例如相关性、相似性分数等。匹配度计算的目标是将特征序列与评价标准进行量化比较,以确定历史健康数据的质量。利用匹配度计算的结果,可以计算历史健康数据的评价分数。这个分数是一个综合的度量,反映了历史健康数据在特定评价标准下的整体表现。评价分数的计算可能采用加权平均或其他组合方法,以更全面地反映匹配度的重要性。

示例性的,历史健康数据包含了胸部X射线图像。从X射线图像中提取了一系列特征,包括肺部纹理、肺结节的大小、肺部密度等。这些特征形成了的特征序列。评价标准可以为包括肺部结构的清晰度、是否存在异常阴影、以及肺结节的大小是否在正常范围内等。对于每个图像,计算了每个特征与评价标准之间的匹配度。例如,如果图像显示了清晰可见的肺部结构,与专业标准相符,那么在清晰度特征上的匹配度就很高。通过对匹配度进行汇总和加权平均,计算了每个图像的综合评价分数。这个分数可以在0到100的范围内,其中100表示图像在所有评价标准下完全匹配,而0表示图像未能满足任何标准。

即如果一张X射线图像显示了清晰的肺部结构、正常的肺结节大小,并且没有异常阴影,那么它的匹配度会很高,相应的评价分数可能接近100。相反,如果图像模糊、肺结节异常增大,或者存在异常阴影,匹配度较低,评价分数则可能较低。

S202:根据分类标签将历史健康数据分为多个子训练集。

在本实施方式中,历史健康数据的分类标签是在前面步骤中由第一模型获得的。这些标签用于表示数据属于不同的类别。根据分类标签,将数据划分为多个子训练集,每个子训练集对应一个类别。例如,如果有三个类别(A、B、C),则可以创建三个子训练集,分别包含属于类别A、B、C的历史健康数据。

S203:根据评价分数确定每个训练子集中的标准健康数据和待优化健康数据,并根据标准健康数据和待优化健康数据进行数据增强,生成多个重构健康数据。

在本实施方式中,在每个训练子集中,存在两种类型的数据,一种是标准健康数据,另一种是待优化健康数据。标准健康数据可以是已知的、高质量的数据,而待优化健康数据可以是需要改进或优化的数据。针对标准健康数据和待优化健康数据,进行一系列的数据增强操作。最终目标是通过对标准健康数据和待优化健康数据进行数据增强,生成多个经过改进或优化的新数据,即重构健康数据。

而生成多个重构健康数据,包括:

S2031:确定目标重构维度,其中,目标重构维度至少包括:时序维度、数值维度、文本维度以及图像维度中的一种;

S2032:基于目标重构维度,以标准健康数据为重构目标,对待优化健康数据进行重构,生成多个重构健康数据。

在S2031至S2032的实施方式中,首先,要确定目标重构的维度,这其中包括了时序维度、数值维度、文本维度以及图像维度。这些维度是相互独立的,每一个都可以单独使用或者结合使用,以适应不同的应用场景和需求。

时序维度,其主要关注的是数据的时间顺序和变化。例如,在运动健康领域,可能需要追踪用户的病情发展,或者研究某种疾病的发病率随时间的变化。数值维度,则更侧重于量化的数据,例如用户的血压、血糖等生理指标。文本维度,主要处理的是文本类型的数据,比如医生的诊断报告、用户的自述等。而图像维度,则是对健康影像等图像数据进行处理和分析。在确定的目标重构维度之后,将以标准健康数据作为重构的目标。

而具体的实施方式包括:将标准健康数据映射为第一向量,将待优化健康数据映射为第二向量;

基于目标重构维度确定第二向量相当于第一向量的调整位置;

基于调整位置的随机变量,生成多个第三向量;

基于多个第三向量,生成多个重构健康数据。

在本实施方式中,为了实现健康数据的优化,首先需要将标准健康数据和待优化健康数据进行向量映射。具体来说,将标准健康数据映射为第一向量,这个向量包含了各种健康数据的标准值;然后将待优化健康数据映射为第二向量,这个向量包含了需要优化的健康数据。

接下来,基于目标重构维度来确定第二向量相对于第一向量的调整位置。这个目标重构维度是指希望达到的健康数据标准,它为提供了一个目标和方向。通过确定第二向量相对于第一向量的调整位置,可以明确哪些健康数据需要调整,以及调整的幅度和方向。

然后,基于这个调整位置的随机变量,生成多个第三向量。这些第三向量可以看作是第二向量在调整位置上的变化,它们代表了不同的健康数据优化方案。通过生成多个第三向量,可以得到多个重构健康数据。

这一步的实施方式是多样的,具体的重构方法取决于目标重构的维度和具体的应用场景。例如,如果关注的是时序维度,可能会对连续的生理数据进行分段分析,或者对时间序列数据进行预测分析。如果数值维度是关注的重点,可能会进行数据的归一化处理,或者对异常值进行处理。如果是文本维度,可能会进行文本的分类或者情感分析。如果是图像维度,可能会进行图像的分割、识别或者对比分析。

总之,S2031至S2032的实施方式是灵活多样的,具体的选择取决于的需求和应用场景。通过这种方式,可以有效地从多维度对健康数据进行处理和分析,从而更好地支持健康管理和决策。

S204:确定每个重构健康数据的评价分数和模版匹配度,并根据重构健康数据的评价分数、模版匹配度以及待优化健康数据的评价分数,对待优化健康数据进行更新。

在本实施方式中,为了确保重构健康数据的准确性和可靠性,首先需要确定每个重构健康数据的评价分数和模版匹配度。模板匹配度表示重构健康数据与标准健康数据模板的相似程度,可以通过以下步骤来确定:

制定一个标准的健康数据模板,该模板反映了理想的健康状态。这可以是一个统计上的平均值,也可以是专业医学标准。通过适当的相似性指标(如余弦相似度、欧氏距离等),计算重构健康数据与标准健康数据模板之间的匹配度。这可以衡量生成的健康数据在整体模式上与理想状态的接近程度。设定匹配度阈值,以确定何为良好匹配、一般匹配或不足匹配。这可以基于实际健康数据的统计特征和模板的制定标准。如果健康数据有多个维度,如时间序列数据,可以在多个维度上分别计算匹配度,以获得更全面的匹配信息。

根据重构健康数据的评价分数与待优化健康数据的评价分数的大小关系,对待优化健康数据进行更新。如果重构健康数据的评价分数高于待优化健康数据的评价分数,说明当前的重构方案可以有效提升数据质量,将继续沿用该方案进行优化。反之,如果重构健康数据的评价分数低于待优化健康数据的评价分数,说明重构方案需要改进或重新选择,将重新审视重构方案,并根据实际情况进行调整和优化。

提到了对待优化健康数据进行更新的原因是基于重构健康数据的评价分数与待优化健康数据的评价分数的大小关系。

这里的目标是通过优化算法来改进待优化健康数据,使其更接近标准健康数据。评价分数可以用来度量待优化健康数据与标准健康数据之间的相似度或者差异程度。如果重构健康数据的评价分数比待优化健康数据的评价分数小(或者更好),那么说明重构数据更接近标准数据,因此希望更新待优化健康数据,将其调整为更接近重构数据的状态。

通过对待优化健康数据进行更新,可以逐步优化它的数值,使其在优化过程中逐渐接近标准健康数据,从而达到更好的匹配效果。更新的方式可以根据具体的优化算法而定,可能涉及到调整向量的某些维度或者权重等。

在实施过程中,会密切关注每个步骤的效果和影响,确保整个过程的连贯性和有效性。还会积极收集用户反馈和意见,以便更好地满足他们的需求和期望。通过不断地迭代和改进,相信可以开发出一套高效、可靠的健康数据优化系统,为用户提供更加优质、个性化的服务。

S205:基于更新后的待优化健康数据,继续执行根据标准健康数据和待优化健康数据进行数据增强的步骤。

在实施过程中,为了增加数据样本的多样性,提高训练模型的泛化能力和准确性,从而获得更好的预测结果。通过根据标准健康数据和待优化健康数据进行数据增强,可以利用已有的数据样本,通过各种方法生成更多的数据,并且保证生成的数据样本具有一定的多样性和代表性。这样就可以充分利用有限的历史健康数据,提高数据利用率,并且在数据量有限的情况下,提高模型的泛化能力和准确性。

在一种可行的实施方式中,方法还包括:

在重构健康数据的评价分数大于标准健康数据的评价分数的情况下,将重构健康数据确定为目标健康数据。

在本实施方式中,在重构健康数据的评价分数大于标准健康数据的评价分数的情况下,将重构健康数据确定为目标健康数据,从而退出迭代的条件。

在一种可行的实施方式中,在将重构健康数据确定为目标健康数据之后,方法还包括:

任意组合每个子训练集的目标健康数据,以获得至少一组用于训练神经网络的健康训练数据。

在本实施方式中,在将重构健康数据确定为目标健康数据之后,任意组合每个子训练集的目标健康数据,是为了增加训练模型的数据样本多样性和代表性。通过将不同子训练集的目标健康数据进行组合,可以获得更多的训练数据,提高数据利用率,同时也可以保证训练数据的多样性和代表性,从而提高训练模型的泛化能力和准确性。

具体来说,在实施过程中,可以将不同子训练集的目标健康数据按照一定的比例进行组合,以获得至少一组用于训练神经网络的健康训练数据。这样可以充分利用已有的健康数据,从而减少数据收集和处理的工作量,并且可以避免数据重复和冗余,提高数据利用效率。

此外,通过任意组合每个子训练集的目标健康数据,还可以降低数据抽样误差和噪声的影响,从而进一步优化训练模型,提高预测结果的准确性和可靠性。

在获得精度较高的评估模型之后,可以基于该评估模型给用户提供健身训练计划。利用获得精度较高的评估模型,结合用户提供的信息,进行个性化评估。模型可以根据用户的身体状况、目标和过去的健康记录,预测他们的运动能力、适应性和潜在的健康风险。

基于个性化评估的结果,生成适合用户的健身计划,包括建议的运动类型、强度、频率和持续时间。此过程涵盖有氧运动、力量训练、柔韧性训练等多个方面,确保全面满足用户的健康需求。根据用户的目标和身体状况,结合获得高精度的模型对用户的代谢和能量需求的预测,制定个性化的饮食建议,包括饮食结构、膳食营养成分的推荐等。

通过仅需用户的基本信息、目标和约束,用户可以利用精细调校过的高精度评估模型,从而快速了解用户的身体状况和运动能力。这个模型能够在仅有的信息基础上,对用户进行全面的健康评估,包括代谢状况、适应性、潜在风险等多个方面。

通过这一全面的评估,用户能够为用户制定出高度个性化的健身计划,包括推荐的运动类型、强度、频率和持续时间。这个计划的制定不仅仅依赖于用户提供的信息,更依靠了模型对大量匿名用户数据的学习和总结。因此,即使用户提供的信息有限,模型也能通过对庞大的健康数据集的分析,为用户生成更准确、科学的计划。

本发明实施例还提供了一种基于监督学习的神经网络的健康训练数据生成装置,参照图3,示出了本发明一种基于监督学习的神经网络的健康训练数据生成装置的功能模块图,该装置可以包括以下模块:

获取模块301,用于获取历史健康数据,并确定历史健康数据的分类标签和评价分数,其中,分类标签用于表征历史健康数据的属性特征,评价分数用于表征历史健康数据的优劣程度;

划分模块302,用于根据分类标签将历史健康数据分为多个子训练集;

重构模块303,用于根据评价分数确定每个训练子集中的标准健康数据和待优化健康数据,并根据标准健康数据和待优化健康数据进行数据增强,生成多个重构健康数据,其中,标准健康数据的评价分数大于待优化健康数据的评价分数;

更新模块304,用于确定每个重构健康数据的评价分数,并根据重构健康数据的评价分数与待优化健康数据的评价分数的大小关系,对待优化健康数据进行更新;

迭代模块305,用于基于更新后的待优化健康数据,继续执行根据标准健康数据和待优化健康数据进行数据增强的步骤。

在一种可行的实施方式中,获取模块,包括:

第一输入子模块,用于将历史健康数据输入第一模型,以获得历史健康数据的分类标签;

第二输入子模块,用于将历史健康数据输入第二模型,以获得历史健康数据的评价分数,其中,第一模型为分类模型,第二模型为评价模型。

在一种可行的实施方式中,第二输入子模块包括:

获取单元,用于获取历史健康数据的特征序列以及历史健康数据的评价标准;

评价单元,用于根据特征序列与评价标准的匹配度,计算历史健康数据的评价分数。

可选地,重构模块,包括:

目标维度确定子模块,用于确定目标重构维度,其中,目标重构维度至少包括:时序维度、数值维度、文本维度以及图像维度中的一种;

重构子模块,用于基于目标重构维度,以标准健康数据为重构目标,对待优化健康数据进行重构,生成多个重构健康数据。

在一种可行的实施方式中,重构子模块,包括:

第一映射单元,用于将标准健康数据映射为第一向量,将待优化健康数据映射为第二向量;

第二映射单元,用于基于目标重构维度确定第二向量相当于第一向量的调整位置;

生成单元,用于基于调整位置的随机变量,生成多个第三向量;

重构单元,用于基于多个第三向量,生成多个重构健康数据。

在一种可行的实施方式中,装置还包括更新模块,用于在重构健康数据的评价分数大于标准健康数据的评价分数的情况下,将重构健康数据确定为目标健康数据。

在一种可行的实施方式中,装置还包括组合模块,用于任意组合每个子训练集的目标健康数据,以获得至少一组用于训练神经网络的健康训练数据。

需要说明的是,本申请实施例的基于监督学习的神经网络的健康训练数据生成装置300的具体实施方式参照前述本申请实施例第一方面提出的基于监督学习的神经网络的健康训练数据生成方法的具体实施方式,在此不再赘述。

基于同一发明构思,本发明另一实施例提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现本发明的基于监督学习的神经网络的健康训练数据生成方法。

上述终端提到的通信总线可以是外设部件互联标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述终端与其他设备之间的通信。存储器可以包括随机存取存储器(Random AccessMemory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

此外,为实现上述目的,本申请的实施例还提出了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现本申请实施例的基于监督学习的神经网络的健康训练数据生成方法。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用车辆(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。“”和/或“”表示可以选择两者之中的任意一个,也可以两者都选择。而且,术语“”包括“”“”包含“”或者其任何其他变体意在涵盖非排他性地包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“”包括一个……“”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对所提供的一种基于监督学习的神经网络的健康训练数据生成方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的基于监督学习的神经网络的健康训练数据生成方法及装置的核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

相关技术
  • 基于神经网络的歌词生成方法、装置、设备和存储介质
  • 基于神经网络的音乐生成方法及装置
  • 生成用于监督学习的训练数据以训练神经网络的方法
  • 生成训练神经网络的训练数据的方法、训练神经网络的方法和利用神经网络进行自主操作的方法
技术分类

06120116586468