掌桥专利:专业的专利平台
掌桥专利
首页

样本数据的生成方法、装置、设备和存储介质

文献发布时间:2023-06-19 11:29:13


样本数据的生成方法、装置、设备和存储介质

技术领域

本申请涉及人工智能技术领域,特别涉及一种样本数据的生成方法、装置、设备和存储介质。

背景技术

随着人工智能自然语言处理的发展,特别是在智能问诊领域,预训练语言模型被越来越多的应用,以实现人工智能自然语言处理。

但是采用预训练语言模型实现人工智能自然语言处理的过程中,通常需要通过大规模的人工标记数据对预训练语言模型进行训练,需要耗费大量的人力物力。同时,由于不同的人对同一自然语言有不同的理解,所以会导致不同的人对同一个问题的标注不同,导致标注的样本数据不准确,进而导致预训练语言模型不准确。

如何提高预训练语言模型的样本数据的丰富性,是人工智能自然语言处理领域亟待解决的问题。

发明内容

本申请提供一种样本数据的生成方法、装置、系统、设备和存储介质,能够提高预训练语言模型的样本数据的丰富性。

第一方面,本申请实施例提供一种样本数据的生成方法,该方法包括:

获取包含命名实体的病历语句;

在预设语料库中查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料;

根据多个目标语料和预设的问句模板,生成预训练语言模型的样本数据。

在一个实施例中,上述在预设语料库中查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料,包括:

在预设语料库中查找包括命名实体的候选语句;

获取候选语句与病历语句的相似度值;

将与病历语句的相似度值小于预设阈值的多个候选语句作为多个目标语料。

在一个实施例中,上述获取候选语句与病历语句的相似度值,包括:

去除病历语句所在的病历中的候选语句,得到目标候选语句;

将目标候选语句和病历语句输入向量转换模型,得到目标候选语句对应的候选向量以及病历语句对应的语句向量;

计算候选向量与语句向量之间的余弦值,得到目标候选语句与病历语句的相似度值。

在一个实施例中,上述将与病历语句的相似度值小于预设阈值的多个候选语料作为多个目标语料,包括:

将与病历语句的相似度值小于预设阈值的目标候选语句按照相似度值从大到小的顺序排序,得到各目标候选语句的序号;

将序号小于N的各目标候选语句作为多个目标语料,N为正整数。

在一个实施例中,上述预设的问句模板包括目标疑问词,上述根据目标语料和预设的问句模板,生成预训练语言模型的样本数据,包括:

采用目标疑问词替换目标语料中的命名实体,得到预训练语言模型的样本数据。

在一个实施例中,上述采用目标疑问词替换目标语料中的命名实体,得到预训练语言模型的样本数据,包括:

采用目标疑问词替换目标语料中的命名实体,并将目标语料中在命名实体之后的语句片段设置在目标疑问词之后,将目标语料中在命名实体之前的语句片段设置在命名实体之后的语句片段之后,得到预训练语言模型的样本数据。

在一个实施例中,上述根据目标语料和预设的问句模板,生成预训练语言模型的样本数据之前,该方法还包括:

按照命名实体与疑问词之间的预设的对应关系,确定病历语句中的命名实体对应的疑问词;

将病历语句中的命名实体对应的疑问词作为预设的问句模板中的目标疑问词。

第二方面,一种样本数据的生成装置,该装置包括:

获取模块,用于获取包含命名实体的病历语句;

查找模块,用于在预设语料库中查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料;

生成模块,用于根据多个目标语料和预设的问句模板,生成预训练语言模型的样本数据。

第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的方法的步骤。

第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。

上述样本数据的生成方法、装置、设备和存储介质,获取包含命名实体的病历语句,并在预设语料库中查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料,进而根据多个目标语料和预设的问句模板,生成预训练语言模型的样本数据。本申请中,所生成的预训练语言模型的样本数据是根据多个目标语料和问句模板自动生成的,而不是根据一个目标语料生成的,大大提高了所生成的样本数据的丰富性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一个实施例中样本数据的生成系统的示意图;

图2为本申请一个实施例中样本数据的生成方法的流程示意图;

图3为本申请另一个实施例中样本数据的生成方法的流程示意图;

图4为本申请另一个实施例中样本数据的生成方法的流程示意图

图5为本申请另一个实施例中样本数据的生成方法的流程示意图

图6为本申请另一个实施例中样本数据的生成方法的流程示意图

图7为本申请一个实施例中提供的样本数据的生成装置的结构示意图;

图8为本申请一个实施例中电子设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

可以理解,本申请实施例中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

本实施例所提供的样本数据的生成方法,可以适用于如图1所示的应用环境中。其中,电子设备100可以生成预训练语言模型的样本数据110。电子设备100可以但不限于为智能手机、平板电脑、笔记本电脑、台式电脑或个人数字助理等具有数据处理功能的电子设备,本实施例对电子设备100的具体形式不做限定。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。

需要说明的是,下述方法实施例的执行主体也可以是样本数据的生成装置,该装置可以通过软件、硬件或者软硬件结合的方式实现成为上述电子设备的部分或者全部。下述方法实施例以执行主体为电子设备为例进行说明。

图2为本申请一个实施例提供的样本数据的生成方法的流程示意图。本实施例涉及的是如何预训练语言模型的样本数据的丰富性的具体过程。如图2所示,该方法包括以下步骤:

S101、获取包含命名实体的病历语句。

命名实体可以是指人名、机构名、地名以及其他所有以名称为标识的实体。进一步地,命名实体还可以包括数字、日期、货币、地址等等。可以通过命名实体识别技术获取目标段落中的命名实体,命名实体识别是指在文档集合中识别出特定类型的事物名称或符号的过程。通常可以通过以下步骤实现命名实体识别:识别出文本中的命名实体;确定该实体的类型;对于多个实体表示同一事物时,选择其中的一个实体作为该组实体的代表。病历语句可以是指病历中的一句话,例如,医疗语料库中的一个病历,该病历具体包括:患者3月前因“直肠癌”于我院行全麻上行直肠癌根治术,术后给予抗感染及营养支持治疗,切口愈合良好。术后病理示直肠腺癌(中低度分化),浸润溃疡型,面积3.5*2cm,侵达外模。病历语句可以是上述病历中包括命名实体的语句。若命名实体为“直肠癌”,对应的,病历语句可以是包括“直肠癌”的语句,即“患者3月前因“直肠癌”于我院行全麻上行直肠癌根治术,术后给予抗感染及营养支持治疗,切口愈合良好”。

需要说明的是,病历语句中的命名实体可以不止一个。例如,若病历语句为“患者3月前因“直肠癌”于我院经腹腔镜行全麻上行直肠癌根治术,术后给予抗感染及营养支持治疗,切口愈合良好”。其中“直肠癌”可以作为第一个命名实体,同时,“腹腔镜”可以作为第二个命名实体。需要说明的是,本申请对命名实体的数量不做限制。

S102、在预设语料库中查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料。

预设语料库可以是医疗语料库,目标语料可以是指在预设语料库中包含上述命名实体,且与病历语句的相似度满足预设范围的语料。通常在预设的语料库中查找目标语料时,是从整个预设语料库中查找的,因此,在预设语料库中检索得到的目标语料通常是多个。需要说明的是,本申请实施例还可以应用在保险对话领域,对应的,预设语料库也可以是保险对话语料库,S101“获取包含命名实体的病历语句”中的病历语句也可以是指保险语句。

在预设语料库中检索得到包括命名实体的语句时,可以将与病历语句的相似度值满足预设范围的语句作为目标语料。在一种可能的情况下,在将与病历语句的相似度值满足预设范围的语句作为目标语料之前,还可以先将病历语句所在病历中的语句去除掉,在预设语料库中除病历语句所在病历之外检索多个目标语料,本申请实施例对此不作限制。

由上述实施例可知,命名实体可以一个,也可以是多个,对应的,在根据病历语句在预设语料库中进行检索,得到多个目标语料时,若命名实体的数量为多个,例如,命名实体包括“直肠癌”和“腹腔镜”,“直肠癌”相匹配的目标语料为m个,待检索的命名实体“腹腔镜”相匹配的目标语料为n个,则得到的目标语料为m+n个。

S103、根据多个目标语料和问句模板,生成预训练语言模型的样本数据。

预训练语言模型可以是根据输入的问句,得到对应的答案的模型。其可以应用到智能导诊领域,也可以应用到保险问答领域,本申请实施例对此不做限制。在得到多个目标语料之后,可以根据问句模板调整目标语料的语序和目标语料中的词语,得到预训练语言模型的样本数据。

上述样本数据的生成方法,获取包含命名实体的病历语句,并在预设语料库中查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料,进而根据多个目标语料和预设的问句模板,生成预训练语言模型的样本数据。本申请中,所生成的预训练语言模型的样本数据是根据多个目标语料和问句模板自动生成的,而不是根据一个目标语料生成的,大大提高了所生成的样本数据的丰富性。

图3为本申请另一个实施例提供的样本数据的生成方法的流程示意图。本实施例涉及的是如何查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料的具体过程。如图3所示,上述S102“在预设语料库中查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料”一种可能的实现方法包括以下步骤:

S201、在预设语料库中查找包括命名实体的候选语句。

其中,候选语句为预设语料库中包括命名实体的语句,其可以病历语句所在病历中的语句,也可以不是病历语句所在病历中的语句,本申请实施例对此不作限制。在预设语料库中查找包括命名实体的候选语句时,可以采用弹性搜索引擎在预设语料库中进行检索。

S202、获取候选语句与病历语句的相似度值。

相似度值可以用来比较两个句子的相似性。一般通过计算句子的特征之间的距离,如果距离小,那么相似度大;如果距离大,那么相似度小。再具体的获取候选语句和病历语句的相似度值时,可以采用图4所示实施例来详细描述。如图4所示,上述S202“获取候选语句与病历语句的相似度值”一种可能的实现方法包括以下步骤:

S301、去除病历语句所在的病历中的候选语句,得到目标候选语句。

将病历语句所在病历中的候选语句去除,可以得到预设语料库中除病历语句所在病历之外其他候选语句,作为目标候选语句。例如,预设语料库是医疗语料库,病历语句所在的病历为“患者3月前因“直肠癌”于我院行全麻上行直肠癌根治术,术后给予抗感染及营养支持治疗,切口愈合良好。术后病理示直肠癌(中低度分化),浸润溃疡型,面积3.5*2cm,侵达外模”,其中,病历语句是“患者3月前因“直肠癌”于我院行全麻上行直肠癌根治术,术后给予抗感染及营养支持治疗,切口愈合良好”,对应的,在检索预设语料库得到的候选语句为“术后病理示直肠癌(中低度分化),浸润溃疡型,面积3.5*2cm,侵达外模”,虽然目标语句在目标段落中的上下文语句“术后病理示直肠癌(中低度分化),浸润溃疡型,面积3.5*2cm,侵达外模”,其中包括有待检索的命名实体“直肠癌”,在获取候选语句和病历语句的相似度值之前,先要去除病历语句所在的病历中的候选语句“术后病理示直肠癌(中低度分化),浸润溃疡型,面积3.5*2cm,侵达外模”。

S302、将目标候选语句和病历语句输入向量转换模型,得到目标候选语句对应的候选向量以及病历语句对应的语句向量。

向量转换模型可以获取语句的向量值,其可以是TF-IDF模型,也可以是其他模型,本申请实施例对此不作限制。向量转换模型可以通过提取语句的特征值得到该语句的向量。将目标候选语句输入该向量转换模型,得到目标候选语句对应的候选向量。将病历语句输出该向量转换模型,得到病历语句对应的语句向量。

S303、计算候选向量与语句向量之间的余弦值,得到目标候选语句与病历语句的相似度值。

在上述实施例的基础上,得到了候选向量与语句向量。可以计算候选向量与语句向量之间的余弦值,并将计算得到的余弦值作为目标候选语句和病历语句的相似度值。通常余弦值越趋于1,表示两个向量的相似度越高。余弦相似度与向量的幅值无关,只与向量的方向相关。

S203、将与病历语句的相似度值小于预设阈值的多个候选语句作为多个目标语料。

在获取了各目标候选语句和病历语句的相似度值之后,可以将与病历语句的相似度值小于预设阈值目标候选语句作为目标语料。例如,预设阈值可以是95%,在获取了各目标候选语句和病历语句的相似度值之后,将相似度值小于95%的多个目标候选语句作为多个目标语料。在一种可能的情况下,还可以通过图5所示实施例来确定多个目标语料。可选的,如图5所示,上述S203“将与病历语句的相似度值小于预设阈值的多个候选语句作为多个目标语料”一种可能的实现方法包括以下步骤:

S401、将与病历语句的相似度值小于预设阈值的目标候选语句按照相似度值从大到小的顺序排序,得到各目标候选语句的序号。

有上述实施例可知,相似度值为两个向量之间的余弦值,也即是一个具体的数值,因此,可以将与病历语句的相似度小于预设阈值的各目标候选语句,按照其与病历语句之间的相似度值从大到小的顺序排序,得到各目标候选语句对应的序号。

S402、将序号小于N的各目标候选语句作为多个目标语料,N为正整数。

在得到各目标候选语句的序号之后,可以将序号小于N的各目标候选语句作为多个目标语料。例如,将相似度值小于95%的语料按照从大向小的顺序排列,将序号小于20的各目标候选语句作为目标语料、也即是说,可以从预设语料库中选取与目标问句的相似度小于95%的前20个候选语料。

上述样本数据的生成方法,在预设语料库中查找包括命名实体的候选语句,并获取候选语句与病历语句的相似度值,进而将与病历语句的相似度值小于预设阈值的多个候选语句作为多个目标语料,使得目标语料为与病历语句具备一定相似度且不完全一直的语料,进而使得根据多个目标语料生成的样本数据更加丰富、准确,进而使得根据样本数据训练得到的预训练语言模型更加准确、

在一个实施例中,上述预设的问句模板包括目标疑问词,可选的,上述S103“根据目标语料和预设的问句模板,生成预训练语言模型的样本数据”一种可能的实现方法包括:采用目标疑问词替换目标语料中的命名实体,得到预训练语言模型的样本数据。

其中,目标疑问词可以是什么病、谁、哪个部位等疑问词,将目标语料中的命名实体替换成目标疑问词,可以得到一个问句,即为预训练语言模型的样本数据。

例如,目标语料为“患者三个月前于我院诊断为直肠癌,于2019年10月26日在全麻上行腹腔镜直肠癌根治术”,将其中的命名实体“直肠癌”替换为目标疑问词,得到预训练语言模型的样本数据为“什么病于2019年10月26日在全麻上行腹腔镜直肠癌根治术,患者三个月前于我院诊断”。

在将目标语料中的命名实体替换为目标疑问词时,可以基于二元图(Bi-gram)与命名实体相关联的先验概率,对二元图进行采样得到的,该先验概率是基于命名实体和问题二元模型从预设的数据集中计算的得到的。例如,在生成预训练医疗语言模型的样本数据时,可以通过命名实体和问题二元模型从CCKS医疗数据集中计算的与命名实体相关联的先验概率。需要说明的是,目标疑问词的选择并不影响得到的预训练语言模型的样本数据的准确性。

上述样本数据的生成方法,采用目标疑问词替换目标语料中的命名实体,得到预训练语言模型的样本数据,使得预训练语言模型的样本数据是自动的将各目标语料中的命名实体替换为目标疑问词得到的,提高了获取样本数据的便捷性。

在一个实施例中,在采用目标疑问词替换目标语料中的命名实体,得到预训练语言模型的样本数据时,可以将目标语料中的各语句片段的语序调整,得到预训练语言模型的样本数据。可选的,采用目标疑问词替换目标语料中的命名实体,并将目标语料中在命名实体之后的语句片段设置在目标疑问词之后,将目标语料中在命名实体之前的语句片段设置在命名实体之后的语句片段之后,得到预训练语言模型的样本数据。

在生成预训练语言模型的样本数据时,除了要采用目标疑问词替换目标语料中的命名实体,同时还需要将目标语料中在命名实体之后的语句片段设置在目标疑问词之后,将目标语料中在命名实体之前的语句片段设置在目标疑问词之后,得到预训练语言模型的样本数据。例如,目标语料为“患者三个月前于我院诊断为直肠癌,于2019年10月26日在全麻上行腹腔镜直肠癌根治术”其中,“直肠癌”为命名实体,目标疑问词为“什么病”,将目标语料中“直肠癌”之前的语句片段“患者三个月前于我院诊断为”设置在“什么病”之后,将目标语料中命名实体之后的语句片段“于2019年10月26日在全麻上行腹腔镜直肠癌根治术”设置在“什么病”之前,得到预训练语言模型的样本数据“什么病于2019年10月26日在全麻上行腹腔镜直肠癌根治术,患者三个月前于我院诊断为”。

上述样本数据的生成方法,采用目标疑问词替换目标语料中的命名实体,并将目标语料中在命名实体之后的语句片段设置在目标疑问词之后,将目标语料中在命名实体之前的语句片段设置在命名实体之后的语句片段之后,得到预训练语言模型的样本数据,所生成的样本数据的语序是与目标语料的语序不同的,也即是从语序上提高了所生成的样本数据的多样性,进而使得根据多样性的样本数据对预训练语言模型进行训练,得到的对预训练语言模型的准确度更高。

图6为本申请另一个实施例提供的样本数据的生成方法的流程示意图。本实施例涉及的是如何生成预设的问句模板的具体过程。如图6所示,上述S103“根据多个目标语料和预设的问句模板,生成预训练语言模型的样本数据”之前,该方法还包括以下步骤:

S501、按照命名实体与疑问词之间的预设的对应关系,确定病历语句中的命名实体对应的疑问词。

其中,命名实体与疑问词之间的预设的对应关系可以是一一对应的,也可以是多个命名实体对应一个疑问词,本申请实施例对此不作限制。可以根据上述预设的对应关系,确定病历语句中命名实体对应的疑问词。例如病历语句中的命名实体“直肠癌”对应的疑问词为“什么病”,病历语句中的命名实体“骨科医生”对应的疑问词为“谁”。

S502、将病历语句中的命名实体对应的疑问词作为预设的问句模板中的目标疑问词。

上述样本数据的生成方法,按照命名实体与疑问词之间的预设的对应关系,确定病历语句中的命名实体对应的疑问词,将病历语句中的命名实体对应的疑问词作为预设的问句模板中的目标疑问词,使得目标疑问词是与命名实体相互管理的疑问词,能够更加准确的替换命名实体,进一步地提高了采用目标疑问词替换命名实体生成的样本数据的准确度。

表1为生成预训练语言模型的样本数据的过程中使用的语料信息。如表1所示,在医疗语料库中获取一个完整的病历“患者3月前因“直肠癌”于我院行全麻上行直肠癌根治术,术后给予抗感染及营养支持治疗,切口愈合良好。术后病理示直肠腺癌(中低度分化),浸润溃疡型,面积3.5*2cm,侵达外模”中的目标语句“患者3月前因“直肠癌”于我院行全麻上行直肠癌根治术,术后给予抗感染及营养支持治疗,切口愈合良好。”,根据目标语句在预设语料库中进行检索,得到目标语料“患者3月余前于我院诊断为“直肠癌”,于2019-10-26在全麻上行腹腔镜直肠癌根治术。”,将目标语料中的命名实体“直肠癌”替换为目标疑问词“什么病”,并将目标语料中的命名实体前后的语句片段的语序进行调整,得到生成的样本数据“什么病于2019-10-26在全麻上行腹腔镜直肠癌根治术,患者3月余前于我院诊断?”

表1

应该理解的是,虽然上述实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

图7为本申请一个实施例中样本数据的生成装置的结构示意图,图7所示,该样本数据的生成装置包括:获取模块10、检索模块20和生成模块30,其中:

获取模块10,用于获取包含命名实体的病历语句;

查找模块20,用于在预设语料库中查找包括命名实体且与病历语句的相似度值满足预设范围的多个目标语料;

生成模块30,用于根据多个目标语料和预设的问句模板,生成预训练语言模型的样本数据。

在一个实施例中,查找模块20,包括:查找单元201、获取单元202和确定单元203,其中:

查找单元201,用于在预设语料库中查找包括命名实体的候选语句;

获取单元202,用于获取候选语句与病历语句的相似度值;

确定单元203,用于将与病历语句的相似度值小于预设阈值的多个候选语句作为多个目标语料。

在一个实施例中,上述获取单元202具体用于去除病历语句所在的病历中的候选语句,得到目标候选语句;将目标候选语句和病历语句输入向量转换模型,得到目标候选语句对应的候选向量以及病历语句对应的语句向量;计算候选向量与语句向量之间的余弦值,得到目标候选语句与病历语句的相似度值。

在一个实施例中,上述获取单元202具体用于将与病历语句的相似度值小于预设阈值的目标候选语句按照相似度值从大到小的顺序排序,得到各目标候选语句的序号;将序号小于N的各目标候选语句作为多个目标语料,N为正整数。

在一个实施例中,上述预设的问句模板包括目标疑问词,上述生成模块30具体用于采用目标疑问词替换目标语料中的命名实体,得到预训练语言模型的样本数据。

在一个实施例中,上述生成模块30具体用于采用目标疑问词替换目标语料中的命名实体,并将目标语料中在命名实体之后的语句片段设置在目标疑问词之后,将目标语料中在命名实体之前的语句片段设置在命名实体之后的语句片段之后,得到预训练语言模型的样本数据。

该样本数据的生成装置还包括:设置模块40,其中:

设置模块40具体用于按照命名实体与疑问词之间的预设的对应关系,确定病历语句中的命名实体对应的疑问词;将病历语句中的命名实体对应的疑问词作为预设的问句模板中的目标疑问词。

本申请实施例提供的样本数据的生成装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。

关于一种样本数据的生成装置的具体限定可以参见上文中对样本数据的生成方法的限定,在此不再赘述。上述样本数据的生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种电子设备,其内部结构图可以如图8所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种样本数据的生成方法。

本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

应当清楚的是,本申请实施例中处理器执行计算机程序的过程,与上述方法中各个步骤的执行过程一致,具体可参见上文中的描述。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时可以实现本申请上述方法实施例提供的样本数据的生成方法。

应当清楚的是,本申请实施例中处理器执行计算机程序的过程,与上述方法中各个步骤的执行过程一致,具体可参见上文中的描述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 样本数据生成装置、样本数据生成方法和样本数据生成程序
  • 样本数据生成方法、装置、计算机设备及存储介质
技术分类

06120112940259