导航：首页> 计算；推算；计数>数据收集系统、数据收集方法及数据收集装置

数据收集系统、数据收集方法及数据收集装置

文献发布时间：2023-06-19 19:28:50

技术领域

本公开涉及数据收集系统、数据收集方法及数据收集装置。

背景技术

提出了在智能城市中，从其社区内的多个主体收集数据。特别是，在专利文献1中，由于从不同的事业主体的信息系统得到的数据存在不确定性，所以为了消除这样的不确定性，提出了收集对得到的数据进行校正后的数据。

现有技术文献

专利文献

专利文献1：日本特开2013－069084号公报

发明内容

发明所要解决的课题

然而，在智能城市等中，在位于智能城市内的各种数据取得装置(例如，监视照相机、智能城市内的人的移动终端等)中取得各种数据。此外，能够与这些数据取得装置进行通信的服务器基于所取得的数据来进行与机器学习模型相关的各种处理(机器学习模型的使用或学习)。

为了进行这样的与机器学习模型相关的各种处理，服务器需要从数据取得装置接收数据。但是，如果由数据取得装置取得的数据全部被发送到服务器并存储于服务器的存储装置，则会在存储装置存储大量的数据，因此需要存储容量非常大的存储装置。

鉴于上述课题，本公开的目的在于从数据取得装置效率地收集数据。

用于解决课题的技术方案

本公开的要点如下。

(1)一种数据收集系统，从数据取得装置向数据收集装置收集进行向多个类别的分类的机器学习模型的学习所需的数据，其中，所述数据收集系统具有：

发生概率确定部，按由所述数据取得装置取得了数据时的每个条件，确定由所述机器学习模型分类的所有类别中的与其他类别相比发生概率相对较低的低发生类别的发生概率；

目标发送量设定部，按每个所述条件设定从所述数据取得装置向所述数据收集装置的每单位时间的目标发送量；

条件确定部，确定由所述数据取得装置取得数据的当前的条件；及

发送控制部，按照与所确定的所述当前的条件对应的目标发送量，使数据从所述数据取得装置发送到所述数据收集装置，

所述目标发送量设定部将所述目标发送量设定为，在所述低发生类别的发生概率相对较高的条件下，与所述低发生类别的发生概率相对较低的条件相比，从所述数据取得装置向所述数据收集装置的每单位时间的数据发送量变多。

(2)根据上述(1)所述的数据收集系统，其中，

所述目标发送量设定部将每单位时间的目标发送量设定为，所述低发生类别的发生概率越高，则从所述数据取得装置向所述数据收集装置的每单位时间的数据发送量越多。

(3)根据上述(1)或(2)所述的数据收集系统，其中，

所述数据收集系统收集输入参数至少部分地不同的多个机器学习模型的学习所需的数据，

所述目标发送量设定部将所述每单位时间的目标发送量设定为，对于所述机器学习模型中的与人类的健康相关的机器学习模型，与不与人类的健康相关的机器学习模型相比，针对低发生类别的发生概率相同的条件，所述每单位时间的目标发送量变多。

(4)根据上述(1)至(3)中任一个所述的数据收集系统，其中，

所述数据收集系统还具备类别确定部，该类别确定部确定由所述机器学习模型分类的所有类别中的与其他类别相比发生概率相对较低的低发生类别。

(5)根据上述(1)至(4)中任一个所述的数据收集系统，其中，

所述数据收集装置具有所述发生概率确定部和所述目标发送量设定部，所述数据取得装置具有所述条件确定部和所述发送控制部。

(6)一种数据收集方法，从数据取得装置向数据收集装置收集进行向多个类别的分类的机器学习模型的学习所需的数据，其中，该数据收集方法包括如下步骤：

按由所述数据取得装置取得了数据时的每个条件，确定由所述机器学习模型分类的所有类别中的与其他类别相比发生概率相对较低的低发生类别的发生概率；

按每个所述条件将从所述数据取得装置向所述数据收集装置的每单位时间的目标发送量设定为，在所述低发生类别的发生概率相对较高的条件下，与所述低发生类别的发生概率相对较低的条件相比，从所述数据取得装置向所述数据收集装置的每单位时间的数据发送量变多；

确定由所述数据取得装置取得数据的当前的条件；及

按照与所确定的所述当前的条件对应的目标发送量，使数据从所述数据取得装置发送到所述数据收集装置。

(7)一种数据收集装置，从数据取得装置收集进行向多个类别的分类的机器学习模型的学习所需的数据，其中，所述数据收集装置具有：

发生概率确定部，按由所述数据取得装置取得了数据时的每个条件，确定由所述机器学习模型分类的所有类别中的与其他类别相比发生概率相对较低的低发生类别的发生概率；及

目标发送量设定部，按每个所述条件设定从所述数据取得装置向所述数据收集装置的每单位时间的目标发送量，

所述目标发送量设定部将所述目标发送量设定为，在所述低发生类别的发生概率相对较高的条件下，与所述低发生类别的发生概率相对较低的条件相比，来自所述数据取得装置的每单位时间的数据发送量变多，

所述目标发送量设定部将由所述目标发送量设定部所设定的每个所述条件的每单位时间的目标发送量发送给所述数据取得装置。

发明效果

根据本公开，能够从数据取得装置效率地收集数据。

附图说明

图1是机器学习系统的概略结构图。

图2是概略地表示终端设备的硬件结构的图。

图3是终端设备的处理器的功能框图。

图4是概略地表示服务器的硬件结构的图。

图5是服务器的处理器的功能框图。

图6是表示各条件下的用户罹患中暑的概率的图。

图7是每个条件的目标发送频度的设定例。

图8是表示机器学习模型的学习处理的流程的序列图。

图9是一个变形例所涉及的服务器的处理器的与图5同样的功能框图。

图10是表示各条件下的产生异常者的概率的图。

图11是每个条件的目标发送频度的设定例。

具体实施方式

以下，参照附图对实施方式进行详细说明。另外，在以下的说明中，对同样的构成要素赋予相同的参照标号。

·第一实施方式

<机器学习系统的结构>

参照图1和图2，对第一实施方式所涉及的机器学习系统1的结构进行说明。图1是机器学习系统1的概略结构图。机器学习系统1使在服务器中使用的机器学习模型进行学习。另外，机器学习系统1还作为收集机器学习模型的使用和学习所需的数据的数据收集系统发挥功能。

如图1所示，机器学习系统1具有多个终端设备10和能够与终端设备10进行通信的服务器20。多个终端设备10的每一个与服务器20构成为能够经由由光通信线路等构成的通信网络4和与通信网络4经由网关(未图示)连接的无线基站5相互通信。作为终端设备10与无线基站5之间的通信，可以使用通信距离长的各种广域无线通信，例如，使用依据3GPP、由IEEE制定的4G、LTE、5G、WiMAX等任意通信标准的通信。

特别是，在本实施方式中，服务器20与位于规定的对象区域内的终端设备10进行通信。对象区域是由预先确定的边界包围的范围，例如是被定义为“在有效利用ICT等新技术的同时，通过经营(规划、维护、管理/运营等)的高度化，进行城市和地区所面临的诸课题的解决，并且持续创造新的价值的可持续的城市和地区”的智能城市。服务器20也可以能够与位于对象区域外的终端设备10进行通信。

终端设备10是取得后述的机器学习模型的使用或学习所需的数据的数据取得装置的一例。特别是，在本实施方式中，终端设备10是分别由个人持有并取得持有终端设备10的人的信息的设备。因此，在本实施方式中，终端设备10作为取得规定的对象区域内的人的信息的移动型数据取得装置发挥功能。因此，在本实施方式中，终端设备10随着持有终端设备10的个人的移动而移动。因此，当持有终端设备10的个人移动到对象区域内时，由该个人持有的终端设备10也移动到对象区域内。相反，当持有终端设备10的个人移动到对象区域外时，由该个人持有的终端设备10也移动到对象区域外。

具体而言，在本实施方式中，终端设备10例如包括钟表型终端(智能手表)、腕带型终端、夹子型终端及眼镜型终端(智能眼镜)等可穿戴终端、及移动终端。这样的终端设备例如包括移动终端、可穿戴终端(智能手表、智能眼镜等)。这样的终端设备例如取得对象区域内的各个人的位置信息、生命体征(体温、心率、血压、呼吸频率)、血氧浓度、血糖值等各人的信息。

另外，在本实施方式中，终端设备10特别包括钟表型终端和通过近距离无线通信与钟表型终端进行通信的移动终端。作为近距离无线通信，例如使用依据由IEEE、ISO、IEC等制定的任意通信标准(例如Bluetooth(注册商标)、ZigBee(注册商标))的通信。

另外，终端设备10也可以包括固定在对象区域内的不能移动的固定型数据取得装置。固定型数据取得装置例如包括监视照相机等取得对象区域内的任意区域的图像或其他信息的设备。

图2是概略地表示终端设备10的硬件结构的图。如图2所示，终端设备10具有通信模块11、传感器12、输入装置13、输出装置14、存储器15和处理器16。通信模块11、传感器12、输入装置13、输出装置14和存储器15经由信号线与处理器16连接。

通信模块11是与其他设备进行通信的通信部的一例。通信模块11例如是用于与服务器20进行通信的设备。特别地，通信模块11是通过上述广域无线通信与无线基站5进行通信的设备，因此，通信模块11经由无线基站5和通信网络4与服务器20进行通信。

传感器12是检测与终端设备10的状况和终端设备10周围的状况相关的各种参数的检测器的一例。特别地，传感器12包括检测不同参数的多个单独的传感器。由传感器12检测出的各种参数的值经由信号线发送到处理器16或存储器15。

具体而言，传感器12包括检测终端设备10的当前位置的GNSS接收机。另外，传感器12包括检测与持有终端设备10的用户相关的参数的传感器。例如，在终端设备10为钟表型终端设备(智能手表)的情况下，传感器12可以包括检测与佩戴着终端设备10的用户的身体状态相关的数据(例如，生命体征(心率、体温、血压和呼吸频率)、血氧浓度、心电图、血糖值、步数、卡路里消耗量、疲劳度、睡眠状态等)的传感器。另外，传感器12也可以包括检测终端设备10周围的环境数据的传感器。例如，终端设备10可以包括对终端设备10周围的图像进行拍摄的传感器、检测终端设备10周围的气温或湿度的传感器。

输入装置13是供终端设备10的用户进行输入的装置。具体而言，输入装置13包括触摸面板、麦克风、按钮、拨号盘等。经由输入装置13输入的信息经由信号线发送到处理器16或存储器15。

输出装置14是供终端设备10进行输出的装置。具体而言，输出装置14包括显示器、扬声器等。输出装置14基于经由信号线从处理器16发送来的指令进行输出。例如，显示器基于来自处理器16的指令使图像显示在画面上，扬声器基于来自处理器16的指令来输出声音。

存储器15例如具有易失性半导体存储器(例如RAM)和非易失性半导体存储器(例如ROM)等。存储器15存储用于在处理器16中执行各种处理的计算机程序、在由处理器16执行各种处理时使用的各种数据等。存储器15例如存储机器学习模型，具体而言，存储机器学习模型的结构和学习参数(例如，后述的权重和偏差等)。

处理器16具有一个或多个CPU(Central Processing Unit：中央处理单元)及其外围电路。处理器16也可以还具有如逻辑运算单元或数值运算单元那样的运算电路。处理器16基于存储在存储器15中的计算机程序来执行各种处理。对于由终端设备10的处理器16执行的具体处理将在后面叙述。

图3是终端设备10的处理器16的功能框图。如图3所示，终端设备10的处理器16具有数据取得部161、模型执行部162、通知部163、条件确定部164、发送控制部165、数据发送部166和模型更新部167。终端设备10的处理器16所具有的这些功能块例如是通过在处理器16上运行的计算机程序实现的功能模块。或者，处理器16所具有的这些功能块也可以是设置于处理器16的专用的运算电路。另外，对于上述各功能块的详细情况将在后面叙述。

服务器20经由通信网络4与多个终端设备10连接。在本实施方式中，服务器20作为使在终端设备10中使用的机器学习模型进行学习的学习装置发挥功能。另外，服务器20还作为从多个终端设备10收集机器学习模型的学习所需的数据的数据收集装置发挥功能。

图4是概略地表示服务器20的硬件结构的图。如图4所示，服务器20具备通信模块21、存储装置22和处理器23。另外，服务器20也可以具有键盘和鼠标这样的输入装置、及显示器和扬声器这样的输出装置。

通信模块21是与服务器20外的设备进行通信的通信装置的一例。通信模块21具备用于将服务器20连接到通信网络4的接口电路。通信模块21构成为能够经由通信网络4和无线基站5与多个终端设备10分别进行通信。

存储装置22是存储数据的存储装置的一例。存储装置22例如具有硬盘驱动器(HDD)、固态驱动器(SSD)或光学记录介质。另外，存储装置22也可以具有易失性半导体存储器(例如RAM)、非易失性半导体存储器(例如ROM)等。存储装置22存储用于由处理器23执行各种处理的计算机程序、及在由处理器23执行各种处理时使用的各种数据。特别地，存储装置22存储从终端设备10接收到的数据和机器学习模型的学习所使用的数据。

处理器23具有一个或多个CPU及其外围电路。处理器23也可以还具有GPU、或者如逻辑运算单元或数值运算单元那样的运算电路。处理器23基于存储在存储装置22中的计算机程序来执行各种处理。对于由服务器20的处理器23执行的具体处理将在后面叙述。

图5是服务器20的处理器23的功能框图。如图5所示，处理器23具有发生概率确定部231、目标发送量设定部232、数据集创建部233、学习部234和模型发送部235。服务器20的处理器23所具有的这些功能块例如是通过在处理器23上运行的计算机程序实现的功能模块。或者，处理器23所具有的这些功能块也可以是设置于处理器23的专用的运算电路。

<机器学习模型>

在本实施方式中，当在终端设备10中进行规定的处理时，使用经机器学习的机器学习模型。在本实施方式中，机器学习模型是基于从终端设备10的传感器12取得的数据进行向多个类别的分类的模型。以下，以基于从终端设备10的传感器12取得的数据来推定持有终端设备10的人是否会罹患中暑(即，对表示会罹患中暑的类别和表示不会罹患中暑的类别进行分类)的机器学习模型为例进行说明。

具体而言，在本实施方式中，持有终端设备10的用户的生命体征、血氧浓度和心电图等与用户的身体状态相关的数据、及终端设备10周围的气温和湿度等环境数据作为输入参数输入到机器学习模型。与持有终端设备10的用户的身体相关的数据和环境数据从终端设备10的传感器12取得。或者，环境数据也可以经由通信模块11从服务器20而不是从传感器12取得。然后，当这样的输入参数被输入了数据时，机器学习模型输出持有终端设备10的用户是否会罹患中暑。

在机器学习模型中，能够使用各种机器学习算法。在本实施方式中，机器学习模型例如是神经网络(NN)、支持向量机(SVM)、决策树(DT)这样的通过监督学习来学习的模型。特别地，在本实施方式中，机器学习模型优选为将与用户的身体状态相关的数据和环境数据以时间序列作为输入参数输入的循环神经网络(RNN)模型。

另外，作为机器学习模型，可以使用具有各种输入参数和输出参数的模型。输入参数包括能够由终端设备10的传感器12检测的各种参数。具体而言，在本实施方式中，输入参数例如包括生命体征(心率、体温、血压和呼吸频率)、血氧浓度、心电图、血糖值、步数、卡路里消耗量、疲劳度、睡眠状态、时刻、图像、动态图像等。另外，输入参数也可以包括经由通信网络4从服务器20发送的参数(例如，终端设备10周围的气温、湿度、天气、风速等)。此外，输出参数包括与用户的身体相关的各种参数。具体而言，输出参数包括例如持有终端设备10的人患低温症的概率等。

在本实施方式中，上述那样的机器学习模型的机器学习在服务器20中而不是在终端设备10中进行。机器学习模型使用学习用数据集进行学习。学习用数据集包括作为输入参数来使用的数据和与该数据对应的输出参数的值(正确答案值或正确答案标签)。特别地，在本实施方式中，学习用数据集包括关于某对象者的在终端设备10中所取得的时间序列的数据和该对象者是否罹患了中暑的数据。例如，在如上所述的是否会罹患中暑是输出参数的情况下，在针对罹患了中暑的人所创建的学习用数据集中，将输出参数中的表示会罹患中暑的类别的值设为1。另一方面，在针对未罹患中暑的人所创建的学习用数据集中，将输出参数中的表示不会罹患中暑的类别的值设为1。另外，学习用数据集也可以通过对传感器12的输出值进行预处理(缺损处理、归一化、标准化等)来生成。

在进行机器学习模型的学习时，例如，通过公知的任意方法(例如，误差反向传播法)反复更新机器学习模型中的学习参数(NN的权重w和偏差b等值通过学习而被更新的参数)。学习参数例如被反复更新，使得机器学习模型的输出值与学习用数据集所包含的输出参数的正确答案值之间的差变小。其结果是，机器学习模型进行学习，生成学习完毕的机器学习模型。

<机器学习模型的使用>

接下来，参照图3，对终端设备10中的使用了机器学习模型的处理进行说明。在本实施方式中，终端设备10基于由终端设备10的传感器12检测出的各种参数的值来推定持有终端设备10的用户是否会罹患中暑。此外，终端设备10在判定为会罹患中暑时，将存在成为中暑的危险性的意思通知给用户。终端设备10的处理器16在推定是否会罹患中暑时，使用数据取得部161、模型执行部162和通知部163。

数据取得部161取得包括与机器学习模型的输入参数相关的数据在内的数据。具体而言，数据取得部161取得由终端设备10的传感器12检测出的输入参数的值。在本实施方式中，数据取得部161从传感器12取得用户的体温、心率、血压和呼吸频率等。另外，数据取得部161也可以经由通信模块11从服务器20等外部装置取得输入参数的值。在本实施方式中，服务器20在从各终端设备10接收到由各终端设备10的传感器12检测出的当前位置时，将该位置周围的当前的温度和当前的湿度发送到该终端设备10。因此，数据取得部161从服务器20取得终端设备10周围的气温和湿度。数据取得部161将所取得的数据存储于存储器15。

当由数据取得部161取得了机器学习模型的输入参数的当前的值时，模型执行部162将所取得的输入参数的值输入到机器学习模型，计算输出参数的值。在本实施方式中，在模型执行部162中，当由数据取得部161取得的与用户的身体相关的数据和环境数据被输入到机器学习模型时，用户是否会罹患中暑被输出。

在此，用于执行机器学习模型的程序和在机器学习模型中使用的学习参数的值被存储于存储器15。因此，模型执行部162使用存储在存储器15中的程序和学习参数的值来计算输出参数的值。

通知部163基于由模型执行部162计算出的输出参数的值来进行向用户的通知。通知部163经由输出装置14进行向用户的通知。具体而言，在本实施方式中，在由模型执行部162判定为用户会罹患中暑的情况下，通知部163通过输出装置14进行向用户的通知。在该情况下，通知部163例如可以在显示器上显示与中暑相关的警告，也可以从扬声器发出与中暑相关的警告音。

<机器学习模型的学习>

接着，参照图3、图5～图8，对在各终端设备10的模型执行部162中使用的机器学习模型的学习处理进行说明。在本实施方式中，机器学习模型的学习在服务器20中进行。具体而言，终端设备10将在终端设备10中所取得的学习用的数据发送给服务器20。服务器20使用接收到的学习用的数据进行机器学习模型的学习，并且将学习完毕的机器学习模型发送给终端设备10。然后，终端设备10将机器学习模型更新为发送来的学习完毕的模型。

然而，在使机器学习模型进行学习时，向服务器20发送由终端设备10取得的数据。但是，当由终端设备10取得的数据全部被发送到服务器20并存储于服务器20的存储装置22时，在存储装置22会存储大量的数据。因此，需要存储容量非常大的存储装置22。

另一方面，存在由机器学习模型分类的类别中的仅一部分类别的发生概率极低的情况。例如，持有各终端设备10的用户罹患中暑的概率低。因此，在基于从终端设备10取得的信息来推定用户是否会罹患中暑的机器学习模型中，表示会罹患中暑的类别的发生概率非常低。在以下，将由机器学习模型分类的所有类别中的与其他类别相比发生概率相对较低的类别也称为低发生类别。

在这种情况下，如果在使机器学习模型进行学习时使用由终端设备10取得的所有数据，则发生概率高的类别的数据会过剩。当发生概率高的类别的数据过剩时，发生概率低的低发生类的数据相对地变得极少，因此未必能够创建推定精度高的机器学习模型。因此，对于发生概率高的类别的信息、即用户未罹患中暑的情况下的信息，可以不必使用全部。

图6是表示各条件下的用户罹患中暑的概率的图。特别地，图6示出了针对由气温和湿度规定的每个条件，用户罹患中暑的概率。如图6所示，气温越高和湿度越高，用户罹患中暑的概率越高。另一方面，在气温低的情况或湿度低的情况下，用户罹患中暑的概率低。但是，一般而言，用户罹患中暑的概率较低。因此，可以说表示用户会罹患中暑的类别是发生概率相对较低的低发生类别。另一方面，可以说表示用户不会罹患中暑的类别是发生概率相对较高的类别。

因此，在本实施方式中，在服务器20中，基于低发生类别的发生概率，设定将终端设备10所取得的数据向服务器20发送的发送频度。在低发生类别发生的概率相对较高的条件下，将终端设备10所取得的数据向服务器20发送的发送频度增高。因此，在用户罹患中暑的概率高的条件下，例如在图6的例子中为气温和湿度高的条件下，将终端设备10所取得的信息向服务器20发送的发送频度增高。另一方面，在低发生类别发生的概率相对较低的条件下，将终端设备10所取得的数据向服务器20发送的发送频度降低。因此，在用户罹患中暑的概率低的条件下，例如在图6的例子中为气温和湿度低的条件下，将终端设备10所取得的信息向服务器20发送的发送频度降低。

图7是各条件下的低发生类别的发生概率为图6所示的概率的情况下的、每个条件的目标发送频度的设定例。在图7所示的例子中，基于低发生类别的发生概率，以三个不同的发送频度向服务器20发送终端设备10所取得的数据。特别是，在图7所示的例子中，在用户罹患中暑的概率小于0.1％的条件下，目标发送频度被设定为F1。另外，在用户罹患中暑的概率为0.1％以上且小于0.3％的条件下，目标发送频度被设定为比F1高的F2。而且，在用户罹患中暑的概率为0.3％以上的条件下，目标发送频度被设定为比F2高的F3。

这样，在本实施方式中，在低发生类别的发生概率相对较高的条件下，与低发生类别的发生概率相对较低的条件相比，从终端设备10向服务器20的目标发送频度增多。即，在这样的条件下，从终端设备10向服务器20的每单位时间的数据发送量增多。其结果是，能够抑制发生概率低的低发生类别的数据发送的减少，并且减少发生概率高的类别的数据发送。其结果是，能够抑制机器学习模型的推定精度的降低，并且能够抑制存储于存储装置22的数据量，因此能够从终端设备10效率地收集数据。

接下来，参照图3、图5和图8具体地对机器学习模型的学习处理进行说明。

终端设备10的处理器16在进行机器学习模型的学习时，使用数据取得部161、条件确定部164、发送控制部165、数据发送部166和模型更新部167(参照图3)。另外，服务器20的处理器23在进行机器学习模型的学习时，使用发生概率确定部231、目标发送量设定部232、数据集创建部233、学习部234和模型发送部235(参照图5)。

终端设备10的条件确定部164确定由终端设备10的数据取得部161取得数据的当前的条件。如上所述，在本实施方式中，按每个条件设定从终端设备10向服务器20的目标发送频度，条件确定部164确定当前的条件符合其中的哪个条件。特别是，在本实施方式中，确定由气温和湿度规定的条件符合图7所示的多个条件中的哪个条件。因此，在本实施方式中，基于由数据取得部161取得的当前的气温和湿度来确定当前的条件。

终端设备10的发送控制部165控制数据从终端设备10向服务器20的发送。发送控制部165例如控制来自终端设备10的数据的发送频度。换言之，发送控制部165控制终端设备10所取得的数据中的向服务器20发送的数据的比例。因此，在数据的发送频度被控制得较高时，例如，由终端设备10取得的所有数据(用于机器学习模型的所有数据)被发送给服务器20。另一方面，在数据的发送频度被控制得较低时，由终端设备10取得的数据中的一部分数据(用于机器学习模型的数据中的一部分数据)被发送给服务器20。

特别地，在本实施方式中，如后所述，在目标发送量设定部232中，按每个条件设定目标发送频度。因此，发送控制部165基于由条件确定部164所确定的当前的条件、和在目标发送量设定部232中所设定的各条件与目标发送频度之间的关系，来设定与当前的条件对应的目标发送频度。然后，发送控制部165按照这样计算出的目标发送频度，使数据从终端设备10发送到服务器20。

终端设备10的数据发送部166经由通信网络4将由数据取得部161从终端设备10的传感器12取得的数据发送到服务器20。发送到服务器20的数据因为用于使机器学习模型进行学习，所以包括机器学习模型的输入参数的值。另外，在由终端设备10的传感器12检测输出参数的值的情况(例如，机器学习模型是根据输入参数的值来推定输出参数的将来的值那样的模型的情况)下，发送到服务器20的数据可以包括输出参数的值。

特别地，在本实施方式中，数据发送部166按照来自发送控制部165的指令，向服务器20发送数据。因此，数据发送部166按照由发送控制部165设定的发送频度向服务器20发送数据。

如上所述，终端设备10的模型更新部167将存储在存储器15中的由模型执行部162使用的机器学习模型更新为由模型发送部235发送来的机器学习模型。

服务器20的发生概率确定部231按由终端设备10取得数据的各种条件(在本实施方式中，按由气温和湿度规定的每个条件)确定低发生类别的发生概率。每个条件的低发生类别的发生概率基于低发生类别的发生信息来确定。在本实施方式中，在各条件下用户罹患中暑的概率基于在各条件下处于对象区域内的用户的数量和这样的用户中的罹患了中暑的用户的罹患信息来确定。

在各条件下位于对象区域内的用户的数量基于在各个条件下位于对象区域内的终端设备10的数量来确定。位于对象区域内的终端设备10的数量例如通过对与服务器20进行了通信的终端设备10中的发送了表示终端设备10位于对象区域内的位置信息的终端设备10的数量进行计数来确定。

各用户的中暑罹患信息例如从各终端设备10发送。具体而言，在用户罹患了中暑的情况下，该信息由用户自身经由输入装置13输入到终端设备10。输入到终端设备10的中暑罹患信息与当时的气温和湿度(表示罹患时的条件的参数)一起经由通信网络4发送到服务器20。

或者，用户的中暑罹患信息例如从配置于医疗机构等的终端设备(未图示)发送。具体而言，在用户罹患了中暑的情况下，由对该用户进行了诊疗的医疗机构向其终端设备输入用户罹患了中暑的信息。在医疗结构的终端设备中所输入的中暑罹患信息经由通信网络4发送给服务器20。另外，在服务器20中，基于过去从该用户持有的终端设备10发送来的数据，取得用户罹患了中暑时的气温和湿度(表示罹患时的条件的参数)。

服务器20的目标发送量设定部232按在终端设备10中取得数据的每个条件(即，按由气温和湿度规定的每个条件)，设定从终端设备10向服务器20的目标发送频度。在本实施方式中，目标发送量设定部232将目标发送频度设定为，各条件下的低发生类别的发生概率越高则该条件下的目标发送频度越高。特别是，在本实施方式中，如图7所示，目标发送量设定部232根据在各条件下用户罹患中暑的概率，以F1、F2、F3这三个阶段设定目标发送频度。并且，在本实施方式中，服务器20将所设定的每个条件的目标发送频度发送给终端设备10。

另外，目标发送量设定部232也可以根据用户在每个条件下罹患中暑的概率，以两个阶段设定目标发送频度。在该情况下，例如，在罹患中暑的概率小于0.1％的条件下，将目标发送频度设定得相对较慢，在罹患中暑的概率为0.1％以上的条件下，将目标发送频度设定得相对较快。或者，目标发送量设定部232也可以根据在每个条件下用户罹患中暑的概率，以四个以上的多个阶段或连续地设定目标发送频度。总之，在本实施方式中，目标发送量设定部232按每个条件将目标发送频度设定为，在低发生类别的发生概率相对较高的条件下，与低发生类别的发生概率相对较低的条件相比，从终端设备10向服务器20的每单位时间的数据的目标发送频度变高。

服务器20的数据集创建部233创建用于使机器学习模型进行学习的学习用数据集。学习用数据集包括机器学习模型的输入参数的实测值和输出参数的正确答案值或正确答案标签。例如，在本实施方式中，学习用数据集包含由某用户的终端设备10取得的时间序列的数据和该用户的中暑的罹患信息(正确答案标签)。

由各用户的终端设备10取得的时间序列的数据由数据发送部166从各终端设备10发送给服务器20。数据集创建部233在创建学习用数据集时，使用这样从各终端设备10发送来的数据。另外，数据集创建部233在创建学习用数据集时，如上述那样使用从终端设备10或医疗机构的终端设备发送来的中暑罹患信息。

服务器20的学习部234使用学习用数据集，通过上述那样的误差反向传播法等方法使机器学习模型进行学习。具体而言，学习部234使用学习用数据集来更新机器学习模型的学习参数的值。

服务器20的模型发送部235经由通信网络4将通过学习部234进行了机器学习的学习完毕的机器学习模型发送给各终端设备10。具体而言，将通过利用学习部234进行的学习而更新后的学习参数的值发送给各终端设备10。

图8是表示机器学习模型的学习处理的流程的序列图。图8所示的学习处理在终端设备10的处理器16和服务器20的处理器23中被执行。

在本实施方式的学习处理中，如图8所示，首先，服务器20的发生概率确定部231按每个条件(特别是按由温度和湿度规定的条件)确定低发生类别(表示会罹患中暑的类别)的发生概率(步骤S11)。如上所述，发生概率确定部231基于过去从终端设备10发送来的数据和过去的中暑罹患信息来确定发生概率。过去从终端设备10发送来的数据和过去的中暑罹患信息存储于服务器20的存储装置22。因此，发生概率确定部231基于存储装置22中的这些数据和信息来确定每个条件的发生概率。另外，在本实施方式中，步骤S11的每个条件的发生概率的确定每隔一定的时间间隔、或者在每次一定量的数据被存储于存储装置22时进行。

接着，服务器20的目标发送量设定部232基于在步骤S11中所确定的每个条件的发生概率，按每个条件设定目标发送频度(步骤S12)。如上所述，在本实施方式中，目标发送量设定部232将目标发送频度设定为，低发生类别的发生概率越高的条件，则该条件下的目标发送频度越高。另外，在本实施方式中，步骤S12的目标发送频度的设定在每次在步骤S11中确定了每个条件的发生概率时进行。

当在步骤S12中设定了每个条件的目标发送频度时，目标发送量设定部232将每个条件的目标发送频度发送给终端设备10(步骤S13)。具体而言，目标发送量设定部232将与各条件和目标发送频度之间的关系(例如图7所示的关系)相关的信息发送到终端设备10。特别地，在本实施方式中，目标发送量设定部232向位于对象区域内的终端设备10发送。因此，在步骤S12中设定了目标发送频度时，目标发送量设定部232向位于对象区域的终端设备10发送与各条件和目标发送频度之间的关系相关的信息。此外，目标发送量设定部232还向在步骤S12中设定了目标发送频度之后进入到对象区域内的终端设备10发送与各条件和目标发送频度之间的关系相关的信息。

另一方面，各终端设备10的数据取得部161定期地从传感器12或服务器20取得各种数据(步骤S14)。在本实施方式中，数据取得部161取得与机器学习模型的输入参数相关的数据和确定当前的条件所需的数据(在本实施方式中为气温和湿度)。

当由数据取得部161取得了数据时，条件确定部164确定由终端设备10的数据取得部161取得数据的当前的条件(步骤S15)。在本实施方式中，数据取得部161基于在步骤S14中取得的数据来确定当前的条件符合图7所示的条件中的哪个条件。

当在步骤S15中确定了当前的条件时，发送控制部165计算目标发送频度(步骤S16)。发送控制部165基于在步骤S13中发送来的与各条件和目标发送频度之间的关系相关的信息、和在步骤S15中所确定的当前的条件，设定针对终端设备10的目标发送频度。

当这样设定了目标发送频度时，数据发送部166以所设定的目标发送频度向服务器20发送数据(步骤S17)。数据发送部166特别地发送由数据取得部161取得的数据中的用于机器学习模型的数据。发送到服务器20的数据被存储于服务器20的存储装置22。

当由数据发送部166发送来的数据被存储到存储装置22时，服务器20的数据集创建部233创建学习用数据集(步骤S18)。数据集创建部233使用存储在存储装置22中的数据作为输入参数来创建学习用数据集。另外，数据集创建部233使用由用户自身输入到终端设备10的中暑罹患信息或在医疗机构的终端设备中所输入的中暑罹患信息作为输出参数的正确答案值来创建学习用数据集。

当在步骤S18中数据集创建部233创建了学习所需数量的学习用数据集时，学习部234使用所创建的数据集来使机器学习模型进行学习(步骤S19)。机器学习模型的学习如上所述通过误差反向传播法等公知的方法来进行。

在利用学习部234进行的机器学习模型的学习完成后，模型发送部235将学习完毕的机器学习模型发送给终端设备10(步骤S20)。然后，终端设备10的模型更新部167在接收到学习完毕的机器学习模型时，将由模型执行部162使用的机器学习模型更新为从服务器20发送来的机器学习模型(步骤S21)。

<效果和变形例>

根据本实施方式，在低发生类别的发生概率高的条件成立的情况下，从终端设备10以高频度向服务器20发送数据。另一方面，在低发生类别的发生概率高的条件不成立的情况下，从终端设备10以低频度向服务器20发送数据。因此，将以高精度进行学习所需的数据以高频度发送给服务器20。另一方面，将对于以高精度进行学习不那么需要的数据以低频度发送给服务器20。其结果是，能够抑制过剩的数据从终端设备10向服务器20的发送，并且创建推定精度高的机器学习模型。因此，根据本实施方式，能够从终端设备10效率地收集数据。

另外，在上述实施方式中，发送控制部165在低发生类别的发生概率相对较高的条件下，与低发生类别的发生概率相对较低的条件相比，提高从终端设备10向服务器20的每单位时间的数据的目标发送频度。但是，只要在低发生类别的发生概率相对较高的条件下，与低发生类别的发生概率相对较低的条件相比，能够减少对从终端设备10向服务器20发送的数据进行间隔剔除的量而增加从终端设备10向服务器20的每单位时间的数据发送量，则怎样控制数据向服务器20的发送都可以。例如，发送控制部165也可以控制数据的发送速度来代替数据的发送频度。因此，目标发送量设定部232按每个条件将每单位时间的目标发送量设定为，在低发生类别的发生概率相对较高的条件下，与低发生类别的发生概率相对较低的条件相比，从终端设备10向服务器20的每单位时间的数据的目标发送量变多。

另外，在上述实施方式中，使用了推定是否会罹患中暑的机器学习模型。但是，只要是基于由终端设备10那样的数据取得装置取得的数据来推定任意的输出参数的值的模型，就可以使用任何模型作为机器学习模型。因此，作为机器学习模型，例如也可以使用基于由监视照相机取得的图像数据来推定图像数据内有无产生异常者(可疑人员或有可能患有急病的人等)及该异常者的位置的模型等。

此外，在上述实施方式中，机器学习模型在终端设备10中使用。然而，机器学习模型也可以在服务器20中使用。在该情况下，数据取得部161、模型执行部162等设置于服务器20。服务器20的数据取得部161经由通信网络4从终端设备10取得由终端设备10的传感器12检测出的数据。然后，服务器20的模型执行部将从终端设备10接收到的数据作为输入参数输入到机器学习模型，计算输出参数的值，并将计算出的输出参数的值发送到终端设备10。另外，在该情况下，发送控制部165可以不仅针对用于机器学习模型的学习的数据而控制从终端设备10的发送，而且还针对用于机器学习模型的执行的数据而控制从终端设备10的发送。

另外，在上述实施方式中，由机器学习模型分类的所有类别中的与其他类别相比发生概率相对较低的低发生类别被预先确定。但是，低发生类别也可以基于过去从终端设备10发送来的数据等，由服务器20确定。

图9是第一实施方式的一个变形例所涉及的服务器20的处理器23的与图5同样的功能框图。如图9所示，本变形例的处理器23除了图5的功能块以外，还具备类别确定部236，该类别确定部236确定由机器学习模型分类的所有类别中的与其他类别相比发生概率相对较低的低发生类别。

类别确定部236基于由终端设备10发送来的过去的数据，计算由机器学习模型分类的所有类别在一定期间内的发生概率。在本变形中，具体而言，例如，基于在一定期间中接收到的终端设备10的数量和其中与中暑罹患信息相关联的终端设备10(用户)的数量来确定低发生类别。然后，发生概率确定部231按每个条件确定如上述这样所确定的低发生类别的发生概率。

另外，在上述实施方式中，条件确定部164和发送控制部165设置于终端设备10。因此，当前的条件的确定和目标发送频度的设定在终端设备10中进行。但是，条件确定部164和发送控制部165也可以设置于服务器20。

在该情况下，确定终端设备10的当前的条件所需的数据定期地从终端设备10发送给服务器20。服务器20的条件确定部164基于这样从终端设备10发送来的数据来确定该终端设备10的当前的条件。或者，服务器20的条件确定部164也可以基于上述的在图8的步骤S17中过去从终端设备10发送来的数据来确定该终端设备10的当前的条件。然后，服务器20的发送控制部165基于由条件确定部164所确定的当前的条件来设定该终端设备10中的目标发送频度。然后，发送控制部165将这样设定的目标发送频度发送给终端设备10。终端设备10的数据发送部166按照这样发送来的目标发送频度，向服务器20发送数据。

·第二实施方式

接着，参照图10～图11对第二实施方式所涉及的机器学习系统1进行说明。以下，以与第一实施方式所涉及的机器学习系统的不同点为中心进行说明。在本实施方式中，服务器20进行输入参数至少部分地不同的多个机器学习模型的学习。因此，服务器收集这样的多个机器学习模型的学习所需的数据。以下，以服务器20进行输出是否会罹患中暑的第一机器学习模型和输出是否会产生异常者的第二机器学习模型的学习的情况为例进行说明。

然而，在服务器20进行多个机器学习模型的学习的情况下，向服务器20发送所有机器学习模型的学习所需的数据。因此，大量的数据被发送到服务器20，并且大量的数据被存储于服务器20的存储装置22。因此，需要存储容量非常大的存储装置22。

另一方面，通过机器学习模型的学习，基本上提高了机器学习模型的推定精度。因此，从提高机器学习模型的推定精度的观点出发，优选收集与该机器学习模型相关的大量数据。

这里，机器学习模型的必要性按每个机器学习模型而不同。通常，与人类的健康相关的机器学习模型与其他机器学习模型相比，其必要性更高。在本实施方式中，输出是否会罹患中暑的第一机器学习模型的必要性比输出异常者的有无等的第二机器学习模型的必要性高。因此，在本实施方式中，对于与人类的健康相关的第一机器学习模型，与不与人类的健康相关的第二机器学习模型相比，在低发生类别的发生概率相同的条件下，来自终端设备10的每单位时间的数据发送量变多。

图10是表示各条件下的产生异常者的概率的图。特别地，图10示出了针对由时间段和场所(区域)规定的每个条件，产生异常者的概率。从图10可知，在任何条件下，产生异常者的概率都低。因此，可以说表示会产生异常者的类别是发生概率相对较低的低发生类别。另一方面，可以说表示不会产生异常者的类别是发生概率相对较高的类别。

因此，在本实施方式中，也与图7所示的例子同样地，根据各条件下的低发生类别的发生概率来设定每个条件的目标发送频度。图11是各条件下的低发生类别的发生概率为图6所示的概率的情况下的、每个条件的目标发送频度的设定例。如图11所示，设定目标发送频度的目标发送量设定部232在产生异常者的概率小于0.1％的条件下，将目标发送频度设定为F1。另外，目标发送量设定部232在产生异常者的概率为0.1％以上且小于0.3％的条件下，将目标发送频度设定为比F1高的F2’。而且，目标发送量设定部232在产生异常者的概率为0.3％以上的条件下，将目标发送频度设定为比F2’高的F3’。

特别地，在本实施方式中，对于输出异常者的有无等的第二机器学习模型，较之于与人类的健康相关的第一机器学习模型，目标发送频度被设定得较低。因此，在本实施方式中，与第二机器学习模型相关的目标发送频度F1’被设定得比与第一机器学习模型相关的对应的目标发送频度F1低。与第二机器学习模型相关的目标发送频度F2’被设定得比与第一机器学习模型相关的对应的目标发送频度F2低。同样地，在本实施方式中，与第二机器学习模型相关的目标发送频度F3’被设定得比与第一机器学习模型相关的对应的目标发送频度F3低。

由此，在本实施方式中，目标发送量设定部232将每单位时间的目标发送量设定为，对于机器学习模型中的与人类的健康相关的机器学习模型，与不与人类的健康相关的机器学习模型相比，针对低发生类别的发生概率相同的条件，每单位时间的目标发送量变多。由此，能够尽早使与人类的健康相关的机器学习模型进行学习，由此能够尽早提高推定精度。

另外，在本实施方式中，由服务器20进行第一机器学习模型和第二机器学习模型这两个机器学习模型的学习。但是，即使在由服务器20进行三个以上的多个机器学习模型的学习的情况下，也能够如本实施方式那样，基于是否与人类的健康相关来变更目标发送量。

以上，说明了本发明所涉及的优选实施方式，但本发明并不限定于这些实施方式，可以在要求保护的范围的记载内实施各种修正和变更。

标号说明

1 机器学习系统

4 通信网络

5 无线基站

10 终端设备

20 服务器

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：横山大树;伊藤晃人;中林亮;今村达也;金子智洋;村田宏树;
专利申请人：丰田自动车株式会社;

上一篇：信息处理方法、装置、设备及存储介质
下一篇：一种基于互动投影技术控制坐姿检测的学习桌