一种多特征主观概率型预测的建模与聚合方法及系统

文献发布时间：2024-04-18 19:58:30

技术领域

本发明涉及决策分析技术领域，尤其涉及一种多特征主观概率型预测的建模与聚合方法及系统。

背景技术

当数据稀疏时，决策者需要咨询专家对相关变量的预测，例如国内生产总值、新产品的销售量、灾难造成的损失、流媒体上新电影的播放次数等。为了预测一个连续变量，专家们经常被要求提供多个概率型预测，这些概率预测共同反映了不确定变量分布的位置、宽度和形状，且被广泛应用于气象学、概率风险评估、金融、运营管理等多个领域。

在实际应用中，决策制定者不仅关心专家判断的可预测性，还关心其可解释性，即不同的信息源和处理信息的方式。政策制定者需要了解专家预测所基于的共同或不同的信息、动机和背景因素，这对决策透明度也是至关重要的。对专家预测聚合的基本目标是汇集信息源，调和不同的观点，并量化不确定性，而不是消除不一致或不确定性。当被预测的结果是久远的未来才能获得时，或者在进行同行预测无法验证准确结果时，信息的提取尤其关键。

对于使用概率型预测进行聚合以提取群体智慧的已有研究，包括简单平均、基于聚合绩效的加权平均、基于“共享信息问题”的预测相关性分析、基于共有信息与私有信息的加权聚合等。上述研究或是考虑历史数据对预测进行校准，或是需要进行特殊的实验设置(如协调机制、竞争博弈机制、对其他专家预测进行额外估计等)，对专家预测相关性的分析集中于预测误差的协方差矩阵，在进行预测聚合时未考虑各专家预测所利用的信息源及信息处理方式。

发明内容

本发明提供一种多特征主观概率型预测的建模与聚合方法及系统，用以解决现有多元专家概率型判断预测难以准确聚合的问题。

本发明提供一种多特征主观概率型预测的建模与聚合方法，包括：

获取专家概率型判断结果，基于镜模型建立专家概率型判断结果的线性预测模型；

通过所述线性预测模型生成预测结果，确定预测结果的误差；

根据包含预测误差的预测结果提取潜在信息源，并分解出问题变量特征和专家行为特征；

基于所述分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组；

从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合。

根据本发明提供的一种多特征主观概率型预测的建模与聚合方法，所述获取专家概率判断结果，基于透镜模型建立专家概率型判断结果的线性预测模型，包括：

所述专家概率型判断包括预测误差的概率值和不包含预测误差的概率值；

基于透镜模型及预测误差模型，对预测误差的概率值和不包含预测误差的概率值进行分析，生成分析结果；

根据所述分析结果中不含预测误差的概率判断的权重分布及预测误差，建立线性预测模型。

根据本发明提供的一种多特征主观概率型预测的建模与聚合方法，所述通过所述线性预测模型生成预测结果，确定预测结果的误差，包括：

基于线性预测模型生成的预测结果确定取样误差和判断误差；

所述取样误差取决于对信息线索的随机取样和专家如何对取样信息进行线性组合；

所述判断误差取决于来自于专家对概率水平的认知误差；

通过所述取样误差和判断误差组合确定概率预测结果的误差。

根据本发明提供的一种多特征主观概率型预测的建模与聚合方法，所述根据包含预测误差的预测结果提取潜在信息源，并分解出问题变量特征和专家行为特征，包括：

基于包含预测误差的预测结果建立概率型预测矩阵；

将所述概率型预测矩阵分解为问题变量特征矩阵和专家行为特征矩阵；

通过最大似然法对所述问题变量特征矩阵和专家行为特征矩阵进行迭代求解，生成问题变量特征和专家行为特征。

根据本发明提供的一种多特征主观概率型预测的建模与聚合方法，基于所分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组，包括：

基于概率型预测模型，求解问题变量特征和专家行为特征，估算专家针对可观测的信息线索和不可观测的信息线索赋予的权重；

基于专家赋予的权重值，将相似权重值划分到同一分组，完成聚类，形成多个聚类小组。

根据本发明提供的一种多特征主观概率型预测的建模与聚合方法，所述从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合，包括：

确定聚类中心，将每个聚类小组的专家赋予的权重值与聚类中心的权重值进行距离比较，生成比较结果；

根据所述比较结果，选定估计的权重距离聚类中心最近的专家作为每一聚类小组的代表；

通过多种启发式方式基于每一聚类小组的代表进行概率型判断的聚合。

根据本发明提供的一种多特征主观概率型预测的建模与聚合方法，还包括：

进行数据可视化，将各信息线索与问题变量的相关性，各专家在不同信息线索上赋予的权重情况以及选择不同聚合方式的加权权重通过图表的形式进行展现。

本发明还提供一种多特征主观概率型预测的建模与聚合系统，所述系统包括：

线性预测模型建立模块，用于获取专家概率型判断结果，基于透镜模型建立专家概率型判断结果的线性预测模型；

预测误差模块，用于通过所述线性预测模型生成预测结果，确定预测结果的误差；

提取潜在信息源模块，用于根据包含预测误差的预测结果提取潜在信息源，并分解出问题变量特征和专家行为特征；

聚类分组模块，用于基于所述分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组；

预测聚合模块，用于从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述多特征主观概率型预测的建模与聚合方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述多特征主观概率型预测的建模与聚合方法。

本发明提供的一种多特征主观概率型预测的建模与聚合方法及系统，通过基于心理学领域中的透镜模型，提出了考虑取样误差和判断误差的线性预测模型，对多元专家评估进行解析化建模，并设计了能够分解专家行为特征和问题变量特征的估计算法，分别表示每个被预测变量的信息源和专家赋予不同信息源的权重。基于专家评估的解析化建模所得到的专家权重进行聚类，从每个聚类小组中挑选一名专家进行预测聚合，以少量专家代表群体智慧，以此在无历史数据校准的前提下，准确进行专家概率型预测的聚合。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的一种多特征主观概率型预测的建模与聚合方法的流程示意图之一；

图2是本发明提供的一种多特征主观概率型预测的建模与聚合方法的流程示意图之二；

图3是本发明提供的一种多特征主观概率型预测的建模与聚合方法的流程示意图之三；

图4是本发明提供的一种多特征主观概率型预测的建模与聚合方法的流程示意图之四；

图5是本发明提供的一种多特征主观概率型预测的建模与聚合方法的流程示意图之五；

图6是本发明提供的一种多特征主观概率型预测的建模与聚合方法的流程示意图之六；

图7是本发明提供的一种多特征主观概率型预测的建模与聚合系统的模块连接示意图；

图8是本发明提供的电子设备的结构示意图。

附图标记：

110：线性预测模型建立模块；120：预测误差模块；130：提取潜在信息源模块；140：聚类分组模块；150：预测聚合模块；

810：处理器；820：通信接口；830：存储器；840：通信总线。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合图1-图6描述本发明的一种多特征主观概率型预测的建模与聚合方法，包括：

S100、获取专家概率型判断结果，基于透镜模型建立专家概率型判断结果的线性预测模型；

S200、通过所述线性预测模型生成预测结果，确定预测结果的误差；

S300、根据包含预测误差的预测结果提取潜在信息源，并分解出问题变量特征和专家行为特征；

S400、基于所分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组；

S500、从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合。

在本发明中，填补了对专家预测相关性的分析集中于预测误差的协方差矩阵，在进行预测聚合时未考虑各专家预测所利用的信息源及信息处理方式的空白，在无历史预测数据对预测结果进行校准的前提下，提出了一个线性预测模型来捕捉概率型判断中的信息共享结构和可能的预测误差，假设每个专家采用“透镜模型”来将多个信息线索进行线性组合，并使用高斯过程模型解释了在不同概率水平上分位数判断之间抽样和判断误差的相关性。针对在进行信息共享结构的挖掘研究中，每个专家使用的一些(或全部)实际信息线索是决策者所无法观察到的，本发明使用矩阵分解的方法，从给定的概率型判断中提取“问题变量特征”(每个被预测的问题变量的概率判断背后的潜在信息线索)和“专家行为特征”(每个专家在这些信息线索上赋予多少权重)，并从理论上证明了对估计信息线索的权重与实际信息线索的权重进行聚类时结果相同，即可以使用潜在信息线索的权重来定义专家预测之间的相关性。基于此，根据所估计专家预测的相关信息的权重相似性来对专家聚类，通过从每个聚类组中挑选代表来得到子群体，以少量专家代表群体智慧，以此实现基于多元专家评估解析化建模的预测聚合。

获取专家概率判断结果，基于透镜模型建立专家概率型判断的线性预测模型，包括：

S101、所述专家概率型判断包括预测误差的概率值和不包含预测误差的概率值；

S102、基于透镜模型及预测误差模型，对预测误差的概率值和不包含预测误差的概率值进行分析，生成分析结果；

S103、根据所述分析结果中不含预测误差的概率判断的权重分布及预测误差，建立线性预测模型。

在本发明中，基于心理学领域中的“透镜模型”，建立专家概率型判断的线性预测模型。专家的概率判断由不包含预测误差的概率值和预测误差的加和组成，对于不包含预测误差的概率值，将其表示为多个信息线索(包含可观测的信息线索和不可观测的潜在信息线索)的线性组合，且每个信息线索均服从某一概率分布。对于赋予每个信息线索的权重，均大于等于0，且加和为1。此外，所有的专家都可以看到不同变量全部的相同的信息线索集合，而对于不同的变量，同一个专家对其信息线索赋予相同的权重集合。

通过所述线性预测模型生成预测结果，确定预测结果的误差，包括：

S201、基于线性预测模型生成的预测结果确定取样误差和判断误差；

S202、所述取样误差取决于对信息线索的随机取样和专家如何对取样信息进行线性组合；

S203、所述判断误差取决于来自于专家对概率水平的认知误差；

S204、通过所述取样误差和判断误差组合确定概率预测结果的误差。

在本发明中，专家给出的概率型判断的预测误差可被分解为取样误差和判断误差。其中，取样误差取决于两个因素，一个是对信息线索的随机取样，其服从一个高斯过程；另一个决定因素是专家如何对取样信息进行线性组合，即专家的权重系数。判断误差主要来自于专家对概率水平的认知误差，也为高斯过程，且判断误差的协方差函数具有：

异方差性，虽然判断误差的期望值为0，但其方差在不同的概率水平上是不同的，是非平稳高斯过程；

对称性，判断误差的方差在0.5的概率水平处具有对称性；

变量的独立性，判断误差在不同问题变量之间是独立的。

由此，可将判断误差建模为与不包含预测误差的概率值的斜率有关。

在确认专家给出的概率型判断的预测误差后能够有助于在考虑误差的基础上进行潜在信息源提取，提升预测聚合的准确性。

根据包含预测误差的预测结果提取潜在信息源，并分解出问题变量特征和专家行为特征，包括：

S301、基于包含预测误差的预测结果建立概率型预测矩阵；

S302、将所述概率型预测矩阵分解为问题变量特征矩阵和专家行为特征矩阵；

S303、通过最大似然法对所述问题变量特征矩阵和专家行为特征矩阵进行迭代求解，生成问题变量特征和专家行为特征。

在本发明中，将概率型预测矩阵Y

对未知参数θ＝{β,φ}进行估计，可使用最大似然法估计。针对上述最大似然估计，采取如下多步迭代算法求解：

基于所分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组，包括：

S401、基于概率型预测矩阵，求解问题变量特征和专家行为特征，估算专家针对可观测的信息线索和不可观测的信息线索赋予的权重；

S402、基于专家赋予的权重值，将相似权重值划分到同一分组，完成聚类，形成多个聚类小组。

在本发明中，基于多元专家评估解析化建模，估计专家对不同信息源(包含可观测的信息线索和不可观测的潜在信息线索)所赋予的权重。

对专家权重进行聚类，在本发明中聚类方法包括k-均值聚类、高斯混合聚类、谱聚类、核聚类、基于密度的聚类、层次聚类等方法。

从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合，包括：

S501、确定聚类中心，将每个聚类小组的专家赋予的权重值与聚类中心的权重值进行距离比较，生成比较结果；

S502、根据所述比较结果，选定估计的权重距离聚类中心最近的专家作为每一聚类小组的代表；

S503、通过多种启发式方式基于每一聚类小组的代表进行概率型判断的聚合。

在本发明中，从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一小组的代表，并使用三种启发式方法进行概率型判断的聚合，分别为：

忽略每组大小和组内方差的简单平均；

仅考虑组的大小，以组的大小为权重；

同时考虑组的大小和组内方差，基于Tweedie公式收缩的加权平均，组内方差越大，需要调整的权重越大。

多特征主观概率型预测的建模与聚合方法，还包括：

在本发明中，基于多特征主观概率型预测的建模与聚合，对信息源和专家权重进行估计，针对不同问题变量所估计出的信息线索将所预测问题变量与估计的信息线索以折线图的形式表示在一张图中，可直观呈现各信息线索与问题变量的相关性；针对不同专家对信息线索所赋予权重的估计中，可以通过条形图不同的颜色表示不同的信息线索，条形图不同的长度表示不同的权重大小，可清晰看出各专家在不同信息线索上赋予的权重，并能够对比揭示哪些专家在一些相关性较高的信息线索上赋权较多；对经过聚类后选择的子群体，以不同的权重进行预测聚合，不同预测聚合方式的权重示意能够显示选择不同聚合方式的加权权重。

通过本发明提供的一种多特征主观概率型预测的建模与聚合方法，通过基于心理学领域中的透镜模型，提出了考虑取样误差和判断误差的线性预测模型，对多元专家评估进行解析化建模，并设计了能够分解专家行为特征和问题变量特征的估计算法，分别表示每个被预测变量的信息源和专家赋予不同信息源的权重。基于专家评估的解析化建模所得到的专家权重进行聚类，从每个聚类小组中挑选一名专家进行预测聚合，以少量专家代表群体智慧，以此在无历史数据校准的前提下，准确进行专家概率型预测的聚合。

参考图7，本发明还公开了一种多特征主观概率型预测的建模与聚合系统，所述系统包括：

线性预测模型建立模块110，用于获取专家概率型判断结果，基于透镜模型建立专家概率型判断结果的线性预测模型；

预测误差模块120，用于通过所述线性预测模型生成预测结果，确定预测结果的误差；

提取潜在信息源模块130，用于根据包含预测误差的预测结果提取潜在信息源，并分解问题变量特征和专家行为特征；

聚类分组模块140，用于基于所分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组；

预测聚合模块150，用于从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合。

其中，线性预测模型建立模块，所述专家概率型判断包括预测误差的概率值和不包含预测误差的概率值；

基于透镜模型及预测误差模型，对预测误差的概率值和不包含预测误差的概率值进行分析，生成分析结果；

根据所述分析结果中不含预测误差的概率判断的权重分布及预测误差，建立线性预测模型。

预测误差模块，基于线性预测模型生成的预测结果确定取样误差和判断误差；

所述取样误差取决于对信息线索的随机取样和专家如何对取样信息进行线性组合；

所述判断误差取决于专家对概率水平的认知误差；

通过所述取样误差和判断误差组合确定概率预测结果的误差。

提取潜在信息源模块，基于包含预测误差的预测结果建立概率型预测矩阵；

将所述概率型预测矩阵分解为问题变量特征矩阵和专家行为特征矩阵；

通过最大似然法对所述问题变量特征矩阵和专家行为特征矩阵进行迭代求解，生成问题变量特征和专家行为特征。

聚类分组模块，基于概率型矩阵，求解问题变量特征和专家行为特征，估算专家针对可观测的信息线索和不可观测的信息线索赋予的权重；

基于专家赋予的权重值，将相似权重值划分到同一分组，完成聚类，形成多个聚类小组。

预测聚合模块，确定聚类中心，将每个聚类小组的专家赋予的权重值与聚类中心的权重值进行距离比较，生成比较结果；

根据所述比较结果，选定估计的权重距离聚类中心最近的专家作为每一聚类小组的代表；

通过多种启发式方式基于每一聚类小组的代表进行概率型判断的聚合。

通过本发明提供的一种多特征主观概率型预测的建模与聚合系统，通过基于心理学领域中的透镜模型，提出了考虑取样误差和判断误差的线性预测模型，对多元专家评估进行解析化建模，并设计了能够分解专家行为特征和问题变量特征的估计算法，分别表示每个被预测变量的信息源和专家赋予不同信息源的权重。基于专家评估的解析化建模所得到的专家权重进行聚类，从每个聚类小组中挑选一名专家进行预测聚合，以少量专家代表群体智慧，以此在无历史数据校准的前提下，准确进行专家概率型预测的聚合。

图8示例了一种电子设备的实体结构示意图，如图8所示，该电子设备可以包括：处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令，以执行一种多特征主观概率型预测的建模与聚合方法，该方法包括：获取专家概率型判断结果，基于透镜模型建立专家概率型判断结果的线性预测模型；

通过所述线性预测模型生成预测结果，确定预测结果的误差；

根据包含预测误差的预测结果提取潜在信息源，并分解出问题变量特征和专家行为特征；

基于所分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组；

从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合。

此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的一种多特征主观概率型预测的建模与聚合方法，该方法包括：获取专家概率型判断结果，基于透镜模型建立专家概率型判断结果的线性预测模型；

通过所述线性预测模型生成预测结果，确定预测结果的误差；

根据包含预测误差的预测结果提取潜在信息源，并分解出问题变量特征和专家行为特征；

基于所分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组；

从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的一种多特征主观概率型预测的建模与聚合方法，该方法包括：获取专家概率型判断结果，基于透镜模型建立专家概率型判断结果的线性预测模型；

通过所述线性预测模型生成预测结果，确定预测结果的误差；

根据包含预测误差的预测结果提取潜在信息源，并分解出问题变量特征和专家行为特征；

基于所分解的专家行为特征确定专家对不同信息源所赋予的权重，对专家权重进行聚类，形成多个聚类小组；

从每个聚类小组中，选择估计的权重距离聚类中心最近的专家作为每一聚类小组的代表，并通过多种启发式方法进行概率型判断的聚合。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：清华大学;

上一篇：多级库存的控制方法和控制装置
下一篇：处理设备控制方法、装置、电子设备和存储介质