掌桥专利:专业的专利平台
掌桥专利
首页

一种基于隐私计算的心理健康评估方法

文献发布时间:2023-06-19 11:21:00


一种基于隐私计算的心理健康评估方法

技术领域

本发明涉及机器学习技术领域,具体涉及一种基于隐私计算的心理健康评估方法。

背景技术

随着当今社会许多公民的工作压力、学习压力、社交压力和生存压力的增加,越来越多的人存在这心理健康的问题,一些关于心理健康测评系统及方法也为解决此现象而应运而生。

随着机器学习技术和大数据技术的不断发展,基于机器学习的心理健康评估方法得到不断地发展,机器学习能够借助大量数据自动学习并构建智能评估模型,将用户的基本信息数据和历史行为数据作为模型评估心理健康的其中一项标准,使得评估结果更为可靠。专利号CN 112530546A公开了一种基于K-means聚类与XGBoost算法的心理预判方法及系统,该方法利用机器学习的方法,基于已知样本中的决定性特征,建立和训练基于样本决定性特征的心理预判模型;获取新个体的决定性特征数据,根据基于样本决定性特征的心理预判模型得到该新个体的心理健康状况,根据结果来预判学生心理健康。该方法利用机器学习中的XGBoost算法提取关键的决定性特征,有助于更加准确地进行心理健康状态评估。在适当调参后,在测试集上进行测试集测试,准确率能够有所提高,说明效果明显,模型普适性高。虽然已经出现的这些心理健康测评的系统能够在一定程度上对用户的心理健康问题进行检测,但是在这个数据和信息利益化的时代,用户填写的数据没有得到很好的保密,存在着信息泄露的风险。

发明内容

为了解决上述问题,本发明提供一种基于Logistic回归和隐私计算的心理健康评估方法,该方法能够提高心理健康评估的准确性并保障用户数据的安全性。

一种基于隐私计算的心理健康评估方法,包括以下步骤:

S1、获取用于测试用户的心理健康水平的随机性数据,进行预处理,得到预处理后的用户心理健康测试数据;

S2、将预处理后的用户心理健康测试数据进行Paillier同态加密,得到加密数据;

S3、将加密数据送入心理健康状态评估模型中,判断该用户是否具有心理症状及其严重程度如何,得到评估结果。

进一步的,数据的获取包括:在云环境中,基于症状自评量表SCL-90,利用心理学和统计学的原理和方法搜集心理健康水平的随机性数据,具体包括以下过程:

S1、症状自评量表SCL-90包含10个维度的测评因子,10个维度中包含了90个测评因子;将测评因子导入心理健康测评系统,生成相应的测试问题列表链接入口或者二维码入口,用户通过入口填写数据,用户填写的数据会存入云环境中;

S2、基于SCL-90的标准对用户填写的数据进行相应的统计,得到用于测试用户的心理健康水平的随机性数据。

进一步的,所述预处理包括:S1、数据选择:将用户心理健康测试的随机性数据里的无用信息进行删除;S2、数据清洗:对存在冗余、不完整、异常情况的数据进行删除,得到预处理后的用户心理健康测试数据。

进一步的,步骤S2中,将预处理后的用户心理健康测试数据进行Paillier同态加密,得到加密数据,具体包括:S21、用户使用密钥生成算法生成自身的公/私钥对;S22、用户使用公钥对预处理后的用户心理健康测试数据进行同态加密。

进一步的,心理健康状态评估模型的构建和训练过程包括:

S31、根据已知用户某段时间的症状水平,利用线性回归方式建立样本特征与权重的线性组合,并使用Sigmoid函数来拟合样本点的分布及其变化轨迹;

S32、基于极大似然估计法求得该拟合的损失函数;

S33、利用梯度下降法或牛顿法对所述Logistic回归方法中的回归系数进行优化求解,迭代得出最优回归系数;

S34、根据计算结果得出训练好的心理健康状态评估模型。

有益效果:

1.本发明考虑到用户心理健康测试数据的安全性,引入了隐私计算的方法,通过对用户填写的数据进行同态加密计算,让心理健康测评服务提供方无法获得用户的明文数据,将隐私计算与心理健康测试技术的结合,在测试用户心理健康的同时也在隐私数据保护方面给予了很大的安全保障。

2.本发明将心理健康测评放置到云环境中进行,使训练参数能够得到及时的更新以及便于用户填写测试数据。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种基于Logistic回归与隐私保护的心理健康评估方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请实例涉及Logistic回归和同态加密,其中,logistic回归是一种广义线性回归,可以对自变量和因变量之间的复杂非线性关系进行回归分析。线性回归与逻辑回归具有相同的特性,都具有w′x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w′x+b作为因变量,即y=w′x+b,而logistic回归则通过函数L将w′x+b对应一个隐状态p,p=L(w′x+b),然后根据p与1-p的大小决定因变量的值。如果L是logistic函数,就是logistic回归,如果L是多项式函数就是多项式回归。logistic回归的因变量可以是二分类的,也可以是多分类的,实际中最为常用的就是二分类的logistic回归。

同态加密是基于数学难题的计算复杂性理论的密码学技术。对经过同态加密的数据进行处理得到一个输出,将这一输出进行解密,其结果与用同一方法处理未加密的原始数据得到的输出结果是一样的。由于这个良好的性质,人们可以委托第三方对数据进行处理而不泄露信息。具有同态加密的加密函数是指两个明文a、b满足

本实施例提供一种基于logistic回归和隐私保护的心理健康评估方法,请参阅图1,图1为本申请实例提供的一种基于Logistic回归与隐私保护的心理健康评估方法的流程示意图。如图1所示,在一种优选实施方式中,基于Logistic回归与隐私保护的心理健康评估方法包括但不限于如下步骤:

首先在云环境中部署完心理健康评估系统,包括:按照SCL-90症状自评量表所提供的测试因子导入到心理健康评估系统中,测试因子导入生成对应二维码测试入口或者链接测试入口,再将心理健康测试试题导入到云环境中,用户可以通过二维码或者链接进入到心理健康测试环境中进行答题,用户生成的测试数据会加密存储到云环境中。云环境的引入为及时更新训练好的参数和常模提供了条件。

S1、在云环境中部署完心理健康评估系统后,获取用于测试用户的心理健康水平的随机性数据,将数据进行预处理,得到预处理后的用户心理健康测试数据。

本实施例中,收集数据的标准基于症状自评量表SCL-90。在云环境中,基于症状自评量表SCL-90,利用心理学和统计学的原理和方法搜集心理健康水平的随机性数据,具体包括以下过程:

S11、症状自评量表SCL-90包含10个维度的测评因子,10个维度中包含了90个测评因子,症状自评量表SCL-90包含有较广泛的精神病症状学内容,从感觉、情感、思维、意识、行为直至生活习惯、人际关系、饮食睡眠等,均有涉及,并采用10个维度分别反映10个方面的心理症状情况。测验的十个测评因子分别为:躯体化、强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执、精神病性及其他因子,每一个测评因子反映出个体某方面的症状情况,通过测评因子可了解症状分布特点。评定的时间范围为“现在”或者是“最近一个星期”的实际感觉。将测评因子导入心理健康测评系统,生成相应的测试问题列表链接入口或者二维码入口,用户通过入口填写数据,用户填写的数据会存入云环境中;

S12、基于SCL-90的标准对用户填写的数据进行相应的统计,得到用于测试用户的心理健康水平的随机性数据。

所述预处理包括数据选择和数据清洗等,剔除掉数据中的无效信息,可以有效提高心理健康状态评估模型的评估精度。

数据选择:将用户心理健康测试的随机性数据里的无用信息进行删除,例如:姓名,性别,年龄等。

数据清洗:对存在冗余、不完整、异常情况的数据进行删除,以提高模型训练效率和精度。

S2、将预处理后的用户心理健康测试数据进行Paillier同态加密,得到加密数据。该步骤具体包括:

S21、用户使用密钥生成算法生成自身的公/私钥对;

S22、用户使用公钥对预处理后的用户心理健康测试数据进行同态加密,得到加密数据。

本实施例中,Paillier密钥生成算法的计算过程包括:

用户使用密钥生成算法生成自身的公/私钥对包括:输入安全参数k,选择一个长为k比特的RSA模数n=pq,还选择一个元素

使用公钥加密数据的过程包括:给定一个明文i∈Z

S3、将加密数据送入心理健康状态评估模型中,心理健康评估模型将加密数据与其对应指标权重进行密文计算,判断该用户是否具有心理症状及其严重程度如何,得到评估结果。用户使用私钥对密文结果进行解密,得到评估结果对应的心理健康症状及其严重程度。

用户使用私钥对密文结果进行解密的过程为:令L(x)=(x-1)/n,可以计算明文m=[L(c

没有:自觉并无该项问题(症状);

很轻:自觉有该问题,但发生得并不频繁、严重;

中等:自觉有该项症状,其严重程度为轻到中度;

偏重:自觉常有该项症状,其程度为中到严重;

严重:自觉该症状的频度和强度都十分严重。

在一种优选实施方式中,采用Logistic回归方法构建心理健康状态评估模型,Logistic回归方法建立模型的过程包括:

构造预测函数:φ(z)=1/(1+e

构造损失函数:

优化损失函数并得出最优权重值:

其中,预测函数

在一种优选实施方式中,心理健康状态评估模型的训练包括:

S31、根据已知用户某段时间的症状水平,利用线性回归方式建立样本特征与权重的线性组合,并使用Sigmoid函数来拟合样本点的分布及其变化轨迹;

S32、基于极大似然估计法求得该拟合的损失函数;

S33、利用梯度下降法或牛顿法对所述Logistic回归方法中的回归系数进行优化求解,迭代得出最优回归系数;

S34、根据最优回归系数的计算结果得出训练好的心理健康状态评估模型。

本实施例所述方法不用于无心理症状者心理健康程度比较。

上述实施例给出了一种基于Logistic回归与隐私保护的心理健康评估方法。在云环境中基于SCL-90收集并整理用户心理健康测试数据,同时使用Paillier同态加密的方式进行密文运算,并使用Logistic回归的方式对用户的加密数据进行训练建立心理健康状态评估模型,将测试数据与加密机制进行有效结合,使得在心理健康评估服务过程中,用户信息可用不可见,从而实现用户信息的隐私保护机制防止用户的隐私数据泄露,在不泄露用户隐私的同时得到用户的心理健康症状及其严重程度的评估结果。在本方法中,以症状自评表SCL-90作为心理健康测评基础,使用极大似然法和梯度下降法对采集的数据进行训练得到每个指标所占的权重,在此基础上使用基于隐私计算的算法对用户数据进行加密计算,随之得出相应的密文结果,最后使用训练后的心理健康状态评估模型得出用户的心理健康测评结果,使得模型的评估结果准确性大大提高。

需要说明的是,本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-0nly Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。

以上所述仅是本申请的具体实施方式,应当指出,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 一种基于隐私计算的心理健康评估方法
  • 一种基于隐私信息检测的数据隐私性量化评估方法
技术分类

06120112898181