基于社交网络隐私协商系统的智能体行为追责方法

文献发布时间：2023-06-19 13:49:36

技术领域

本发明涉及网络隐私保护技术领域，尤其涉及一种基于社交网络隐私协商系统的智能体行为追责方法。

背景技术

快速发展的社交网络在一定程度上改变了人们之间传统的沟通交流方式，促进了信息分享的广泛发生，但也带来了严重的隐私泄露问题。

除去传统隐私保护技术，基于神经网络等人工智能技术的隐私保护方法日益兴起。此类方法将人工智能技术与隐私保护机制相结合，解决不公平、隐私侵犯、模型不安全等问题，达到高效保护用户分享的信息(如照片)等目的。如Kekulluoglu等人基于描述逻辑建立了基于智能体的互惠隐私协商体系，以协助社交网络用户在信息分享前达成隐私保护共识，起到提前避免隐私泄露的效果。在借助智能体进行隐私协商的同时，能够对智能体的行为进行追责，对于提升系统的透明、可解释性具有重要的意义。但目前关于追责的研究主要聚焦于电子投票、安全协议等方面，较少关注智能体领域。

发明内容

本发明的目的在于提供一种基于社交网络隐私协商系统的智能体行为追责方法，旨在解决当前社交网络隐私协商系统中智能体存在的不可信、不安全、恶意行为问题。

为实现上述目的，本发明采用的一种基于社交网络隐私协商系统的智能体行为追责方法，包括下列步骤：

步骤1、确定参与协商的智能体，从协商数据库中提取实际协商数据；

步骤2、判断是否进行了协商，若未进行协商，直接转到步骤6，否则，继续执行下一步骤；

步骤3、正向模拟协商过程获得所需协商过程数据，并将所述所需协商过程数据设置为正向阈值；

步骤4、逆向复现协商过程计算各个所述智能体应有的行为数据，并将所述行为数据设置为逆向阈值；

步骤5、综合所述正向阈值和所述逆向阈值判断智能体不当行为及所述不当行为的发生位置；

步骤6、输出定性追责结果，若存在责任，继续执行下一步，否则，结束追责；

步骤7、提取定性追责确定的不当行为，使用简单量化方法验证定性追责结果；

步骤8、计算责任量化值，输出定量追责结果。

其中，在步骤5综合所述正向阈值和所述逆向阈值判断智能体不当行为及所述不当行为的发生位置的过程中，还需要判断是否判别完所有的交互过程，

若已完成，继续执行步骤6；

若未完成，转回执行步骤3。

其中，所述实际协商数据包括协商过程的各智能体及其各次交互过程中的行为数据。

其中，所述正向模拟协商过程为模拟智能体完全诚实可信情况下的协商过程。

其中，在综合所述正向阈值和所述逆向阈值判断智能体不当行为及所述不当行为的发生位置的过程中，借助所述正向阈值粗略判断智能体不当行为及所述不当行为的发生位置，同时借助逆向阈值准确判断智能体不当行为及所述不当行为的发生位置。

其中，在计算责任量化值的步骤，包括：判断所述实际协商数据中是否包含文本型数据，

若无文本型数据，即仅包含数值型数据，则使用加权马氏距离方法计算；

若包含文本型数据，则使用改进Minhash方法计算。

本发明的一种基于社交网络隐私协商系统的智能体行为追责方法，以Kekulluoglu等人提出的基于智能体的互惠隐私协商体系为基础，设计实现了用于社交网络隐私协商、具有定性追责和定量追责的智能体行为追责方法，其中，定性追责方法可以准确判断隐私协商智能体是否存在不当行为并能够精准锁定不当行为具体发生位置；定量追责包含简单量化、加权马氏距离和改进Minhash 三种方法，能够量化智能体不当行为的严重程度。本发明解决了当前社交网络隐私协商系统中智能体存在的不可信、不安全、恶意行为问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的基于社交网络隐私协商系统的智能体行为追责方法的流程示意图。

图2是本发明的定性追责流程图。

图3是本发明的简单量化流程图。

图4是本发明的加权马氏距离方法流程图。

图5是本发明的改进Minhash方法实现过程示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

请参阅图1，本发明提出了一种基于社交网络隐私协商系统的智能体行为追责方法，包括下列步骤：

步骤1、确定参与协商的智能体，从协商数据库中提取实际协商数据；

步骤2、判断是否进行了协商，若未进行协商，直接转到步骤6，否则，继续执行下一步骤；

步骤3、正向模拟协商过程获得所需协商过程数据，并将所述所需协商过程数据设置为正向阈值；

步骤4、逆向复现协商过程计算各个所述智能体应有的行为数据，并将所述行为数据设置为逆向阈值；

步骤5、综合所述正向阈值和所述逆向阈值判断智能体不当行为及所述不当行为的发生位置；

步骤6、输出定性追责结果，若存在责任，继续执行下一步，否则，结束追责；

步骤7、提取定性追责确定的不当行为，使用简单量化方法验证定性追责结果；

步骤8、计算责任量化值，输出定量追责结果。

在步骤5综合所述正向阈值和所述逆向阈值判断智能体不当行为及所述不当行为的发生位置的过程中，还需要判断是否判别完所有的交互过程，

若已完成，继续执行步骤6；

若未完成，转回执行步骤3。

所述实际协商数据包括协商过程的各智能体及其各次交互过程中的行为数据。

所述正向模拟协商过程为模拟智能体完全诚实可信情况下的协商过程。

在综合所述正向阈值和所述逆向阈值判断智能体不当行为及所述不当行为的发生位置的过程中，借助所述正向阈值粗略判断智能体不当行为及所述不当行为的发生位置，同时借助逆向阈值准确判断智能体不当行为及所述不当行为的发生位置。

在计算责任量化值的步骤，包括：判断所述实际协商数据中是否包含文本型数据，

若无文本型数据，即仅包含数值型数据，则使用加权马氏距离方法计算；

若包含文本型数据，则使用改进Minhash方法计算。

所述基于社交网络隐私协商系统的智能体行为追责方法包含两个过程，分别是定性追责过程和定量追责过程。以下结合具体实例，并参照附图，对本发明进一步详细阐述。

请参阅图2，展示的是定性追责流程图，定性追责过程包含6个步骤：

步骤1、确定参与协商的智能体，从协商数据库中提取实际协商数据；

在本发明中使用的数据集为隐私协商系统中的真实协商数据，该数据集包含了协商过程的各智能体及其各次交互过程中的行为数据。由于协商数据中包含了多个智能体间的多次协商，在追责前需要提取出涉及隐私泄露的智能体相关协商数据进行后续的追责。

步骤2、判断是否进行了协商，若未进行协商，直接转到步骤6，否则，继续执行下一步骤；

主要判断获取的智能体协商数据是否为空，若为空，说明发起者智能体未进行协商便分享信息造成隐私泄露，可直接判定责任；若进行了协商，则进行后续的步骤。

步骤3、正向模拟协商过程获得所需协商过程数据，并将所述所需协商过程数据设置为正向阈值；

正向模拟协商过程主要是模拟智能体完全诚实可信环境下进行隐私协商过程，获取各智能体相关行为指标的阈值。

针对发起者智能体(in)的正向阈值为：观众列表指标(Au)包含观众数量和观众姓名集合两个正向阈值，分别表示交互过程中的观众数量和具体观众的姓名，主要用于判别交互过程中发起者智能体有无隐瞒观众的行为；积分指标(Pin)正向阈值为交互过程中发起者智能体拟支付的积分，该阈值为理论上发起者智能体支付的积分；效用指标(Uin)正向阈值需要通过效用函数计算；协商结果指标(Cr)主要用来分析发起者智能体在交互过程中的行为(如，修改信息分享请求)，并与协商者智能体在上次交互中的回应进行比较，判定发起者智能体是否存在不当行为。

针对协商者智能体(ng)的正向阈值为：敏感观众列表指标(Vng)包含敏感观众数量和敏感观众姓名集合两个正向阈值，分别表示交互过程中的敏感观众数量和具体敏感观众的姓名；权重指标(W)包含3个正向阈值，第一个为权重集合，表示不同敏感观众对协商者智能体的隐私造成损害的程度各异，第二个、第三个分别表示按照权重大小排序后的敏感观众姓名集合、敏感观众数量集合。本方法中，在可信环境下推理敏感观众列表指标阈值的同时，也会分类出不同权重及各权重下的观众集合，并统计该集合的数量；效用指标(Ung)的正向阈值为协商者智能体理论效用；积分指标(Png)的正向阈值为交互过程中协商者智能体期望得到的积分；协商结果(Cr)的正向阈值为协商者智能体对发起者智能体请求的回应结果。

步骤4、逆向复现协商过程计算各个所述智能体应有的行为数据，并将所述行为数据设置为逆向阈值；

逆向复现协商过程即从协商结果出发，依次逆向计算各个智能体应有的行为数据。

逆向阈值是完成定性追责过程的关键因素，因此对各指标的阈值获取方式进行详细介绍：

假设协商过程包含n次交互，i为协商过程中的第i次交互。

步骤4.1、判断交互次数，若为第一次(i＝1)转到步骤4.2，若为中间次(1

步骤4.2、计算第一次交互中发起者智能体观众、积分、协商结果的行为指标阈值，并计算协商者智能体敏感观众、权重、协商结果的行为指标阈值；

步骤4.3、计算中间次交互中发起者智能体观众、积分、效用值、协商结果的行为指标阈值，并计算协商者智能体敏感观众、权重、效用值、协商结果的行为指标阈值；

步骤4.4、计算最后一次发起者智能体观众、积分、效用值、协商结果的行为指标阈值，并计算协商者智能体敏感观众、权重、效用值、协商结果的行为指标阈值；

针对发起者智能体：

积分指标包含两个逆向阈值，第1个为逆向复现协商过程中根据下式(1) 求得的发起者智能体应支付的积分

公式(1)中

公式(3)中，

效用指标包含两个逆向阈值：第1个阈值为发起者智能体根据修改后的分享请求计算出的效用值

公式(5)中，t

针对协商者智能体：

效用指标包含两个逆向阈值：第1个阈值为不包含积分效用时协商者智能体的效用值

公式(6)中，t

积分指标包含一个逆向阈值：逆向阈值为根据公式(8)求得的协商者智能体期望得到的积分

公式(8)中，a

协商结果指标包含一个逆向阈值：根据下式(9)求得的逆向阈值

最后，发起者智能体和协商者智能体各指标之间也是有关联性的，当发起者智能体衡量结束发现第i次交互存在问题，需要对协商者智能体第i次及之后的交互再分析一次，得到更准确具体的衡量结果；当协商者智能体衡量结束发现第i次交互存在问题，需要对发起者智能体第i次及之后的交互再分析一次，得到更准确具体的衡量结果。

步骤5、综合所述正向阈值和所述逆向阈值判断智能体不当行为及其发生位置，判断结束后检查是否判别完所有的交互过程，若已完成，继续执行步骤6；若未完成，转回执行步骤3；

追责过程中，借助正向阈值粗略判断智能体不当行为的发生位置，同时借助逆向阈值准确判断智能体不当行为的发生位置，从而得到追责结果。在每次判断结束后，需要检查是否判别完所有的交互过程，若没有，跳转到步骤2，否则，继续后续步骤；

假设D

其中，

追责服务器对协商者智能体在协商过程中是否存在不当行为的判定公式如式(11)所示。

其中，

步骤6、综合定性追责判别过程数据，输出定性追责结果，若存在责任，继续执行下一步，否则，结束追责。

请参阅图3，展示的是简单量化流程图，定量追责过程包括以下步骤：

步骤7、提取定性追责确定的不当行为，使用简单量化方法验证定性追责结果；

简单量化方法不仅可以对定性追责结果进行验证，还能以较高效率对智能体的不当行为进行简单量化。其在考虑实际协商过程数据和对应阈值的同时，计算智能体在协商过程中不当行为相关数据的变化区间、并为不同行为指标设置不同权重(具体数值由智能体按照所代理用户的隐私保护需求决定)，以表示各指标对于智能体隐私保护的重要性。

简单量化方法的定义为：假设智能体的实际协商过程数据为

公式(12)中，Q

具体实现步骤为：

步骤7.1、计算实际协商过程的值

步骤7.2、计算各指标权重的占比

步骤7.3、借助于公式(12)，计算步骤7.1中的差值与区间距离的比值，与对应的权重占比相乘并求和，得到责任量化结果；

步骤7.4、判断是否计算完所有的交互过程，若完成，则输出简单量化结果；否则，跳转到步骤7.1。

步骤8、计算责任量化值，输出定量追责结果具体步骤如下：判断数据集中是否包含文本型数据，若不包含文本型数据，则使用加权马氏距离方法，从步骤8.a1开始执行；否则，使用改进Minhash方法，从步骤8.b1开始执行。计算结束后，输出定量追责结果。

鉴于传统的马氏距离方法无法计算包含带权重样本的集合间的距离，而为多个行为指标设置不同的权重有助于区分用户对不同行为指标的关注程度，从而使定量追责更具针对性，本发明对传统马氏距离方法进行了改进，提出了加权马氏距离方法，具体流程图如图4所示。该方法用于步骤8中无文本型数据集的计算，具体计算公式如下：

X＝diag(W(x

其中，x

基于加权马氏距离进行定量追责的步骤如下：

步骤8.a1、通过在限定区间(与简单量化方法中不当行为相关数据的变化区间相同)内随机模拟智能体行为，生成用于训练协方差矩阵的训练集，进一步获得协方差矩阵C

步骤8.a2、借助于式(14)，求得加权马氏距离值d

步骤8.a3、计算实际数据与其限定区间左右边界间的距离d

步骤8.a4、借助于式(15)，求得责任量化值Q

步骤8.a5、判断是否计算完所有的交互过程，若完成，则输出加权马氏距离结果；否则，跳转到步骤8.1。

图5是改进Minhash方法实现过程。该方法用于步骤8中包含文本型数据集的计算。

Minhash：给定通用集U及其子集

根据Minhash相关理论，集合

针对同时包含数值和文本的数据，在使用传统Minhash方法计算数据间的相似度时，若不对数据进行划分，将导致计算准确度差；若使用Shingling方法对数据进行划分，数值型数据被视作文本强行划分，破坏数值型数据的本源意义；同时Minhash方法中存在数据去重现象(将多个相同数据并为单个数据进行处理)，将降低计算准确度。为缓解这些问题，本发明提出了改进Minhash 方法：首先，对数据进行分类，以针对不同类型的数据分别进行hash计算，并采用Shingling方法对文本型数据进行划分；其次，引入权重的概念，区分不同数据的重要程度；第三，为避免数据去重的发生，对重复数据进行了单一化处理。

改进Minhash方法的具体实现步骤如下：

步骤8.b1、将数据分为文本型数据和数值型数据，并采用shingling方法将文本型数据划分为多个独立的文本块；

步骤8.b2、对分类/划分后的数据赋予权重，并根据权重进行数据的局部单一化处理。单一化处理的基本思想是在保证数据可行且不影响实验结果的前提下，修改重复数据：对于数值型数据，通过加(或减)适当的值来生成新的数据，如：初始数据为{10；15}，权重设置为{3；2}，加入权重及进行局部单一化处理后的数据为{10,15,20；15,20}；对于文本型数据，通过添加不同标记生成新的数据，如数据John的权重为3，基于权重进行数据扩充及单一化处理后的结果为John，John’，John”；

步骤8.b3、对加入权重后的数据进行全局单一化处理，其基本思想同数据的局部单一化处理；如：将{10,15,20；15,20}进行全局单一化处理后的结果为 {10,15,20；16,21}。需要注意的是，在调整数值时要同步考虑两个数据集中的相同位置，即如果对应位置的数据相同，修改后也需要相同；如果不同，修改后则需不同；

步骤8.b4、进行数据间的相似度计算，并计算最终的责任量化值。

假设数据向量为x，

公式(17)中，1≤d≤D，D为hash函数总量，D个hash函数的最小值构成数据向量x的签名矩阵

进一步地，计算数据向量x与数据向量y间的相似度。本发明中采用了两种相似度计算公式，分别如式(18)、式(19)所示。

其中，当h

同时，计算

最后借助公式(20)(21)分别计算最终的责任量化值.

以上所揭露的仅为本发明一种较佳实施例而已，当然不能以此来限定本发明之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本发明权利要求所作的等同变化，仍属于发明所涵盖的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：李龙;郝峰锐;李晶晶;古天龙;
专利申请人：暨南大学;

上一篇：基于多模态关键信息匹配的食品安全风险识别方法及系统
下一篇：一种高强度镍基合金焊管的加工工艺