掌桥专利:专业的专利平台
掌桥专利
首页

关联拓扑网络动态特征的互联网自治域类型映射方法

文献发布时间:2024-04-18 19:53:33


关联拓扑网络动态特征的互联网自治域类型映射方法

技术领域

本发明涉及关联拓扑网络动态特征的互联网自治域类型映射方法,属于计算机与信息科学领域。

背景技术

随着互联网规模和复杂度的增大以及对政治、经济利益影响的加深,自治系统对互联网的稳定运行起着愈发关键的作用。自治系统或自治域(Autonomous system,AS)是指在互联网中,一个或多个实体管辖下的所有IP网络和路由器的组合,它们对互联网执行共同的路由策略。一个自治系统通常属于互联网服务提供商、网络信息中心、互联网交换中心、互联网数据中心、内容分发网络服务提供商、高校、拥有多个网络的独立连接的组织机构。自治域类型映射是网络空间测绘的重要一步,有助于规划网络结构、制定应急方案,对于域间路由攻击检测、网络空间安全边界划分以及路由安全态势评估研究有重要意义。

目前针对自治域系统的属性研究主要集中在网络拓扑、商业关系、行业分类以及路由映射等方面,现有自治域类型映射方法都局限在自治域的静态属性,包括自治域的注册机构、描述、所属国家、地理位置、网络规模、商业关系、连接关系,由于自治域注册机构不同,存在数据不完整和数据歧义的情况,导致仅利用自治域静态属性特征针对大型互联网服务提供商、网络信息中心、互联网分发网络等大规模自治域类型映射具有较高准确率,而对于小型互联网服务提供商、高校、组织机构等小规模自治域类型映射准确率较低。

综上,现有的自治域类型映射方法主要存在以下问题:(1)由于注册信息存在数据不完整和数据歧义的情况,导致对于小型互联网服务提供商、高校、组织机构等小规模自治域类型映射准确率较低。(2)现有的方法对自治域拓扑的研究仅局限于连接关系和商业关系等静态特征,未考虑不同自治域属性的语义关系和动态特征。

发明内容

本发明的目的是针对现有方法利用的注册信息存在数据不完整和数据歧义的情况,且未考虑不同自治域属性语义关系和自治域拓扑网络动态特征,导致对于小规模自治域类型映射准确率不高的问题,提出关联拓扑网络动态特征的互联网自治域类型映射方法。

本发明涉及的原理为:首先通过whois数据库获取自治域注册信息;其次利用BERT提取注册信息语义特征,同时根据注册信息中的特定自治域属性计算不同自治域间的相似度;然后结合特定自治域属性和自治域间的相似度生成自治域拓扑网络,并利用时间注意力机制提取拓扑网络动态特征;最后融合语义特征和拓扑网络动态特征进行互联网自治域类型映射。

本发明的技术方案是通过如下步骤实现的:

步骤1,首先通过whois数据库获取自治域注册信息,利用BERT提取注册信息中注册机构、描述信息的语义特征向量c。

步骤2,使用结合特定自治域属性和自治域间相似度的自治域拓扑网络获得拓扑网络动态特征向量t。

步骤2.1,使用自治域属性信息计算自治域间的语义关系,得到自治域属性相似度矩阵。

步骤2.2,结合特定自治域属性和自治域间的相似度生成自治域拓扑网络,并利用时间注意力机制提取拓扑网络动态特征。

步骤3,融合语义特征和拓扑网络动态特征进行互联网自治域类型映射。

步骤3.1,根据语义特征向量和拓扑网络动态特征向量计算相关度向量。

步骤3.2,结合相关度向量得到自治域特征向量s。

步骤3.3,将自治域特征向量s经过线性分类器实现自治域类型映射。

有益效果

本发明针对自治域注册信息不完整的问题,提出并利用一种自治域拓扑网络动态特征提取方法,提高了互联网自治域类型映射的准确率。

附图说明

图1为本发明关联拓扑网络动态特征的互联网自治域类型映射方法原理图。

具体实施方式

为了更好的说明本发明的目的和优点,下面结合实例对本发明方法的实施方式做进一步详细说明。

实验数据中,自治域拓扑数据来自于Traceroute数据和通过RouteViews和RIPERIS采集到的BGP路由数据,每日更新并保留历史自治域拓扑关系数据,构建动态自治域拓扑关系;自治域注册信息数据来自于whois数据库。自治域类型映射实验数据见表1。

表1.自治域类型映射实验数据

实验采用精确率(Precision)评价自治域类型映射结果的结果,正确率计算方法如公式(1)所示:

其中,TP为实际为正类,预测为正类;TN为实际为负类,预测为负类;FP为实际为负类,预测为正类;TN为实际为正类,预测为负类。

具体流程为:

步骤1,首先通过whois数据库获取自治域注册信息,利用BERT提取注册信息中注册机构、描述信息的语义特征向量c。

步骤2,使用结合特定自治域属性和自治域间的相似度的自治域拓扑网络获得拓扑网络动态特征向量t。

步骤2.1,为了充分利用自治域的属性信息发掘其潜在关联,使用自治域属性信息量化指标计算自治域间的语义关系,得到自治域属性相似度矩阵。

将自治域属性信息量化。将自治域属性信息中的注册日期、状态、地理位置、自治域级别、连接数量、IP数量6类属性指标进行归一化。定义和计算方法如表1所示。

表1自治域属性信息量化指标定义

计算自治域间语义关系。通过计算自治域属性信息量化指标的相似度获取自治域间的语义关系,从整个自治域网络中捕获属性量化指标相似性特征,能够发现拓扑结构信息无法提供的潜在联系。给定自治域网络G=(V,E,R

步骤2.2,结合特定自治域属性和自治域间的相似度生成自治域拓扑网络,得到自治域网络G=(V,E,T,R),其中V是自治域网络中的自治域节点集合,E是自治域间连接关系集合,T∈R

利用采样策略在关系网络T上得到自治域v的邻域信息集合为

利用时间注意力机制提取拓扑网络动态特征,反映出自治域拓扑结构在不同的历史快照上的时间演变,对拓扑结构特性进行更加全面地表征。

根据公式(7)计算时间注意力值。

其中,D为每个时刻的节点特征向量维度,M

根据公式(9)利用softmax函数获得归一化时间注意力值。

利用多头注意力机制,聚合所有时刻的特征,得到自治域拓扑网络动态特征向量t。

步骤3,融合自治域语义特征和拓扑网络动态特征获得最终特征向量。

步骤3.1,根据公式(10)计算自治域i的语义特征向量c

根据公式(11)(12)计算相关度向量c'和t'。

步骤3.2,为了挖掘语义特征和拓扑网络动态特征的相关性,将c和c’、t和t’向量拼接,通过最大池化层对特征进行压缩,得到融合相关度的语义特征向量

步骤3.3,将自治域特征向量s经过线性分类器实现自治域类型映射。

测试结果:随机选取2000个自治域进行本次测试,其中1600个作为训练集,400个作为测试集。模型的精确率为:大型互联网服务提供商为100%、网络信息中心为100%、互联网交换中心为95.5%、互联网数据中心为93.2%、内容分发网络服务提供商为90.5%、小型互联网服务提供商未86.4%、高校为85.2%、其他组织机构为87.3%,对于小型互联网服务提供商、高校、组织机构等小规模自治域类型映射具有良好的效果。

以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种自治域级互联网拓扑可视化方法
  • 一种基于地理信息的自治域级互联网拓扑可视化方法
技术分类

06120116336918