一种基于LSTM的流量分类方法
文献发布时间:2023-06-19 11:22:42
技术领域
本发明涉及网络加速应用领域,具体涉及一种基于LSTM的流量分类方法。
背景技术
在游戏加速领域中,存在两种需要加速的连接种类:带宽加速和延迟加速。带宽加速指的是加快游戏、网页等的下载速度;延迟加速指降低联机游戏时的网络延迟。游戏加速提供者需要为这两种加速需求采购不同的运营商线路,并且在加速游戏时区分游戏产生的连接的种类,精准地投放到两种线路中。而在传统工艺中,一般是通过人工方式去采集不同游戏、不同连接的线路类型以确定其加速形式,但此举人力消耗巨大,确认效率比较低。
公开于该背景技术部分的信息仅仅旨在加深对本发明的总体背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
为解决上述技术问题,本发明提出了一种基于LSTM的流量分类方法,以达到降低人工统计的工作强度、提高了游戏的适应性和提高了用户体验的目的。
为达到上述目的,本发明的技术方案如下:
一种基于LSTM的流量分类方法,其步骤具体如下:
(1)、构建LSTM网络;
(2)、收集全球域名,并在收集过程中对域名进行解析,将其放入训练数据集中;
(3)、手动标记步骤(2)中的域名是否用作CDN功能;
(4)、将训练数据集输入到LSTM网络中,通过反向传播算法更新网络中的权重,完成分类器的构建;
(5)、分类器接受到新的连接,对其进行分析;
(6)、选择对应的加速方法。
作为优选的,步骤(5)中分析过程如下:
(1-1)、若连接为443,读取新连接的首个数据包,将其作为TLS的ClientHello数据包解析;若其中存在SNI字段,则将其取出作为连接的目标域名;
(1-2)、若连接为80,读取新连接的首个数据包,将其作为HTTPHEADER数据格式进行解析;若其中存在Host字段,将值取出作为连接的目标域名。
(2)、对上述域名的CNAME值进行解析,若存在,则将CNAME值输入分类器进行分类;若没有CNAME值,则直接将原始域名输入分类器分类。
(3)、根据步骤(2)中的分类输出以确定该连接的加速方案。
本发明具有如下优点:
本发明通过利用LSTM网络构建加速器,利用训练好的分类器对域名进行下载与非下载用途的分类,提升了加速服务队各个域名的辨别能力,达到降低人工统计的工作强度、提高了游戏的适应性和提高了用户体验的目的。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述。
本发明提供了一种基于LSTM的流量分类方法,其工作原理是通过利用LSTM网络构建加速器,利用训练好的分类器对域名进行下载与非下载用途的分类,提升了加速服务队各个域名的辨别能力,达到降低人工统计的工作强度、提高了游戏的适应性和提高了用户体验的目的。
下面结合实施例和具体实施方式对本发明作进一步详细的说明。
一种基于LSTM的流量分类方法,其步骤具体如下:
(1)、构建LSTM网络;
(2)、收集全球域名,并在收集过程中对域名进行解析,将其放入训练数据集中;
(3)、手动标记步骤(2)中的域名是否用作CDN功能;
(4)、将训练数据集输入到LSTM网络中,通过反向传播算法更新网络中的权重,完成分类器的构建;
(5)、分类器接受到新的连接,对其进行分析;
(5-1-1)、若连接为443,读取新连接的首个数据包,将其作为TLS的ClientHello数据包解析;若其中存在SNI字段,则将其取出作为连接的目标域名;
(5-1-2)、若连接为80,读取新连接的首个数据包,将其作为HTTPHEADER数据格式进行解析;若其中存在Host字段,将值取出作为连接的目标域名。
(5-2)、对上述域名的CNAME值进行解析,若存在,则将CNAME值输入分类器进行分类;若没有CNAME值,则直接将原始域名输入分类器分类。
(5-3)、根据步骤(5-2)中的分类输出以确定该连接的加速方案。
(6)、以步骤(5-3)确认的加速方案进行加速。
本发明的具体使用步骤如下:
现今的游戏领域,与下载相关的,服务器大多构建在CDN网络上,CDN网络的域名是有一定辨识度的。
当一个TCP连接建立时,通过读取TLS头包中的SNI字段,或HTTP头中的Host字段获取连接的目标域名,判断目标域名是否属于下载类域名,即可决定当前连接的处理方式是加速带宽还是加速延迟。
由于域名通常由英文单词组成,以点号连接,因此可以通过点号将域名分为若干个单词;根据单词字典,对分割后的域名单词做one-hot编码。
记编码后的向量为M
若此域名存在CNAME,则M=γM
当接受到新的连接时,
若连接为443,读取新连接的首个数据包,将其作为TLS的ClientHello数据包解析;若其中存在SNI字段,则将其取出作为连接的目标域名;
若连接为80,读取新连接的首个数据包,将其作为HTTPHEADER数据格式进行解析;若其中存在Host字段,将值取出作为连接的目标域名。
将上述域名的CNAME值进行解析,若存在,则将CNAME值输入分类器进行分类;若没有CNAME值,则直接将原始域名输入分类器分类。
根据对应的分类输出以确定该连接的加速方案。
通过以上的方式,本发明所提供的一种基于LSTM的流量分类方法,通过利用LSTM网络构建加速器,利用训练好的分类器对域名进行下载与非下载用途的分类,提升了加速服务队各个域名的辨别能力,达到降低人工统计的工作强度、提高了游戏的适应性和提高了用户体验的目的。
以上所述的仅是本发明所公开的一种基于LSTM的流量分类方法的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
- 一种基于LSTM的流量分类方法
- 一种基于LSTM的农产品品质分类方法