掌桥专利:专业的专利平台
掌桥专利
首页

一种智算中心的组网系统

文献发布时间:2024-04-18 20:02:18


一种智算中心的组网系统

技术领域

本发明涉及智算中心组网技术领域,尤其是一种智算中心的组网系统。

背景技术

智算中心是智慧时代最主要的计算力生产中心,它以融合架构计算系统为平台,以数据为资源,能够以强大算力驱动AI模型对数据进行深度加工,源源不断产生各种智慧计算服务,并通过网络以云服务形式供应给组织及个人,智算中心要满足开放标准、集约高效和普适普惠三个基本要求。

目前智算中心组网均是通过光纤进行数据传输,而在一些特殊情况,如自然灾害面前导致光纤受损断裂,则智算中心无法进行有效组网,各类计算服务数据无法发送,导致数据和信息失效,同时由于智算中心要求智算中心从硬件到软件、从芯片到架构、从建设模式到应用服务都应该是开放的、标准的,导致一些重要机密数据在传输时出现泄漏,会造成一定的损失。

发明内容

为解决现有技术中存在的上述问题,本发明提供一种智算中心的组网系统,通过数据传输模块的两种传输类型的智能检测切换,解决了现有传输组网方式的单一性问题,在遇到光纤损坏或大规模断线时可以通过卫星通讯组网传输,保证了智算中心可以持续提供高效的智能计算服务,为通讯修复提供有力的保障,同时通过识别发送端需求对网传数据进行加密传输,保证了机密数据计算传输的安全性。

为实现上述目的,本发明采用下述技术方案:

在本发明一实施例中,提出了一种智算中心的组网系统,该系统包括:主控计算模块、数据传输模块和接收端模块;主控计算模块包括终端设备模块和内部计算模块,终端设备模块基于RoCE网络收发网传数据及承载内部计算模块进行数据处理,内部计算模块基于DPU并结合GPU进行数据的计算和处理并进行传输;数据传输模块包括光纤传输模块、卫星传输模块和检测切换模块,光纤传输模块利用光纤智能组网进行网传数据的传输,卫星传输模块基于EMS

进一步地,主控计算模块还包括云平台处理模块,云平台处理模块在接收和发送网传数据时基于互联网云平台对数据进行增强去噪处理;云平台处理模块包括识别划分子模块和归类缓存子模块,识别划分子模块对接收和发送的网传数据去噪后进行识别并按不同数据类别和发送端发送的编号进行划分,归类缓存子模块对划分后的数据按照划分的不同类别和编号分别进行云缓存。

进一步地,内部计算模块包括数据处理子模块和并行计算子模块,数据处理子模块基于DPU对网传数据进行自学习计算处理,并行计算子模块内嵌于数据处理子模块中,对大规模网传数据进行并行计算训练。

进一步地,光纤智能组网基于智能检测接线器进行自动切换并行传输线路,组网时以传输信噪比最大的网端作为主要网关设备进行通讯优化,当检测到其他线路传输信噪比高于先前确定的主要网关设备时自动切换传输信噪比高的为主要网关设备进行通讯优化;EMS

进一步地,数据传输模块还包括加密处理模块,加密处理模块对网传数据进行加密处理;加密处理模块包括请求读取子模块和加密执行子模块,请求读取子模块根据网传数据读取是否包含加密传输的请求,加密执行子模块在读取到加密传输的请求时对发送端的网传数据进行加密处理并生成密匙返回至发送端。

进一步地,检测切换模块包括运行监测子模块和智能切换子模块,运行监测子模块对光纤传输模块的运行状态进行实时监测,同时控制卫星传输模块处于待机状态,智能切换子模块在检测到光纤传输模块运行异常时立即控制异常段范围内的卫星传输模块启动运行接替数据传输。

进一步地,接收处理模块包括解密子模块和数据整理子模块,解密子模块根据密匙对返回的加密网传数据进行解密处理,数据整理子模块根据大数据识别发送端的数据整理习惯对数据进行整理显示。

有益效果:

本发明通过数据传输模块的两种传输类型的智能检测切换,解决了现有传输组网方式的单一性问题,在遇到光纤损坏或大规模断线时可以通过卫星通讯组网传输,保证了智算中心可以持续提供高效的智能计算服务,为通讯修复提供有力的保障,同时通过识别发送端需求对网传数据进行加密传输,保证了机密数据计算传输的安全性。

附图说明

图1是本发明智算中心的组网系统传输架构图。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神,应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

根据本发明的实施方式,提出了一种智算中心的组网系统,通过数据传输模块的两种传输类型的智能检测切换,解决了现有传输组网方式的单一性问题,在遇到光纤损坏或大规模断线时可以通过卫星通讯组网传输,保证了智算中心可以持续提供高效的智能计算服务,为通讯修复提供有力的保障,同时通过识别发送端需求对网传数据进行加密传输,保证了机密数据计算传输的安全性。

下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。

图1是本发明一实施例的智算中心的组网系统框图。如图1所示,该系统包括:主控计算模块、数据传输模块和接收端模块;主控计算模块包括终端设备模块和内部计算模块,终端设备模块基于RoCE网络收发网传数据及承载内部计算模块进行数据处理,内部计算模块基于DPU并结合GPU进行数据的计算和处理并进行传输,GPU可以进行大规模并行计算,提高计算效率和精度,通过GPU加持的DPU可以大大提高计算性能。

RoCE(RDMA over Converged Ethernet)网络即配置存储网络,内嵌数据传输模型用于网传数据的收发及数据承载计算;DPU即中央处理器分散处理计算单元;GPU即图形处理器单元。

内部计算模块包括数据处理子模块和并行计算子模块,数据处理子模块基于DPU对网传数据进行自学习计算处理,并行计算子模块内嵌于数据处理子模块中,对大规模网传数据进行并行计算训练,通过在DPU中内嵌GPU的高效率和高精度的大规模并行计算,实现DPU的自学习,大大增强了DPU的计算性能。

主控计算模块还包括云平台处理模块,云平台处理模块在接收和发送网传数据时基于互联网云平台对数据进行增强去噪处理;云平台处理模块包括识别划分子模块和归类缓存子模块,识别划分子模块对接收和发送的网传数据去噪后进行识别并按不同数据类别和发送端发送的顺序编号进行划分,归类缓存子模块对划分后的数据按照划分的不同类别和编号分别进行云缓存。

数据传输模块包括光纤传输模块、卫星传输模块和检测切换模块,光纤传输模块利用光纤智能组网进行网传数据的传输,卫星传输模块基于EMS

光纤智能组网基于智能检测接线器进行自动切换并行传输线路,组网时以传输信噪比最大的网端作为主要网关设备进行通讯优化,当检测到其他线路传输信噪比高于先前确定的主要网关设备时自动切换传输信噪比高的为主要网关设备进行通讯优化;EMS

EMS

数据传输模块还包括加密处理模块,加密处理模块对网传数据进行加密处理,提升了机密数据传输的安全性,为特殊客户提供高满意度的智算服务。

接收端模块包括接收处理模块和认证模块,接收处理模块基于移动端软件对接收的计算数据进行查看前的预处理,认证模块对查询计算数据的用户进行识别认证。

检测切换模块包括运行监测子模块和智能切换子模块,运行监测子模块对光纤传输模块的运行状态进行实时监测,同时控制卫星传输模块处于待机状态,智能切换子模块在检测到光纤传输模块运行异常时立即控制异常段范围内的卫星传输模块启动运行接替数据传输,为智算中心的持续高效服务提供保障。

加密处理模块包括请求读取子模块和加密执行子模块,请求读取子模块根据网传数据读取是否包含加密传输的请求,可根据客户需求选择数据加密传输,同时可以在读取数据时识别数据类型判断重要性并给出建议,提供更优质的智算服务,加密执行子模块在读取到加密传输的请求时对发送端的网传数据进行加密处理并生成密匙返回至发送端。

接收处理模块包括解密子模块和数据整理子模块,解密子模块根据密匙对返回的加密网传数据进行解密处理,数据整理子模块根据大数据识别发送端的数据整理习惯对数据进行整理显示,实现根据客户习惯对数据进行整理,提升智算服务的满意度。

具体实施时在某地出现大面积断网的情况时由运行监测子模块检测状态,随后发出紧急信号并传输至智能切换子模块,由智能切换子模块发出切换组网状态信息至主控计算模块进行处理后发出执行信号,然后系统启动卫星传输模块配合主控计算模块EMS

终端设备模块基于RoCE网络收发网传数据及承载内部计算模块进行数据处理,内部计算模块基于DPU并结合GPU进行数据的计算和处理并进行传输,此种传输方法确保在光纤传输失效的情况下也能维持智算中心的内部及智算中心与外部接收端模块之间的数据信息正常互交,不受光纤失效的影响,组网时效性好。

以上所使用的术语“模块”,可以是实现预定功能的软件和/或硬件的组合。尽管以上实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

应当注意,尽管在上文详细描述中提及了智算中心的组网系统的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

本发明提出的智算中心的组网系统,通过数据传输模块的两种传输类型的智能检测切换,解决了现有传输组网方式的单一性问题,在遇到光纤损坏或大规模断线时可以通过卫星通讯组网传输,保证了智算中心可以持续提供高效的智能计算服务。

虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包含的各种修改和等同布置。

对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

相关技术
  • 智算中心的温度控制方法、其装置以及智算中心系统
  • 一种智算中心电源弹性调度系统及其控制方法
技术分类

06120116582870