掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及一种高性能计算应用的性能监测装置及系统,属于高性能计算技术领域。

背景技术

作为数据中心的传统技术,高性能计算技术一直以来都具有举足轻重地位。如何监测高性能计算应用,来确定一个高性能计算应用是否适合当前高性能计算集群,以及是否能够效率最大化的利用当前平台,是高性能计算领域重要的技术问题,也是高性能计算集群运维人员、应用推广人员以及普通用户所关注的,其中的关键在于监测的系统。

目前市场上的性能监测装置一般都包括数字化模块,首先,需要利用数字化模块从众多因素中提取影响最大的关键因素,作为评测指标;其次,通过编程模块建立性能评测程序集,设定约束条件,形成测试题目,按照测试方法进行测试,在此过程中需要使用计算模块进行计算,并且依据标准对测试结果进行定性和定量评估,展示在性能监测装置的外部。

但是现有的性能监测用系统正常工作时,计算模块与并行开发模块之间只有单纯的数值传输,计算模块得出的高性能数值传输至开发模块后,开发模块中需要对高性能数值进行多次运算,内部的数值交换不够充分,外界数值一直在输入,计算过程会随之重复,从而导致系统的计算耗时较久,并且在数据进入之前,只简单的对其进行分类,并未考虑到系统内部的计算资源分配和应用处理的能力,在数据导入过多时,系统无法处理,会造成一定的错乱,得到错误的结果,从而影响后续的工作。

发明内容

本发明要解决的技术问题是:提供一种高性能计算应用的性能监测装置及系统,可以有效解决背景技术中现有的性能监测用系统正常工作时,计算模块与并行开发模块之间只有单纯的数值传输,计算模块得出的高性能数值传输至开发模块后,开发模块中需要对高性能数值进行多次运算,内部的数值交换不够充分,外界数值一直在输入,计算过程会随之重复,从而导致系统的计算耗时较久,并且在数据进入之前,只简单的对其进行分类,并未考虑到系统内部的计算资源分配和应用处理的能力,在数据导入过多时,系统无法处理,会造成一定的错乱,得到错误的结果,从而影响后续的工作的问题。

本发明采取的技术方案为:一种高性能计算应用的性能监测装置,包括监测装置主体,监测装置主体的内部左侧设置有评测模块,评测模块的一侧设置有计算模块,计算模块的底端设置有并行开发模块,并行开发模块远离评测模块的一侧设置有容错模块,检测装置主体的表面设置有显示装置,计算模块与并行开发模块之间设置有数据传输线。

优选地,上述评测模块与容错模块沿计算模块的中轴面对称设置,评测模块与容错模块之间电性连接。

一种高性能计算应用的性能监测用系统,包括评测模块、计算模块、并行开发模块、容错模块和显示装置;

其中,评测模块将系统规模、系统功能、系统性能三个方面对系统进行评测,并且对系统应用采用典型数值模式来完成评测;

计算模块包括高性能通用处理器、加速处理器,以及异构混合高性能处理器,还包括能彻底突破功耗墙、访存墙或性能墙障碍的碳纳米管、低温超导量子管和忆阻器,以及基于概率、认知的以类脑、纳米光学、超导量子器件为基础的新型计算模型建立的新型处理器,评测模块完成评测后将高计算数据送入计算模块中进行计算;

并行开发模块包括内存存储单元和多个编程单元,多个编程单元在不同的环境下采用多种编程语言混合开发编程的数据,每个编程单元得到一个任务,多个任务并行存储在内存储存单元中,多个编程单元可以共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,提供灵活的任务调度策略单次调用多个程序和数据结构,计算后的数据在并行开发模块中进行分类,与不同的编程语言相配合工作,共同储存在内存存储单元中,并通过显示装置展现出来;

容错模块为数字化模块和计算模块提供可靠性保障技术和并行容错方法,在评测模块评测系统不合格时,容错模块得到指令停止系统的工作,在计算模块与并行开发模块运行时,容错模块实时监测计算模块的准确率和并行开发模块的承载率。

优选地,上述高性能通用处理器采用向量化、持续增宽的SIMD设计,该SIMD设计在支持浮点/定点乘加运算的前提上将单个功能部件的数据宽度增加到了512位宽、8个长整数或双精度向量。

优选地,上述并行开发模块中内存存储单元利用新型存储介质设计混合多层次存储结构,通过利用I/O局部性,在多个存储层次处理响应I/O访问请求,以提供高带宽、可均衡扩展的I/O能力,同时,采用软件存储和服务器平台,实现面向存储的功能定制、并发I/O性能优化功能,I/O性能优化功能是指通过利用I/O局部性,在多个存储层次处理响应I/O访问请求。

优选地,上述计算模块将计算后的数据送入并行开发模块中配合并行开发模块的工作,消除存储单元的瓶颈(以多层次存储结构在不同层次上实现计算与存储相融合就近处理数据),研究计算与存储融合的体系结构,以及计算与存储微观集成的体系结构;以新型存储器件技术、三维封装技术和互连技术为基础,根据技术成熟度和应用需求,在宏观和微观的不同层次上实现计算与存储相融合就近处理数据,来完成数据分配工作。

优选地,上述忆阻器具备逻辑计算能力,可以同时进行图像处理运算与存储融合的结构设计,在图像数据的存储位置上即可进行简单的图像处理操作;面向大数据处理,研究设计数据查询、排序、聚合数据的处理操作。

优选地,上述系统规模指高性能计算系统所能提供的理论计算峰值性能、处理器核数、存储容量等反映系统实际资源规模的量化指标;系统功能指高性能计算系统对多个应用提供的功能支撑;系统性能包括系统单项性能和系统综合性能,系统单项性能指系统处理器核的浮点计算能力、系统单节点计算能力、高性能计算网络数据交换能力和系统I/O能力的单项性能指标;系统综合性能指典型数值模式在高性能计算系统可获得的持续计算能力、系统软、硬件配置是否合理、运行是否协调,包括系统的可扩展性、平衡性、容错性、稳定性、易用性、可靠性及场地环境支撑能力的指标。

优选地,上述在应用评测指标中,根据每道测试题目的业务需求和测试目的设定评测指标,包括在固定问题规模,满足时效需求前提下,完成计算任务所需的最小系统资源配置、最短时间。

优选地,上述高性能计算系统在底层硬件架构、系统软件层都设置有平衡模块,来充分考虑I/O性能,使系统的计算能力和数据访问能力能够达到平衡。

本发明的有益效果:与现有技术相比,本发明的效果如下:

1)本发明中,通过计算模块和并行开发模块的设置,对高性能计算的数据进行合理性的检查,在一定的时间内,由多个处理器共同完成1个计算任务,以提高计算效率,缩短计算时间,并行开发模块中多个编程单元在不同的环境下采用多种编程语言混合开发编程的数据,每个编程单元得到一个任务,多个任务并行存储在内存储存单元中,多个编程单元可以共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,因此获得较高的互联网络带宽和较低的延迟,进一步提高并行计算效率,并且混合开发编程可以有效减少数据重复的情况发生,提高了扩展能力,使系统的计算能力和数据访问能力能够达到平衡;

2)本发明中,通过容错模块的设置,保障了系统的稳定性,不仅对整个系统的各个模块提出了一定的指标要求,还可以保障系统性能均衡,运行稳定,结合外界的软件支撑系统可以获得更高的计算效率和更好的使用效果;

3)本发明中,通过评测模块的设置,由于对系统评测主要考虑系统理论/持续计算峰值性能、系统整体性能是否均衡、单核CPU峰值性能及缓存/内存配比是否合理、应用软件、系统软件是否满足需求等;对应用评测主要考虑应用在各测试系统的持续计算性能、并行可扩展性与其对计算资源需求的映射关系,结合测试系统计算能力、I/O能力、高速计算网络数据交换能力计算出目标系统配置规模;可以判断该系统是否与应用相匹配,在考虑系统性能属性和应用计算特征时,可以评测系统与应用之间的相似度和差异度,将系统中的计算与典型数值模式相关联,为典型数值模式在计算系统中的计算评测提供依据,能提供足够的作业管理调度制度,提供计算资源灵活调配的应用需求,进而提高系统的稳定性。

附图说明

图1为本发明一种高性能计算应用的性能监测装置的剖面图;

图2为本发明一种高性能计算应用的性能监测用系统的流程图;

图3为本发明一种高性能计算应用的性能监测用系统中并行开发模块的工作原理图;

图4为本发明一种高性能计算应用的性能监测用系统中评测模块的工作流程图。

具体实施方式

下面结合附图及具体的实施例对本发明进行进一步介绍。

实施例1:如图1-4所示,一种高性能计算应用的性能监测装置,包括监测装置主体,监测装置主体的内部左侧设置有评测模块,评测模块的一侧设置有计算模块,计算模块的底端设置有并行开发模块,并行开发模块远离评测模块的一侧设置有容错模块,检测装置主体的表面设置有显示装置,计算模块与并行开发模块之间设置有数据传输线,评测模块与容错模块沿计算模块的中轴面对称设置,评测模块与容错模块之间电性连接,方便数据传输,减少传输损耗。

实施例2:如图1-4所示,一种高性能计算应用的性能监测用系统,包括评测模块、计算模块、并行开发模块、容错模块和显示装置,高性能计算系统在底层硬件架构、系统软件层都设置有平衡模块,来充分考虑I/O性能,使系统的计算能力和数据访问能力能够达到平衡;

其中,评测模块将系统规模、系统功能、系统性能三个方面对系统进行评测,系统规模指高性能计算系统所能提供的理论计算峰值性能、处理器核数﹑存储容量等反映系统实际资源规模的量化指标;系统功能指高性能计算系统对多个应用提供的功能支撑;系统性能包括系统单项性能和系统综合性能,系统单项性能指系统处理器核的浮点计算能力、系统单节点计算能力、高性能计算网络数据交换能力和系统I/O能力的单项性能指标;系统综合性能指典型数值模式在高性能计算系统可获得的持续计算能力、系统软、硬件配置是否合理、运行是否协调,包括系统的可扩展性、平衡性、容错性、稳定性、易用性、可靠性及场地环境支撑能力的指标,并且对系统应用采用典型数值模式来完成评测,在应用评测指标中,根据每道测试题目的业务需求和测试目的设定评测指标,包括在固定问题规模,满足时效需求前提下,完成计算任务所需的最小系统资源配置、最短时间;

对系统评测主要考虑系统理论/持续计算峰值性能、系统整体性能是否均衡、单核CPU峰值性能及缓存/内存配比是否合理、应用软件、系统软件是否满足需求等;对应用评测主要考虑应用在各测试系统的持续计算性能、并行可扩展性与其对计算资源需求的映射关系,结合测试系统计算能力、I/O能力、高速计算网络数据交换能力计算出目标系统配置规模;可以判断该系统是否与应用相匹配,在考虑系统性能属性和应用计算特征时,可以评测系统与应用之间的相似度和差异度,将系统中的计算与典型数值模式相关联,为典型数值模式在计算系统中的计算评测提供依据,能提供足够的作业管理调度制度,提供计算资源灵活调配的应用需求,进而提高系统的稳定性,可以针对数据和系统的计算处理能力进行一定的分配;

其中,计算模块包括高性能通用处理器、加速处理器,以及异构混合高性能处理器,高性能通用处理器采用向量化、持续增宽的SIMD设计,该SIMD设计在支持浮点/定点乘加运算的前提上将单个功能部件的数据宽度增加到了512位宽、8个长整数或双精度向量,在低功耗与高可靠的前提下,有效提高了处理器的性能,另外还包括能彻底突破功耗墙、访存墙或性能墙障碍的碳纳米管、低温超导量子管和忆阻器,忆阻器具备逻辑计算能力,可以同时进行图像处理运算与存储融合的结构设计,在图像数据的存储位置上即可进行简单的图像处理操作,从而大大减少图像数据的访存操作,达到提高图像处理性能和效率的目的;面向大数据处理,研究设计数据查询、排序、聚合数据的处理操作,以及基于概率、认知的以类脑、纳米光学、超导量子器件为基础的新型处理器,评测模块完成评测后将高计算数据送入计算模块中进行计算;

其中,并行开发模块包括内存存储单元和多个编程单元,多个编程单元在不同的环境下采用多种编程语言混合开发编程的数据,每个编程单元得到一个任务,多个任务并行存储在内存储存单元中,多个编程单元可以共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,提供灵活的任务调度策略单次调用多个程序和数据结构,计算后的数据在并行开发模块中进行分类,与不同的编程语言相配合工作,共同储存在内存存储单元中,并通过显示装置展现出来,因此获得较高的互联网络带宽和较低的延迟,进一步提高并行计算效率,并且混合开发编程可以有效减少数据重复的情况发生,提高了扩展能力,使系统的计算能力和数据访问能力能够达到平衡,并行开发模块中内存存储单元利用新型存储介质设计混合多层次存储结构,通过利用I/O局部性,在多个存储层次处理响应I/O访问请求,以提供高带宽、可均衡扩展的I/O能力,同时,采用软件定义存储和服务器平台,实现面向存储的功能定制、并发I/O性能优化功能,I/O性能优化功能是指通过利用I/O局部性,在多个存储层次处理响应I/O访问请求;

计算模块将计算后的数据送入并行开发模块中配合并行开发模块的工作,可以消除存储单元的瓶颈,研究计算与存储融合的体系结构,以及计算与存储微观集成的体系结构;以新型存储器件技术、三维封装技术和互连技术为基础,根据技术成熟度和应用需求,在宏观和微观等不同层次上实现计算与存储相融合就近处理数据,来完成数据分配工作。

其中,容错模块为数字化模块和计算模块提供可靠性保障技术和并行容错方法,保障并行计算的可靠性和稳定性,在评测模块评测系统不合格时,容错模块得到指令停止系统的工作,在计算模块与并行开发模块运行时,容错模块实时监测计算模块的准确率和并行开发模块的承载率,保障了系统的稳定性,不仅对整个系统的各个模块提出了一定的指标要求,还可以保障系统性能均衡,运行稳定,结合外界的软件支撑系统可以获得更高的计算效率和更好的使用效果。

本发明的工作原理为:先通过评测模块对系统进行评测,将系统中的计算与典型数值模式相关联,为典型数值模式在计算系统中的计算评测提供依据,能提供足够的作业管理调度制度,提供计算资源灵活调配的应用需求,进而提高系统的稳定性,完成后对各个模块发送指令,将数据导入计算模块完成计算后得到高性能数值,高性能数值送入并行开发模块完成存储并显现出来,并行开发模块中的多个编程单元可以共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,因此获得较高的互联网络带宽和较低的延迟,并且混合开发编程可以有效减少数据重复的情况发生,提高了扩展能力,使系统的计算能力和数据访问能力能够达到平衡,在此过程中容错模块一直对数据和系统进行检测。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以所述权利要求的保护范围为准。

技术分类

06120115631841