在超级计算机测试中,我们会碰到Rmax和Rpeak两个值。
以我国天河二号超级计算机为例,Rmax值为33,862.70tflop/s
,Rpeak值为54,902.40tflop/s
很多朋友可能会不知道它们的详细意思。
rmax和rpeak在英文词汇中,都不存在这个词汇。我们要讲的是它们作为缩写,在linkpack中的意义。
Linpack是最流行的用于测试高性能计算机系统浮点性能的测试软件。通过用高斯消元法求解N元一次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。
而Rmax和Rpeak是linpack软件提供的两个参考值。
她们的单位为:flop/s或者tflop/s,分别对应:每秒浮点运算次数和每秒万亿(10的12次方)浮点运算的次数
Rmax - Maximal LINPACK performance
achievedlinpack实际测试中达到的最大性能
Rpeak - Theoretical peak performance
理论最大性能。由理论推算出来的性能,不可能达到。
计算机的峰值速度通常是指其理论峰值速度,其计算公式是:
理论峰值速度(亿次)= MHz x 每个时钟周期执行浮点运算的次数 x
CPU数目
其中MHz是指CPU的主频,每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的。
以IBM
POWER4为例,每个POWER4的处理器有两个浮点运算单元,每个浮点运算单元在一个时钟周期内可以同时处理一个加法和一个乘法的操作。所以如果处理器的主频为1.7GHz(POWER4+),那么该处理器的峰值速度为:
1.7G*2*2=6.8Gflop/s,或68亿次/秒。
对于满配置的IBM p690来说,该系统的峰值速度就是:
1.7G*2*2*32=217.6Gflops,或2176亿次/秒。
不同的处理器每个时钟周期能执行浮点运算的次数不同。在市场中常见处理器的情况如下:
每个时钟周期能执行浮点运算的次数:
IBM
Power44
HPQ
PA-RISC4
HPQ
Alpha2
SUN
Ultra-Sparc2
SGI
MIPS2
Intel
Itanium4
Intel
Pentium1
Intel
Xeon2
峰值速度在一定程度上能够反映处理器的性能,但并不能代表计算机的实际运算能力。为此许多组织试图用一些标准的程序来测试计算机的运算速度,其中LINPACK以其使用简单、适用性强等特点被广泛地用于评价计算机的实际峰值运算能力。虽然这些指标并不反映给定系统的全部系统性能,但可以作为对系统理论峰值性能的一个修正。
如果觉得《利用计算机峰值 计算机的峰值速度》对你有帮助,请点赞、收藏,并留下你的观点哦!