本帖最后由 十四王爷 于 2016-7-11 10:48 编辑
本节课的内容对于很多不了解硬件指标的用户非常重要,超算用户是如何来评定自己集群的各方面能力呢?我们一起走进今天的课堂。
2 高性能计算集群性能指标
2.1 衡量高性能计算集群的评价指标
2.1.1. 理论峰值性能
FLOPS是指每秒浮点运算次数,Flops用作计算机计算能力的评价系数。根据硬件配置和参数可以计算出高性能计算集群的理论性能。
1)CPU理论性能计算方法(以Intel CPU为例) 单精度:主频*(向量位宽/32)*2 双精度:主频*(向量位宽/64)*2 2代表乘积指令
2)GPU理论性能计算方法(以NVIDIA GPU为例)
单精度:指令吞吐率*运算单元数量*频率
2.1.2. 实测峰值性能
通过利用测试程序对系统进行整体计算能力进行评价。 Linapck测试:采用主元高斯消去法求解双精度稠密线性代数方程组,结果按每秒浮点运算次数(flops)表示。 HPL:针对大规模并行计算系统的测试,其名称为HighPerformanceLinpack(HPL),是第一个标准的公开版本并行Linpack测试软件包。 用于TOP500与国内TOP100排名依据。
2.1.3. 评价参数
1) 系统效率=实测峰值/理论峰值
2) 加速度 S=串行程序运行时间/并行程序运行时间
3) Amdahl定律
S =(WS+WP)/(WS+WP/p) =1/(1/p+f(1-1/p))
4) Gustafson定律
S =(WS+pwp)/(WS+WP) =p-f(p-1)=f+p(1-f)
本文来自CUDA大咖天山原创,经典之作,授权NVIDIA CUDA 官方论坛使用,未经允许,不得转载。
|