五千年(敝帚自珍)

主题:我的AMD OPTERON BENCHMARK -- spin

共:💬17
全看树展主题 · 分页首页 上页
/ 2
下页 末页
家园 我的AMD OPTERON BENCHMARK

老板5月份经费到期,帐上还剩了$25,000. 要说我们这行也没什么花销, 一机,一笔,一纸也就够了,乍花这么多钱还得伤点脑筋, 本着一定要多快好省的把钱花出去的原则, 最后决定: 买电脑.

基本配置:

8 NODS, 16 AMD OPTERON246 CPUS,

EACH NOD HAS 2G DDR400 MEMORY.

机器到手已经是六月了, 8个超大砖头, 每个至少有60磅,以后不用去健身房了,实验室里面举砖头就行了. 费了老鼻子劲把他们装到柜子里以后, 老板又出去旅行了,我们放假,一直到现在也没有好好敲打敲打新机器.刚才看了Highway大拿的64位评测, 一时手痒, 说说我做的评测.

其实也不能叫评测, 只是比较了一下我的一个程序在不同系统上的运行时间.这个程序主要是调用LAPACK的双精度复数矩阵求逆.

AMD OPTERON 246 P4 1.3G

PGF77(LAPACK) 12.9(s) 36.7(s)

PGF77(MKL) 9.2(s) 21.9(s)

PGF77(GOTO) 9.0(s) 18.7(s)

LAPACK: 使用标准的LAPACK库.

MKL: INTEL 提供的库

GOTO: 一个日本人做的LAPACK优化库.

看起来结果不那么令人满意,都使用GOTO的优化库,OPTERON也就比P41.3G快一倍左右. 当然也可能是因为OPTERON 才出来不久,GOTO对它的优化并不太好.


本帖一共被 1 帖 引用 (帖内工具实现)
家园 is acml better on opteron?
家园 晕,错按了回车,版主帮忙把下面的贴子删了
家园 不清楚,我们一般也就做做简单的矩阵对角化,MONTE CARLO沙么的.
家园 ACML is AMD optimized LAPACK+FFT

:D, Quantum Monte Carlo?

家园 多谢告之,让我试验一下
家园 good

我刚开始用MKL, 舍不得掏前.

只是你用MKL,为什么不作做PGF和EFC/IFC的比较?

MKL是针对INTEL优化的吧.

good
家园 EFC/IFC在opteron上行吗?太懒,没试过,

pgf/pgc在itanium 2上不行。

家园 在这种系统下作Benchmark,不是很容易的事情。

首先如果你要测试CPU的性能,你要先保证memory,disk,network等等不会成为bottleneck。(比方说,如果你用dial-up modem测试p4或是athlon64的internet性能,其结论可能是p3或是k7没什么区别)。程序是CPU intensive, memory bandwidth intensive, or I/O intensive...这些问题要先搞清楚。

如果想利用多个node,那么程序的结构就非常关键。有些程序scalability很差,使用更多的CPU也不能提高性能。

编译器的(compiler)的优化对程序有着巨大的影响。Intel在这方面有很强的优势。毕竟他做业界的大哥那么多年了,好多vendor都对intel的CPU做了大量的优化工作!

家园 我一般做经典的,偶尔才做量子的
家园 不喜欢Intel的compiler,好像伊就是把COMPAQ的东西拿过来,

改头换面而已。嗯,也不喜欢每次编译它都要告诉俺它编译了多少行,一大把没用的警告,然后就算是十几行的程序也要给你个一两兆的可执行文件。

家园 倒是很想知道蒙特卡罗量子是个什么概念

随机选取启始态? 汗, 还是自己的专业..:(

家园 HOHO, 用ACML在OPTERON上可以降到5.4(s)
家园 bravo
家园 嗯,可以合伙写本书叻
全看树展主题 · 分页首页 上页
/ 2
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河