Benchmarking on AMD FX-8350(2)

 つーことで,前回に引き続き,FX-8350のベンチマークである。今回は倍精度浮動小数点演算の行列積計算でGflops値を計測。詳細はIntelの解説でも読んでくれたまえ。環境は前回同様,Intel Core i7-3930マシンとFX-8350マシンを用いる。環境は


  • Scientific Linux 6.3 x86_64 (Kernel 2.6.32-279)

  • Intel icc 13.0.1

  • Intel Math Kernel 11.0.1


である。比較検討のため,Intel Math KernelのDGEMMルーチンを用いた場合と,単純な三重ループを用いた場合のGflops値を載せる。

matrix_multiplication.png

 DGEMMの場合,i7-3930が25.5Gflops,FX-3850が21.3Gflopsと大体2割引きぐらい。三重ループの場合は変動が激しいので一概には言えないが,次元数が大きくなると5割引きぐらいで落ち着く。もちろん,1 threadでの計算なので,並列化するとまた違ってくるのだろうが,整数演算同様,価格の割にはがんばってるなぁというのが正直な感想である。

 最近は大規模な線型計算をGPGPUするのが普通になりつつあるので,GTXあたりを乗っけてCPUはフォロー計算程度にする,ということなら高いIntel CPUを使わずにAMDで頑張る,というのもコストダウンのためにはいいことかも。

 さて,並列計算させたらどうなるのか? というあたりはまた年明けに~。