Benchmarking on AMD FX-8350(2)

　つーことで，前回に引き続き，FX-8350のベンチマークである。今回は倍精度浮動小数点演算の行列積計算でGflops値を計測。詳細はIntelの解説でも読んでくれたまえ。環境は前回同様，Intel Core i7-3930マシンとFX-8350マシンを用いる。環境は

Scientific Linux 6.3 x86_64 (Kernel 2.6.32-279)

Intel icc 13.0.1

Intel Math Kernel 11.0.1

である。比較検討のため，Intel Math KernelのDGEMMルーチンを用いた場合と，単純な三重ループを用いた場合のGflops値を載せる。

　DGEMMの場合，i7-3930が25.5Gflops，FX-3850が21.3Gflopsと大体2割引きぐらい。三重ループの場合は変動が激しいので一概には言えないが，次元数が大きくなると5割引きぐらいで落ち着く。もちろん，1 threadでの計算なので，並列化するとまた違ってくるのだろうが，整数演算同様，価格の割にはがんばってるなぁというのが正直な感想である。

　最近は大規模な線型計算をGPGPUするのが普通になりつつあるので，GTXあたりを乗っけてCPUはフォロー計算程度にする，ということなら高いIntel CPUを使わずにAMDで頑張る，というのもコストダウンのためにはいいことかも。

　さて，並列計算させたらどうなるのか？　というあたりはまた年明けに～。