Categories: 日記

[進捗報告] 倍精度行列積ベンチマーク開始

CentOSのバイナリATLASを使うとHT分もCPUをカウントしてしまうらしく,4 coresなのに8 threads使っている模様。とりあえずCore i7 3820+GTX780だとDGEMMで

Ref.BLAS < ATLAS < IMKL < cuBLAS == MAGMA 3.2(GFLOPS) < 20 < 101 < 176 == 176 で,Xeon E5 2620x2 + Tesla K20だと Ref.BLAS < ATLAS < IMKL < cuBLAS == MAGMA 2.5(GFLOPS) < 20? < 196 < 974 == 974 ってとこ。単精度もやっておかないとなぁ。

T.Kouya

Share
Published by
T.Kouya

Recent Posts

最期に残すべきは家事

 この4月から平日限定の一人暮…

2か月 ago

5/12(月) 駿府→柏→北摂・曇

 朝っぱらから曇天模様で気温が…

2か月 ago

4/10(木) 北摂・曇

 日中の寒暖差はまだ激しいが,…

3か月 ago

3/13(木) 茨木・晴

 これ書く直前にMySQL(M…

4か月 ago

1/5(日) 駿府・晴

2025年1月の富士山 明けま…

6か月 ago