Categories: 日記

[進捗報告] 倍精度行列積ベンチマーク開始

CentOSのバイナリATLASを使うとHT分もCPUをカウントしてしまうらしく,4 coresなのに8 threads使っている模様。とりあえずCore i7 3820+GTX780だとDGEMMで

Ref.BLAS < ATLAS < IMKL < cuBLAS == MAGMA 3.2(GFLOPS) < 20 < 101 < 176 == 176 で,Xeon E5 2620x2 + Tesla K20だと Ref.BLAS < ATLAS < IMKL < cuBLAS == MAGMA 2.5(GFLOPS) < 20? < 196 < 974 == 974 ってとこ。単精度もやっておかないとなぁ。

T.Kouya

Share
Published by
T.Kouya

Recent Posts

1/3(土) 駿府・晴

凧映える富士山2026年  寒…

1週間 ago

12/31(水) 駿府・晴

 毎年恒例の旨煮作りが終了,あ…

2週間 ago

11/30(日) 駿府・晴

 はてさて,駿府は良い天気であ…

1か月 ago

8/31(日) 駿府・晴

 酷暑の夏,日本の夏,という定…

4か月 ago