Categories: 日記

[進捗報告] 倍精度行列積ベンチマーク開始

CentOSのバイナリATLASを使うとHT分もCPUをカウントしてしまうらしく,4 coresなのに8 threads使っている模様。とりあえずCore i7 3820+GTX780だとDGEMMで

Ref.BLAS < ATLAS < IMKL < cuBLAS == MAGMA 3.2(GFLOPS) < 20 < 101 < 176 == 176 で,Xeon E5 2620x2 + Tesla K20だと Ref.BLAS < ATLAS < IMKL < cuBLAS == MAGMA 2.5(GFLOPS) < 20? < 196 < 974 == 974 ってとこ。単精度もやっておかないとなぁ。

T.Kouya

Share
Published by
T.Kouya

Recent Posts

永田礼路「まどいのいきもの」1巻,小学館

永田礼路「まどいのいきもの」1…

2週間 ago

ゆうきまさみ「新九郎、奔る!」22巻,小学館

ゆうきまさみ「新九郎、奔る!」…

3週間 ago

久田将義「教養としての新宿・歌舞伎町」朝日新書

久田将義「教養としての新宿・歌…

4週間 ago

5/22(金) 駿府・晴時々曇

 大阪は暑かったが,静岡は寒い…

4週間 ago

筒井康隆「老耄美食日記 九十歳のあとさき」新潮社

筒井康隆「老耄美食日記 九十歳…

1か月 ago

4/19(日) 駿府・晴

 まだ4月中旬過ぎだというのに…

2か月 ago