しかしまぁ,GTX780のDGEMMって遅いんだなぁ・・・つーかK20が速いというべきか。こちらのGTX980の結果を見ると更に倍精度は遅いようだし,買うのを躊躇しちゃうレベル。

 ちなみにMAGMA 1.6.0になって[S,D]GEMMの速度はcuBLASと遜色なくなっておりました。1.6.1とCUDA 7.0との組み合わせは・・・さてどうしようかしらん?

解説は次週に回してガンガン説明を突っ込んでいこう。

T.Kouya

Share
Published by
T.Kouya

Recent Posts

1/5(日) 駿府・晴

2025年1月の富士山 明けま…

7日 ago

12/31(火) 駿府・曇後晴

 毎年恒例の旨煮を作って一息つ…

2週間 ago

12/29(日) 駿府・晴

 沸騰している地球とはいえ,こ…

2週間 ago

minerva(cs-tklab3) has been updated in Ubuntu 24.04 LTS

 予告通り,まずはminerv…

3週間 ago

12/1(日) 駿府・晴

 猛暑の夏の名残が11月まで続…

1か月 ago