しかしまぁ,GTX780のDGEMMって遅いんだなぁ・・・つーかK20が速いというべきか。こちらのGTX980の結果を見ると更に倍精度は遅いようだし,買うのを躊躇しちゃうレベル。

 ちなみにMAGMA 1.6.0になって[S,D]GEMMの速度はcuBLASと遜色なくなっておりました。1.6.1とCUDA 7.0との組み合わせは・・・さてどうしようかしらん?

解説は次週に回してガンガン説明を突っ込んでいこう。

T.Kouya

Share
Published by
T.Kouya

Recent Posts

1/31(土) 駿府・晴

 暖冬のまま推移するかと思いき…

1週間 ago

1/3(土) 駿府・晴

凧映える富士山2026年  寒…

1か月 ago

12/31(水) 駿府・晴

 毎年恒例の旨煮作りが終了,あ…

1か月 ago