[進捗報告] SGEMM, DGEMM計算完了

 しかしまぁ,GTX780のDGEMMって遅いんだなぁ・・・つーかK20が速いというべきか。こちらのGTX980の結果を見ると更に倍精度は遅いようだし,買うのを躊躇しちゃうレベル。

sgemm_dgemm_k20_gtx780

 ちなみにMAGMA 1.6.0になって[S,D]GEMMの速度はcuBLASと遜色なくなっておりました。1.6.1とCUDA 7.0との組み合わせは・・・さてどうしようかしらん?

解説は次週に回してガンガン説明を突っ込んでいこう。

[進捗報告] 行列積ベンチマーク解説開始

職場のメインマシンのHDDがすっ飛んで大騒ぎ。といっても研究用の重要なファイルはクラウドにあるし,メールも読めるので特に支障なし。3月も半ばを過ぎたので,現時点における材料をつなぎ合わせる作業にかかる。何としても今月中にできている分は書き上げる!