しかしまぁ,GTX780のDGEMMって遅いんだなぁ・・・つーかK20が速いというべきか。こちらのGTX980の結果を見ると更に倍精度は遅いようだし,買うのを躊躇しちゃうレベル。
ちなみにMAGMA 1.6.0になって[S,D]GEMMの速度はcuBLASと遜色なくなっておりました。1.6.1とCUDA 7.0との組み合わせは・・・さてどうしようかしらん?
解説は次週に回してガンガン説明を突っ込んでいこう。
Enjoy our world with numerical computations!
「LAPACK入門(仮)」執筆のためのメモ書き&広報ツール&バグ出し
しかしまぁ,GTX780のDGEMMって遅いんだなぁ・・・つーかK20が速いというべきか。こちらのGTX980の結果を見ると更に倍精度は遅いようだし,買うのを躊躇しちゃうレベル。
ちなみにMAGMA 1.6.0になって[S,D]GEMMの速度はcuBLASと遜色なくなっておりました。1.6.1とCUDA 7.0との組み合わせは・・・さてどうしようかしらん?
解説は次週に回してガンガン説明を突っ込んでいこう。
ちみっと本文に挿入した図も修正。さて間を埋める文章とデータを作らないと~。
とりあえず並列LU分解と並列前進・後退代入の解説図を挿入。OpenCLも初体験。書かないけど,一応使っておかないと触れることもできませんからな。
職場のメインマシンのHDDがすっ飛んで大騒ぎ。といっても研究用の重要なファイルはクラウドにあるし,メールも読めるので特に支障なし。3月も半ばを過ぎたので,現時点における材料をつなぎ合わせる作業にかかる。何としても今月中にできている分は書き上げる!
ちみっとだけ追加。プログラム例は後で。
明日(あ,もう今日か)は頑張ろうっと。