倍精度なのにK20よりGTX780の方が高速だったりして,よく分からない結果が出ている。精度の問題はなさそうなので,動かしながら検証していくほかないなぁ。今日はここまで。
[進捗報告] magma_dgeevプログラム完了
全く・・・なーんでcuBLASもMAGMAもRow majorをサポートしてくんないのかなぁ。行列だけじゃなくて,固有ベクトルも並びが変わるので嵌ってしまったぞい。何とか治ったけど,この辺の解説必要かしらん?
[進捗報告] DGEEVプログラム修正
解説を書くまでには至らず,プログラムの修正のみ。左固有ベクトルなんて使ったことなかったので,符号が間違ってたことに気が付いた。
大体規定のページ数に収まりそうな内容は揃ったので,全部打ち出してボチボチ図を挿入しつつ解説をブラッシュアップしていく予定。
[進捗報告] xSYEVの解説追加
LAPACKはドライバルーチンと一部の計算ルーチンしか扱わないので,固有値・固有ベクトル計算もxSYEVとxGEEVのみ。ということで固有値部分は1/3は完了。Jordan標準形の問題は演習問題に回そうかしらね。
[進捗報告] ベンチマークテスト終了
これでBLASの章は完成。並列化のところもまぁ一応できた。次はGPUの説明かな。今週中にLAPACKのところも終えたい。頑張るぞ~。