倍精度BiCGSTABとJacobi反復法の両方で収束し,かつ非対称な実行列で馬鹿でかいものが望ましい・・・と探していたらなかなか見つからない。今のところt2d_q4(9801×9801)ぐらい。しかもこれは収束が早すぎて,cuSPARSE版のBiCGSTABが遅い。まぁ計算時間そのものは結構いい線行っているとは思うが,GPUとのやり取りの時間がこう大次元になると馬鹿にならないということだと理解。この辺りももう少し調べないとなぁ。

 しかし10000×10000を超える問題を見ていると,条件数が10^14以上の問題がザラにあるなと今更ながら気が付いた。4倍精度で収束すればいいけど,モノによっては8倍精度以上が必要な問題も結構ありそう。久々に多倍長COO SpMVもいじってみるかなぁ・・・ってまた別テーマに走りそうで怖い。人手があればいくらでもやってもらいたい研究(ベンチマーク)テーマはあるんだけどねぇ。

 明日は残差のグラフと計算時間の詳細を詰めて第5章を終わらせ・・・たい(弱気)。

T.Kouya

Share
Published by
T.Kouya

Recent Posts

永田礼路「まどいのいきもの」1巻,小学館

永田礼路「まどいのいきもの」1…

4日 ago

ゆうきまさみ「新九郎、奔る!」22巻,小学館

ゆうきまさみ「新九郎、奔る!」…

2週間 ago

久田将義「教養としての新宿・歌舞伎町」朝日新書

久田将義「教養としての新宿・歌…

2週間 ago

5/22(金) 駿府・晴時々曇

 大阪は暑かったが,静岡は寒い…

2週間 ago

筒井康隆「老耄美食日記 九十歳のあとさき」新潮社

筒井康隆「老耄美食日記 九十歳…

4週間 ago

4/19(日) 駿府・晴

 まだ4月中旬過ぎだというのに…

2か月 ago