12/16(火) 掛川・晴

 毎度のことながら,予算だのカリキュラムだのの話し合いは面倒なことこの上ない。結局,次年度以降はネットワーク関連の講義からは全面撤退となる。旧カリキュラムの一講義が残るが,これも次回限りである。実験講座も数値計算がらみのものに再編成し,きれいさっぱり。
 それはいいのだけれど,具体的に何をするかは全くの未定である。いくら何でもゴリゴリの数値計算は無理なので,グラフィックスやらPthreadやらと関連づけた応用指向の内容になるだろうな。またテキストを書き下ろさないと・・・面倒だが楽しみでもある。定番のMandelbrotやらJuliaやらを描いて,なるべくならOpenGLともからめて・・・なんて,考えるだけなら簡単なんだがなぁ。ま,これからは業績にもならない仕事は引き受けないことにしよっと。
 つらつらと,M$のHPC Toolkitなるものを眺めてみると,えらい豪華バージョンなのは驚く。最もEvaluationが殆どで,短期間しか使用できそうもないところがみみっちい。送料だけで入手が出来るとのことなので,早速注文する。正月明けには届くかな?
 前々から気になっていたので,ARPRECMPFRの四則演算速度を比較してみた。この2者は実装方針がまるで違っていて,前者の多倍長浮動小数点はIEEE754浮動小数点をつなぎ合わせて実装しているのに対し,後者は整数演算をベースに下から積み上げて実装されている。どーも,浮動小数点数に限っては,前者の方が高速ではないかと感じていたので,ちみっと簡単なベンチマークプログラムをでっち上げてみた。環境は次の通り。
コンパイル条件:GCC, G++ 3.2.2, オプション: -O3 -funroll-all-loops
ハードウェア: Intel Pentium III 800MHz,OS: RedHat9
 ショボくてすまん。んで,結果は次の通り。
1024 bits(308 decimal digits)の場合(単位はMFLOPS)
 ADD 3.333333e-01(ARPREC), 1.58025e+00(MPFR)
 MUL 2.222222e-01(ARPREC), 1.04235e-01(MPFR)
 DIV 7.207207e-02(ARPREC), 6.99597e-02(MPFR)
2048 bits(616 decimal digits)の場合(単位はMFLOPS)
 ADD 3.478261e-01(ARPREC), 1.03226e+00(MPFR)
 MUL 2.222222e-01(ARPREC), 3.40426e-02(MPFR)
 DIV 4.266667e-02(ARPREC), 2.25989e-02(MPFR)
4096 bits(1233 decimal digits)の場合(単位はMFLOPS)
 ADD 3.478261e-01(ARPREC), 7.03297e-01(MPFR)
 MUL 2.162162e-01(ARPREC), 1.11732e-02(MPFR)
 DIV 2.308802e-02(ARPREC), 6.86695e-03(MPFR)
8192 bits(2466 decimal digits)の場合(単位はMFLOPS)
 ADD 1.403509e-01(ARPREC), 4.26667e-01(MPFR)
 MUL 1.066667e-01(ARPREC), 3.70199e-03(MPFR)
 DIV 1.218583e-02(ARPREC), 2.11640e-03(MPFR)
 うーん,確かに桁数が増えると,ARPRECの方が,特にMUL,DIVで高速になっている。しかし,1024bits(308 dec.digits)では危惧していたほど差は出ていなかった。8192bits(2466 dec.digits)が「実用的」な桁数かどうかは議論の分かれるところだろうが,おおむね,「んなに計算してどないすんねん」レベルと見ていいだろう。つーことで,Piやeの世界記録を狙いたいという向きはARPRECを使えばよろしい。関数機能も豊富なのでお勧めする。
 で,わしはと言えば,今のところGMP+MPFRから乗り換えるつもりはない。もちっと原因を調べてからでも遅くはないと考えている。64bit addressingになってしまえば改善するものなのかどーか,cacheのhit率を上げることで改善できるものなのか,HTやSMP環境でPthread並列化すればどーか,等,調べることはいっぱいあるし。ARPREC使うなら,Template使ってBNCpack++を作った方がよろしかろうて。
 それよりも,ARPRECは1024bits以下の桁数にしてもこれ以上の速度改良がみられないのが問題なのである。この場合,MPFRの方がずっと高速になる。これ以上は研究上のし・み・つ(という程,大層なものではないけど)。
 

“12/16(火) 掛川・晴” の続きを読む

12/15(月) 掛川・晴

 うう~,寒いぃ~。12月も半ばを越えようとして,冬将軍が空っ風と共にやってきたようである。灯油の消費量が増えるなぁ。
 これから翻訳作業が一段落するまで,このWeblogを毎日更新することにする。もうのっぴきならないのである。今週末には下書きをでっち上げねばらならない論文が2本もあるが,それと平行して作業を進めねば正月明けの脱稿には到底間に合わない。・・・などといいつつ,本日は気力がなくて6行のみ。先が思いやられる。
 トップページのカウンタが7000を越えていた。歳末にはアクセスがガタ減りするだろうから,あと500ぐらいアップすればめっけもんかなぁ。しかし,何が面白くって人のページを覗くのであろう。ちっと不思議。

12/14(日) 岐阜->掛川・晴

 昨日は移動中に雨がぱらついていたが,午前中はよい天気であった。東海北陸自動車道の川島PAでは白猫がちんまりとひなたぼっこをしていた。
whitecat.jpg
 本日もそれに引き続いて良い天気である。わしの講演は時間切れにて次回(?)回しと相成った。それまでに完璧にしておけというプレッシャーとも言える。ついでに,またぞろ査読を依頼されて引き受けてしまう。全く,人の論文ばっかり批評して,自分ではロクに書けていないというのは,まるでいしかわじゅんのようで大変によろしくない状況である。これから年末にかけて,じっくりたまった仕事を向き合わねば。
 フセイン元大統領拘束とのニュースが飛び込む。農場の物置小屋に掘られた地下室に籠もっていたそうだが,まるで某教団の教祖様である。$750Kを抱えていたってところも同様。独裁者の末路はゼニと道連れ引きこもりってのが定番の絵になるのであろうか。
 翻訳,II-0を終了。これから年明けまでにII-9まで,なんとしても終了せねばならぬ。毎日一行ずつでも進めることにする。

12/13(土) 掛川・?

 天気なんぞこの際どうでもイイ。やっと今日からのワークショップ用資料をでっち上げることが出来た。結局新しいことは何も出来ず,出来損ないのsurvey止まりである。うがーっとなってPPTファイルを作っているところへ,第2回目の査読依頼メールが届く。ああもぉ,マーフィーはどこまでついて回るのか。解答書と修正論文のみをプリントアウトして帰宅。今日は遅くとも8時過ぎには出発しないといけないので,さっさとかえって寝るのである。でもしばらく更新が途絶えていたので,こうやってわずかの時間を惜しみつつ,日記を書いているという次第。
 今度こそ寝ます。

12/8(月) 掛川・晴

 忙しさ絶好調。書類の催促が来るわ,講義で計算を間違えるわ(いつものことだが),研究室のブレーカーは落ちるわ,説明会の案内は来るわ,会議があるわ,金はないわ(ボーナス支給日を勘違いしていた),もてないわ,研究会の準備は全く出来てないわ,こーゆー時に限って別の作業をしたくなるわ,DVでビデオ取りしていたら録画できていないわ,卒研生は寝坊するわ,つられてわしは早寝になるわ,事前申し込みしていたPC Cluster シンポジウムには出席できそうにないわ,翻訳作業は全く進んでいないわ,未処理伝票は一向に減らないわという大騒ぎの最中に,発注していたcs-pccluster2の部材が一挙に届いてもう大笑いさ。
 全ての準備が整ったので,次週には若い力を結集して,P4マシンを組んで頂くことにする。ホントは全部自分一人でやりたいところだが,こう忙しくてはどうしようもない。今週がピーク。次週は少し落ち着くだろう。