一通りバグなども取りきれたようなので、ここから論文のための数値実験をスタート。
Nodes 数 x Thread 数で何回も解いていくことになるので、だいぶ時間がかかるかもしれないけど、とりあえず土日をつかってどこまで進むかで、その後を考えることにする。
(Thread 数は論文の表の大きさなどを考えると間引いた方がいいかもしれないなぁ)
あと、diamond_patch は MPI による高速化はないけど、GotoBLAS による高速化(Thread数のみに依存) は効果が出る。
そうそう、BroydenBand が大きくなったときに 1 台だと解けなくなっていたのは、やはりメモリオーバーになっていた。4 台のときと比較して、4倍以上かかって解いているときには、メモリのスワップを使って解いているようなので、とりあえず計算結果は使えるけど、計算時間としてはあまり使えない。
これに並行して、論文用の図を作成中。
これが終わったら、数値結果を当て込むための Table を作成。
Table ができあがるのと、数値実験が終わるのだと、どっちが先になるんだろうか?
今日のBGM: FF 5 OST[1-2], Romancing Saga3 OST[1-3], Xenosaga1 OST[1-2]
今日のランチ: 味庵 炸醤麺