今日は、とてもおめでたいことがあった(他の人に)。
自分も頑張ろうと思う。
昨日まで、コンピュータに張り付きすぎていたのを考えて、今日は論文読み。
An SDP-Based Divide-and-Conquer Algorithm for Large-Scale Noisy Anchor-Free Graph Realization, SIAM J. Sci. Comput., 31(6), 4351-4372, 2009.
アルゴリズムの基本はタイトルにもあるとおり、divide and conquer で、部分ごとに分解したのをどのように復元していくか、かまとめてあり、とても勉強になった。
いくつもいいアイデアが含まれているので、今後の参考になりそうだ。
ここで得られたアイデアを、明日もう少し練ってみよう。
あと、PLASMA がどのくらい速いかをチェック。sgemm での比較なので、LAPACK 重視の PLASMA には少し不利か?
N=2000 で
ATLAS 0.17 秒, CUBLAS 0.32 秒, GOTOBLAS 0.11 秒, PLASMA 0.33 秒
N=4096 で(NがCUBLASに有利にしてみた)
ATLAS 1.30 秒, CUBLAS 1.33 秒, GOTOBLAS 0.95 秒, PLASMA 2.94 秒
N=8192 で(CUBLAS はメモリオーバー)
ATLAS 9.73 秒, GOTOBLAS 7.6 秒, PLASMA 20.23 秒
N=30000 で
ATLAS 483.80 秒, GOTOBLAS 367.18秒, PLASMA (2時間で終了せず、打ち切った)
予想以上に PLASMA が遅い結果になっている。今のところは、BLAS は ATLAS/GotoBLAS のほうが性能が上である。
今日の作業内容: 論文読み 3h + 部屋の掃除 3h
今日のBGM: FF12 OST [1,2]
今日のランチ: つかさ カンパチ唐揚げ
明日の予測作業時間: 3h
0 件のコメント:
コメントを投稿