今日は、SDPARA の数値実験用のデータを生成。
3次元のデータをある程度準備することにした。
また、2週間ぐらい前に作ったデータがどこかに行ってしまったと思っていたが、今日探したら出てきたので良かった。
今のデータ生成が終了したら、数値実験に入れそうだ。
あと、SparseCoLO のデバッグ。
今まで maxG11.dat-s をうまく解くことができずに困っていたが、なぜか mex ファイルを削除した上で、もう一度コンパイルしなおしたらうまく解けるようになった。
ここにたどり着くまでに2時間ぐらいかかった。
あと、maxSpanningTree に時間がかかっていたのは、他の部分を修正したらmaxSpanningTree 自身は 2 秒程度になってしまったので、ここは改良しないことにした。
今日の作業内容: 問題生成 2h + SparseCoLO 3h
今日のBGM: 電脳コイル OST [1-2], FF7 Reunion
今日のランチ: つかさ 生サーモン照焼き
明日の予測作業時間: 2h
2010年3月29日月曜日
2010年3月28日日曜日
SDPARA の原稿の続き
今日は SDPARA の原稿の校正の続きを行った。
数値実験をまだ行っていないので、その前までであるが、とりあえず英語などを一通り校正した。
これで、今後は数値実験に移っていくことになる。
あと、SparseCoLO の改良については、ヒューリスティクスの部分であるため、どのようなヒューリスティクスが効率的かを検討中。
今日の作業内容: 原稿校正 3h
今日のBGM: MADLAX OST [1-2]
数値実験をまだ行っていないので、その前までであるが、とりあえず英語などを一通り校正した。
これで、今後は数値実験に移っていくことになる。
あと、SparseCoLO の改良については、ヒューリスティクスの部分であるため、どのようなヒューリスティクスが効率的かを検討中。
今日の作業内容: 原稿校正 3h
今日のBGM: MADLAX OST [1-2]
2010年3月27日土曜日
SDPARAの限界
今日、いろいろと打ち合わせをしているときに、クラスタで台数を増やすと SDPARA の限界がでてくる、ということがあったので、どの程度で限界が来るかを計算しておく。
SCM が dense で MPI 並列が N 台のときに、制約本数を m (SDPA sparse format の1行目の数)とすると、SDPARA の限界は
m = 32768 * sqrt(N)
である。
16台なら m = 131072, 32 台なら m=185363 である。
メモリをいくら搭載していても、現状のSDPARAはこれ以上は解けないはずである。
(いま、少し眠くなってきているので、sqrt(2) 倍の違いがあるかもしれない。)
SCM が sparse なときは、SCM の非ゼロの要素数が 2^31 を超えることはできず、これは MPI の並列台数に依存しない。
あと、最近別の本を読み始めているが、これが結構面白い。
ここ1年間では一番面白いかもしれない。
内点法における理論的バックボーンとなる理論が書かれていて、とても面白い。
今日の作業内容: 打ち合わせ 2h
今日のランチ: 食堂 塩ラーメン ひじきの煮物
明日の予測作業時間: 4h
SCM が dense で MPI 並列が N 台のときに、制約本数を m (SDPA sparse format の1行目の数)とすると、SDPARA の限界は
m = 32768 * sqrt(N)
である。
16台なら m = 131072, 32 台なら m=185363 である。
メモリをいくら搭載していても、現状のSDPARAはこれ以上は解けないはずである。
(いま、少し眠くなってきているので、sqrt(2) 倍の違いがあるかもしれない。)
SCM が sparse なときは、SCM の非ゼロの要素数が 2^31 を超えることはできず、これは MPI の並列台数に依存しない。
あと、最近別の本を読み始めているが、これが結構面白い。
ここ1年間では一番面白いかもしれない。
内点法における理論的バックボーンとなる理論が書かれていて、とても面白い。
今日の作業内容: 打ち合わせ 2h
今日のランチ: 食堂 塩ラーメン ひじきの煮物
明日の予測作業時間: 4h
2010年3月26日金曜日
Matlab の mex をプロファイリング と Intro 書き直し
今日は、まず SDPARA の原稿の Intro を書き直した。
やはり、プロットを先に書いておくと、英語と内容の同時進行が英語だけになるので楽である。
これで数値実験の前のところまでは一通り書いたので、もう一度英語を校正することにする。
あと、SparseCoLO で、特定の問題のときに mexMaxSpanningTree2 が遅くなる、ということで調べることにした。
Matlab には、もともと profile というコマンドがあって、これを使うと行ごとの実行時間を表示してくれる。
しかし、profile は mex の時間は測定しても mex のソースは解析しないので、mex が重いときに改善が大変だった。
今回は、gcov というプログラムを使って、ある程度の解析ができることが解かった。
gcov についての説明は、
http://d.hatena.ne.jp/ku-ma-me/20090721/p1
がよくまとまっていて解りやすい。
これを mex に応用する。
なお、mexMaxSpanningTree2 は、通常のコンパイルは、
mex -O2 -largeArrayDims mexMaxSpanningTree2.cpp ccputime.cpp
で、コンパイルしているが、ここで -O を外すとともに -coverage を CXXFLAGS につけ、さらに -lgcov を最後につける。(-Oは最適化してしまうので外す。)
mex -largeArrayDims CXXFLAGS="-fPIC -coverage" mexMaxSpanningTree2.cpp ccputime.cpp -lgcov
これでコンパイルが通る。
(mex が内部的に gcc を呼び出しているため。)
Matlab は mexMaxSpanningTree2.cpp があるディレクトリ SparseCoLO/mex で起動し、この中で SparseCoLO を呼び出して実行する。
すると、いろいろなファイルができるが、その中に
mexMaxSpanningTree2.gcda
というファイルができる。
ここで
gcov mexMaxSpanningTree2.gcda
を実行すると gcov を拡張子とするファイルがたくさんできる。(iostream.h などをincludeしているため、それらの解析ファイルも同時にできる。)
最後に
less mexMaxSpanningTree2.cpp.gcov
とすると、mexMaxSpanningTree2.cpp の各行が何回実行されているかを知ることができる。
(#### で始まるところは、if 文などの分岐の影響で1度も実行されていない。)
Matlab の profile のように秒単位ではなく、何回実行されたかのため、実際のボトルネックかどうか難しいが、今回計測したところでは、ある特定の部分が 100 倍以上実行されていたので、ここがボトルネックと見て間違いなさそうであった。
今日の作業内容: 原稿校正 4h + gcov 1h
今日のBGM: NOIR OST [1-2], FF12 OST [1,2,4]
今日のランチ: 食堂 鶏竜田サラダセット
明日の予測作業時間: 2h
やはり、プロットを先に書いておくと、英語と内容の同時進行が英語だけになるので楽である。
これで数値実験の前のところまでは一通り書いたので、もう一度英語を校正することにする。
あと、SparseCoLO で、特定の問題のときに mexMaxSpanningTree2 が遅くなる、ということで調べることにした。
Matlab には、もともと profile というコマンドがあって、これを使うと行ごとの実行時間を表示してくれる。
しかし、profile は mex の時間は測定しても mex のソースは解析しないので、mex が重いときに改善が大変だった。
今回は、gcov というプログラムを使って、ある程度の解析ができることが解かった。
gcov についての説明は、
http://d.hatena.ne.jp/ku-ma-me/20090721/p1
がよくまとまっていて解りやすい。
これを mex に応用する。
なお、mexMaxSpanningTree2 は、通常のコンパイルは、
mex -O2 -largeArrayDims mexMaxSpanningTree2.cpp ccputime.cpp
で、コンパイルしているが、ここで -O を外すとともに -coverage を CXXFLAGS につけ、さらに -lgcov を最後につける。(-Oは最適化してしまうので外す。)
mex -largeArrayDims CXXFLAGS="-fPIC -coverage" mexMaxSpanningTree2.cpp ccputime.cpp -lgcov
これでコンパイルが通る。
(mex が内部的に gcc を呼び出しているため。)
Matlab は mexMaxSpanningTree2.cpp があるディレクトリ SparseCoLO/mex で起動し、この中で SparseCoLO を呼び出して実行する。
すると、いろいろなファイルができるが、その中に
mexMaxSpanningTree2.gcda
というファイルができる。
ここで
gcov mexMaxSpanningTree2.gcda
を実行すると gcov を拡張子とするファイルがたくさんできる。(iostream.h などをincludeしているため、それらの解析ファイルも同時にできる。)
最後に
less mexMaxSpanningTree2.cpp.gcov
とすると、mexMaxSpanningTree2.cpp の各行が何回実行されているかを知ることができる。
(#### で始まるところは、if 文などの分岐の影響で1度も実行されていない。)
Matlab の profile のように秒単位ではなく、何回実行されたかのため、実際のボトルネックかどうか難しいが、今回計測したところでは、ある特定の部分が 100 倍以上実行されていたので、ここがボトルネックと見て間違いなさそうであった。
今日の作業内容: 原稿校正 4h + gcov 1h
今日のBGM: NOIR OST [1-2], FF12 OST [1,2,4]
今日のランチ: 食堂 鶏竜田サラダセット
明日の予測作業時間: 2h
2010年3月25日木曜日
Intro 書き直しと ecolinux
今日は、原稿の校正の続きをした。
第2章と第3章はそれなりにまとまってきたが、やはり第1章の Intro がダメだ。
Intro なのに書いていることが細かすぎる。
ということで、Intro については全面的に書き直し。
もっと要点をストレートに表現するようにしよう。
あと、今日は ecolinux のチェックも行った。
いつのまにか ecolinux は ubutu 9.10 ベースになっていたので、これを試してみた。
ちなみに、ecolinux は ubuntu をベースにいろんなパッケージを削除してある軽量 ubuntu である。
したがって、ecolinux でインストールしておいて、あとで必要なパッケージを入れて ubuntu にすることも可能なはずである。
インストールしてみて解かったが、ecolinux は ubuntu の gnome を xfce にしただけでなく、いろいろなパッケージを削って高速化してあるようだ。
普通に ubuntu をインストールしたあとに xfce に切替えたときよりも、ecolinux のほうが速く起動するし、全体的にも動きが速い。
今日の作業内容: 原稿校正 3h + ecolinux 2h
今日のBGM: MADLAX OST [1-2], Xenosage II OST [1-2]
今日のランチ: 明太子ニラチャーハン
明日の予測作業時間: 4h
第2章と第3章はそれなりにまとまってきたが、やはり第1章の Intro がダメだ。
Intro なのに書いていることが細かすぎる。
ということで、Intro については全面的に書き直し。
もっと要点をストレートに表現するようにしよう。
あと、今日は ecolinux のチェックも行った。
いつのまにか ecolinux は ubutu 9.10 ベースになっていたので、これを試してみた。
ちなみに、ecolinux は ubuntu をベースにいろんなパッケージを削除してある軽量 ubuntu である。
したがって、ecolinux でインストールしておいて、あとで必要なパッケージを入れて ubuntu にすることも可能なはずである。
インストールしてみて解かったが、ecolinux は ubuntu の gnome を xfce にしただけでなく、いろいろなパッケージを削って高速化してあるようだ。
普通に ubuntu をインストールしたあとに xfce に切替えたときよりも、ecolinux のほうが速く起動するし、全体的にも動きが速い。
今日の作業内容: 原稿校正 3h + ecolinux 2h
今日のBGM: MADLAX OST [1-2], Xenosage II OST [1-2]
今日のランチ: 明太子ニラチャーハン
明日の予測作業時間: 4h
2010年3月24日水曜日
2010年3月23日火曜日
統数研に行ってきた
今日は、統数研での研究集会を聞きに行ってきた。
立川の駅から歩いて行ったら、30分近いウォーキングとなった。
いろいろと面白い内容が多かったが、自分としては一番最初の研究内容が面白かった。
情報幾何を使って解析していたが、あれを実際に SDP で計算できたらおもしろそうである。
ちなみに、帰りに南武線に乗ってきたら、山手線が止まっていたようだ。
しかも、武蔵小杉まで来たら、今度は東横線が止まっていて、「武蔵小杉折り返し」を行っているのを初めて見た。
今日の作業内容: 研究集会 6h
今日のBGM: なし
今日のランチ: 瑞京 ホタテのチリソース
明日の予測作業時間: 3h
立川の駅から歩いて行ったら、30分近いウォーキングとなった。
いろいろと面白い内容が多かったが、自分としては一番最初の研究内容が面白かった。
情報幾何を使って解析していたが、あれを実際に SDP で計算できたらおもしろそうである。
ちなみに、帰りに南武線に乗ってきたら、山手線が止まっていたようだ。
しかも、武蔵小杉まで来たら、今度は東横線が止まっていて、「武蔵小杉折り返し」を行っているのを初めて見た。
今日の作業内容: 研究集会 6h
今日のBGM: なし
今日のランチ: 瑞京 ホタテのチリソース
明日の予測作業時間: 3h
2010年3月19日金曜日
前の仕事場で打ち合わせ & SIAM Review チェック
今日は、ほぼ1年ぶりに、前の仕事場に行ってきた。
新しい机があったり、PCがあったりで、それなりに変わっていた。
でも、棚などの大まかなレイアウトは、あまり変わってなかった。
そこで SDP についてなど、いろいろと打ち合わせ。
お昼にカレー屋さんにいってきた後、前の仕事場でお世話になったみなさんを回ってみた。
なんか、かなり懐かしかった。
あと、できあがったばかり、という確率に関する本を1冊いただいた。「大学だと学部1年生レベルの本」とおっしゃられていたが、マルチンゲールがあって、最近の大学1年生のレベルに驚く。
あとで読んでみようと思う。
あと、行きと帰りの電車の時間などで、SIAM Review の電子構造計算のサーベイをチェック。
サーベイなので仕方がないが、あちこち省略されていて、アイデアなどもわからないところが多々ある。
ただ、中には内点法と関係あるかもしれない手法について書かれていたので、本当に内点法に関係があるのかどうかを調べてみることにする。
今日の作業内容: SDP 打ち合わせ 2h + SIAM Review 2h
今日のランチ: タジール エビカレー
明日の予測作業時間: 2h
新しい机があったり、PCがあったりで、それなりに変わっていた。
でも、棚などの大まかなレイアウトは、あまり変わってなかった。
そこで SDP についてなど、いろいろと打ち合わせ。
お昼にカレー屋さんにいってきた後、前の仕事場でお世話になったみなさんを回ってみた。
なんか、かなり懐かしかった。
あと、できあがったばかり、という確率に関する本を1冊いただいた。「大学だと学部1年生レベルの本」とおっしゃられていたが、マルチンゲールがあって、最近の大学1年生のレベルに驚く。
あとで読んでみようと思う。
あと、行きと帰りの電車の時間などで、SIAM Review の電子構造計算のサーベイをチェック。
サーベイなので仕方がないが、あちこち省略されていて、アイデアなどもわからないところが多々ある。
ただ、中には内点法と関係あるかもしれない手法について書かれていたので、本当に内点法に関係があるのかどうかを調べてみることにする。
今日の作業内容: SDP 打ち合わせ 2h + SIAM Review 2h
今日のランチ: タジール エビカレー
明日の予測作業時間: 2h
2010年3月18日木曜日
助成金調べ
今日は、ちょっと気になったので助成金について調べてみた。
探してみると、いろいろとあるようで、それほどないようにも見える。
もちろん、ひとつひとつ違いがあるので、調べる必要がありそうだ。
助成金の一覧については、
Science Portal のページ
に情報が詳しい。
このページは、分野ごとにも切り分けができるので便利そうである。
ちなみに、住友財団と三菱財団の助成金は幅が広そうな印象があったので、もう少し調べてみようと思う。
次に、
助成財団 研究者のための助成金応募ガイド2010
という本があるのも初めて知った。
これは、そのうちに見てみようと思う。
次に、SDPARA の原稿について。
Section 2 以降の赤ペン入れが終了。
Section 1 ほどはひどくないので、こちらはSection1 ほどの大幅な修正ではなくいけそうである。
あと、sparsePOP での問題生成は、30時間かかっても終了しなかったので、一度打ち切って、ソースを20行程度、修正した。
SDPA sparse format への出力部分で loop をはずしたところ、出力に3時間かかっていた問題がた80 秒で終了するようになった。
30時間かかって終わらなかったのも1200秒で出力できた。(単純に考えると、修正しなかったら少なくとも 18 日ぐらいかかってたかも知れない)
ちなみに、どのように loop を外すかを書いておくと、
X が 10000x3 行列だったときに、
for i=1:10000
fprintf('%f ', X(i,1));
fprintf('%f ', X(i,2));
fprintf('%f\n', X(i,3));
end
となっていたのを
fprintf('%f %f %f\n', X');
に修正した。(Xが転置されている点がポイント)
これだけで、高速化できる。
なお、昨日から続いている SMCP のチェックは、問題が大きいらしく、まだ終了していない。
今日の作業内容: 助成金調べ 1h + 原稿校正 3h + sparsePOP チェック 1h
今日のBGM: EVA OST [1-3]
今日のランチ: シッダルータ キーマカレー
明日の予測作業時間: 3h
探してみると、いろいろとあるようで、それほどないようにも見える。
もちろん、ひとつひとつ違いがあるので、調べる必要がありそうだ。
助成金の一覧については、
Science Portal のページ
に情報が詳しい。
このページは、分野ごとにも切り分けができるので便利そうである。
ちなみに、住友財団と三菱財団の助成金は幅が広そうな印象があったので、もう少し調べてみようと思う。
次に、
助成財団 研究者のための助成金応募ガイド2010
という本があるのも初めて知った。
これは、そのうちに見てみようと思う。
次に、SDPARA の原稿について。
Section 2 以降の赤ペン入れが終了。
Section 1 ほどはひどくないので、こちらはSection1 ほどの大幅な修正ではなくいけそうである。
あと、sparsePOP での問題生成は、30時間かかっても終了しなかったので、一度打ち切って、ソースを20行程度、修正した。
SDPA sparse format への出力部分で loop をはずしたところ、出力に3時間かかっていた問題がた80 秒で終了するようになった。
30時間かかって終わらなかったのも1200秒で出力できた。(単純に考えると、修正しなかったら少なくとも 18 日ぐらいかかってたかも知れない)
ちなみに、どのように loop を外すかを書いておくと、
X が 10000x3 行列だったときに、
for i=1:10000
fprintf('%f ', X(i,1));
fprintf('%f ', X(i,2));
fprintf('%f\n', X(i,3));
end
となっていたのを
fprintf('%f %f %f\n', X');
に修正した。(Xが転置されている点がポイント)
これだけで、高速化できる。
なお、昨日から続いている SMCP のチェックは、問題が大きいらしく、まだ終了していない。
今日の作業内容: 助成金調べ 1h + 原稿校正 3h + sparsePOP チェック 1h
今日のBGM: EVA OST [1-3]
今日のランチ: シッダルータ キーマカレー
明日の予測作業時間: 3h
2010年3月17日水曜日
原稿校正とSMCPチェック
sparsePOP の問題生成がやはり手間取っているので、その間に原稿の校正を始めた。
ただ、校正は最初の段階なので、かなりひどい。
英語がどうこう、よりも、まずは書かないといけない項目が足りていないので、かなり追加することになりそうだ。
若干ページがたりないのでは、と気にしていたが、その心配は必要なさそうだ。
明日も、ひきつづき校正をしていこう。
ちなみに、sparsePOP は dat-s に出力するのに手間取っているようだ。
1時間経過して 10MB しかファイルが増えていないので、この部分が遅い。
SDPA 自体に入っている SeDuMi フォーマット出力は mex で書き直されているので、3分程度で 100MB 以上を出力できる。
明日になっても終わらなかったら、SDPA の出力を繋なおしたほうがいいかもしれない。
あと、SMCP の数値実験を行ってみている。
以前と同じ 0.2a というバージョンであるが、なぜか速くなっているように見える。
とりあえず、SparseCoLO で変換した問題を SDPA に解かせて、その結果と比較するようにしている。
一部の問題の SparseCoLO の変換に時間がかかっているため、これも実験結果の確認は明日になる。
今日の作業内容: 原稿校正 2h + SMCP チェック 2h
今日のBGM: DEWPRISM OST [1]
今日のランチ: 角笛 若鶏のパン粉焼き
明日の予測作業時間: 6h
ただ、校正は最初の段階なので、かなりひどい。
英語がどうこう、よりも、まずは書かないといけない項目が足りていないので、かなり追加することになりそうだ。
若干ページがたりないのでは、と気にしていたが、その心配は必要なさそうだ。
明日も、ひきつづき校正をしていこう。
ちなみに、sparsePOP は dat-s に出力するのに手間取っているようだ。
1時間経過して 10MB しかファイルが増えていないので、この部分が遅い。
SDPA 自体に入っている SeDuMi フォーマット出力は mex で書き直されているので、3分程度で 100MB 以上を出力できる。
明日になっても終わらなかったら、SDPA の出力を繋なおしたほうがいいかもしれない。
あと、SMCP の数値実験を行ってみている。
以前と同じ 0.2a というバージョンであるが、なぜか速くなっているように見える。
とりあえず、SparseCoLO で変換した問題を SDPA に解かせて、その結果と比較するようにしている。
一部の問題の SparseCoLO の変換に時間がかかっているため、これも実験結果の確認は明日になる。
今日の作業内容: 原稿校正 2h + SMCP チェック 2h
今日のBGM: DEWPRISM OST [1]
今日のランチ: 角笛 若鶏のパン粉焼き
明日の予測作業時間: 6h
2010年3月16日火曜日
今日は、あまり進まず
今日は原稿の数値実験用に問題生成を行ったが、あまり進まなかった。
生成しているのは多項式計画問題のタイプであるが、小さい問題と極端に大きい問題になり、その中間のサイズが簡単には見つからなかった。
いろいろと調べた結果、relaxOrder をあげると、ある程度、適度な大きさの問題を生成できることが分かった。
明日は、今までに書いた原稿の構成を並列作業で行って、効率アップにしよう。
今日の作業内容: 問題生成 6h
今日のBGM: SKY OST [1-2], FF12 OST [1,2,4]
今日のランチ: しなの うどんとイクラ丼のセット
明日の予測作業時間: 4h
生成しているのは多項式計画問題のタイプであるが、小さい問題と極端に大きい問題になり、その中間のサイズが簡単には見つからなかった。
いろいろと調べた結果、relaxOrder をあげると、ある程度、適度な大きさの問題を生成できることが分かった。
明日は、今までに書いた原稿の構成を並列作業で行って、効率アップにしよう。
今日の作業内容: 問題生成 6h
今日のBGM: SKY OST [1-2], FF12 OST [1,2,4]
今日のランチ: しなの うどんとイクラ丼のセット
明日の予測作業時間: 4h
2010年3月15日月曜日
SNL の講演を聞く
今日は、SNL の講演を聞いた。
SDP 緩和に持ち込むのではなく、clique それぞれの内部でお互いの座標を固定しておいて、それから clique どうしをつなぐ、というアイデアだった。
SFSDP とは clique の作り方がまったく異なるので、すぐに2つをつなげることはできないが、うまく組み合わせれば、これまで以上に大きな SNL が解けるかもしれない。
あと、SNL については、
James Aspnes, David Goldenberg, and Yang Richard Yang.
"On the computational complexity of sensor network localization."
という論文があり、これを読むと NP=P でない限り、SNL には効率的に厳密解を見つける方法はない、ということが証明されているらしい。
あとは、SDPARA の原稿の続き。
数値実験にどの問題を解くかを考えている最中であるが、sparsePOP の examples の問題を試しに調べたら、correlative sparsity が多くの問題で似通った形になることが分かった。
なので、この中からはひとつをピックアップすればいいかと考えている。
ところで、correlative sparsity を計算するのを matlab に任せているが、いくかの問題の correlative sparsity pattern を調べるのに matlab でひとつひとつコマンドを入力するのも大変になってきたので、明日あたり、自動化しようと思う。
今日の作業: SNL 4h + 原稿 2h
今日のBGM: FF5 OST [1-2]
今日のランチ: らく うな重
明日の予測作業時間: 6h
SDP 緩和に持ち込むのではなく、clique それぞれの内部でお互いの座標を固定しておいて、それから clique どうしをつなぐ、というアイデアだった。
SFSDP とは clique の作り方がまったく異なるので、すぐに2つをつなげることはできないが、うまく組み合わせれば、これまで以上に大きな SNL が解けるかもしれない。
あと、SNL については、
James Aspnes, David Goldenberg, and Yang Richard Yang.
"On the computational complexity of sensor network localization."
という論文があり、これを読むと NP=P でない限り、SNL には効率的に厳密解を見つける方法はない、ということが証明されているらしい。
あとは、SDPARA の原稿の続き。
数値実験にどの問題を解くかを考えている最中であるが、sparsePOP の examples の問題を試しに調べたら、correlative sparsity が多くの問題で似通った形になることが分かった。
なので、この中からはひとつをピックアップすればいいかと考えている。
ところで、correlative sparsity を計算するのを matlab に任せているが、いくかの問題の correlative sparsity pattern を調べるのに matlab でひとつひとつコマンドを入力するのも大変になってきたので、明日あたり、自動化しようと思う。
今日の作業: SNL 4h + 原稿 2h
今日のBGM: FF5 OST [1-2]
今日のランチ: らく うな重
明日の予測作業時間: 6h
2010年3月12日金曜日
原稿、まだまだ続く
今日は、それほど時間がとれなかったけど、原稿の続きでとりあえず Online solver について書いてみた。
だいたい1ページ程度。
もう少し詳しくしてもいいかもしれない。
あとで Online solver のインターフェースの画像を取り込もうと思うが、今回は SDPARA が中心にくるように文章がなっているので、PC クラスタを選択している画面がいいかもしれない。
明日からは、数値実験のページに突入の予定。
まだ、ひとつも数値実験を行っていないけど、どんな数値実験が必要かを文章でリストアップしてから数値実験したほうが意外と効率的だったりもする。
今日の作業内容: 原稿の続き 2h
今日のBGM: FF5 OST [1-2]
明日の予測作業時間: 3h
だいたい1ページ程度。
もう少し詳しくしてもいいかもしれない。
あとで Online solver のインターフェースの画像を取り込もうと思うが、今回は SDPARA が中心にくるように文章がなっているので、PC クラスタを選択している画面がいいかもしれない。
明日からは、数値実験のページに突入の予定。
まだ、ひとつも数値実験を行っていないけど、どんな数値実験が必要かを文章でリストアップしてから数値実験したほうが意外と効率的だったりもする。
今日の作業内容: 原稿の続き 2h
今日のBGM: FF5 OST [1-2]
明日の予測作業時間: 3h
2010年3月11日木曜日
論文の英語表現
最近、SDPARA の原稿を英語で書いていて、同じような表現が何度も出てきているので、英語表現を午前中に探してみた。
ぱっと調べた中で、
「英語論文に使う表現文例集」のレジュメ
が使えそうなので、ブックマークに登録しておいた。
原稿の方は、午後に SDPARA の残りと SDPARA-C についてラフに書いて、だいたい2ページ半程度進んだ。
今のところはラフにかいてるだけなので、あとでバランスを取り直したほうがいいかもしれない。
明日は、Online Solver についての部分となる予定だ。
今日の作業内容: 英語表現チェック 2h + SDPARA 原稿 3h
今日のBGM: 電脳コイル OST [1-2], FF6 OST [1-3]
今日のランチ: シッダルータ チキンとマッシュルームとひよこ豆のカレー
明日の予測作業時間: 2h
ぱっと調べた中で、
「英語論文に使う表現文例集」のレジュメ
が使えそうなので、ブックマークに登録しておいた。
原稿の方は、午後に SDPARA の残りと SDPARA-C についてラフに書いて、だいたい2ページ半程度進んだ。
今のところはラフにかいてるだけなので、あとでバランスを取り直したほうがいいかもしれない。
明日は、Online Solver についての部分となる予定だ。
今日の作業内容: 英語表現チェック 2h + SDPARA 原稿 3h
今日のBGM: 電脳コイル OST [1-2], FF6 OST [1-3]
今日のランチ: シッダルータ チキンとマッシュルームとひよこ豆のカレー
明日の予測作業時間: 2h
2010年3月10日水曜日
原稿のサンプル作り
今日も原稿の続きだったが、今日は説明用のサンプルを作るのに時間がかかった。
SDPARA では sparse SCM も並列計算できるように設計されているが、この説明用に、それっぽい sparse SCM を作るのが難しい。
本来、SDPARA は 数万x数万の SCM を計算するようになっているため、100 台程度の負荷分散も難しくないのだが、原稿用に 10x10 程度の行列でそこそこ sparse にしながら 4 台で負荷分散させるのが難しい。SCM は対角成分の計算コストが高い、とか、各列に最低でもどの程度要素がないといけないか、などなど、大変だったりする。
そこで、今回は Matlab のプログラムを組んで、乱数で発生させるようにした。
Matlab のプログラムではざっと130行で、乱数の種を 1 から順に試してみたときに、2300 ぐらいで、いろんな基準を満たすものが出力された。
やはり、人間が作るのは大変だったようだ。
ちなみに、本文は1ページ程度進んだ。これで、明日のうちに図として今日の計算結果を張り込むことにする。
今日の作業内容: 原稿作成 5h
今日のBGM: FF10 OST [1-4]
今日のランチ: つかさ まぐろの竜田揚げ
明日の予測作業時間: 5h
SDPARA では sparse SCM も並列計算できるように設計されているが、この説明用に、それっぽい sparse SCM を作るのが難しい。
本来、SDPARA は 数万x数万の SCM を計算するようになっているため、100 台程度の負荷分散も難しくないのだが、原稿用に 10x10 程度の行列でそこそこ sparse にしながら 4 台で負荷分散させるのが難しい。SCM は対角成分の計算コストが高い、とか、各列に最低でもどの程度要素がないといけないか、などなど、大変だったりする。
そこで、今回は Matlab のプログラムを組んで、乱数で発生させるようにした。
Matlab のプログラムではざっと130行で、乱数の種を 1 から順に試してみたときに、2300 ぐらいで、いろんな基準を満たすものが出力された。
やはり、人間が作るのは大変だったようだ。
ちなみに、本文は1ページ程度進んだ。これで、明日のうちに図として今日の計算結果を張り込むことにする。
今日の作業内容: 原稿作成 5h
今日のBGM: FF10 OST [1-4]
今日のランチ: つかさ まぐろの竜田揚げ
明日の予測作業時間: 5h
2010年3月9日火曜日
Hybrid row-wise distribution
今日は、SDPARA の関係の原稿のみ。
SDPA-GMP/QD/DD, SDPA-M, SDPA-C, SDPARA ときて、SDPARA の途中まで来たところ。
SDPA-GMP/QD/DD はページ数が少ないので、あとで書き足すかもしれない。
ただ、今日は4ページ程度進んだので、かなり進んだ印象だ。
(その分,頭が疲れているけど。)
そうそう、SDPARA では Schur complement matrix の並列計算で各ノードに振り分ける row-wise distribution とスレッドに振り分ける row-wise distribution がある。
今回の文章では、これに hybrid row-wise distribution という名前をつけてみている。
ただし、two-stage row-wise distribution という名前もありかと思うので、あとで考え直してみようと思う。
今日の作業内容: SDPARA の原稿 6h
今日のBGM: SKY OST [1-2], FF9 OST [1-4]
今日のランチ: らく カキフライ定食
明日の予測作業時間: 5h
SDPA-GMP/QD/DD, SDPA-M, SDPA-C, SDPARA ときて、SDPARA の途中まで来たところ。
SDPA-GMP/QD/DD はページ数が少ないので、あとで書き足すかもしれない。
ただ、今日は4ページ程度進んだので、かなり進んだ印象だ。
(その分,頭が疲れているけど。)
そうそう、SDPARA では Schur complement matrix の並列計算で各ノードに振り分ける row-wise distribution とスレッドに振り分ける row-wise distribution がある。
今回の文章では、これに hybrid row-wise distribution という名前をつけてみている。
ただし、two-stage row-wise distribution という名前もありかと思うので、あとで考え直してみようと思う。
今日の作業内容: SDPARA の原稿 6h
今日のBGM: SKY OST [1-2], FF9 OST [1-4]
今日のランチ: らく カキフライ定食
明日の予測作業時間: 5h
2010年3月8日月曜日
OR大研究
今日は、エコノミスト増刊の「OR大研究」をチェックした。
Amazon での「OR大研究」へのリンク
鳩山首相がOR分野の出身ということで組まれた特集のようで、どのようにしてORができてきたか、ORがどういったことを研究する分野なのか、などが専門家以外にも解りやすく書いてある。
個人的には、「ORにどのようなスターがいるか」などといったところが面白かった。
日本は、他の国と比べた場合、ORが社会に驚くほど行き届いている。
たとえば、Yahoo や駅探などの路線探索が、これほど実用的なのは鉄道の安定運行があってこそであって、そういった裏側もORが一部分を支えている。
また、日本の経済のコアとも言えるトヨタ生産システムはORとの関連性が極めて強い。
で、話は変わって今日の作業は SDPARA の原稿の続き。
ただ、今日はいまひとつ集中力があがらず。
本当に進んだのは最後の1時間だけで、2ページも進まなかった。)
やはり、原稿で書くべき内容の方向性がまだ fix してないので、それが影響しているようだ。
書く内容を現状のラフスケッチ、もう少し break down したほうがよさそうだ。
今日の作業内容: OR大研究チェック 1h + 原稿 3h
今日のBGM: マクロスF OST [1], FF12 OST [1,4]
今日のランチ: 味庵 海鮮と豆腐の土鍋煮
明日の予測作業時間: 6h
Amazon での「OR大研究」へのリンク
鳩山首相がOR分野の出身ということで組まれた特集のようで、どのようにしてORができてきたか、ORがどういったことを研究する分野なのか、などが専門家以外にも解りやすく書いてある。
個人的には、「ORにどのようなスターがいるか」などといったところが面白かった。
日本は、他の国と比べた場合、ORが社会に驚くほど行き届いている。
たとえば、Yahoo や駅探などの路線探索が、これほど実用的なのは鉄道の安定運行があってこそであって、そういった裏側もORが一部分を支えている。
また、日本の経済のコアとも言えるトヨタ生産システムはORとの関連性が極めて強い。
で、話は変わって今日の作業は SDPARA の原稿の続き。
ただ、今日はいまひとつ集中力があがらず。
本当に進んだのは最後の1時間だけで、2ページも進まなかった。)
やはり、原稿で書くべき内容の方向性がまだ fix してないので、それが影響しているようだ。
書く内容を現状のラフスケッチ、もう少し break down したほうがよさそうだ。
今日の作業内容: OR大研究チェック 1h + 原稿 3h
今日のBGM: マクロスF OST [1], FF12 OST [1,4]
今日のランチ: 味庵 海鮮と豆腐の土鍋煮
明日の予測作業時間: 6h
2010年3月5日金曜日
原稿作成
今日は SDPARA の原稿作成の続き。
Intro はてこずったので、あとで修正することにして、そのあとの Notations は比較的楽に書くことができてよかった。
まだまだページ数が届いていないので、ペースアップしていこう。
あと、英語表現の幅が狭まってきているので、これまでの論文などに目を通してボキャブラリを回復しようと思う。
あと、今日はお昼を食べすぎたためか、午後がいまひとつ集中力があがらず。
金曜日は集中力が切れやすいので、お昼の量に気をつけようと思う。
今日の作業内容: SDPARA 原稿 4h
今日のBGM: FF4 Celtic Moon, FF5 Dear Friends, Xenosaga I OST [1-2]
今日のランチ: 信華園 カレーあんかけチャーハン
明日の予測作業時間: 3h
Intro はてこずったので、あとで修正することにして、そのあとの Notations は比較的楽に書くことができてよかった。
まだまだページ数が届いていないので、ペースアップしていこう。
あと、英語表現の幅が狭まってきているので、これまでの論文などに目を通してボキャブラリを回復しようと思う。
あと、今日はお昼を食べすぎたためか、午後がいまひとつ集中力があがらず。
金曜日は集中力が切れやすいので、お昼の量に気をつけようと思う。
今日の作業内容: SDPARA 原稿 4h
今日のBGM: FF4 Celtic Moon, FF5 Dear Friends, Xenosaga I OST [1-2]
今日のランチ: 信華園 カレーあんかけチャーハン
明日の予測作業時間: 3h
2010年3月4日木曜日
プログラムが発見された
最近読んでいた論文関係のプログラムのソースコードがついに発見された。
(あちこちにメールしてあったのが、ついに返事がきた。)
これによって、自分でプログラムを作る部分が大幅に軽減されそうだ。
最初は2ヶ月ぐらいかかるかと思ったが、これなら2週間程度の作業時間を割り当てればいけそうな気がする。
明日は、このソースコードの使いかたを勉強しよう。
6ページの原稿については、ある程度文章が完成。
7ページなっていたが、図や表の位置を調整することで6ページに収まることができた。
特に、図や表で [htbp] としていたのを [htb] に変更したのが大きかった。
この原稿は、あとは数値実験が終了すれば、他の人との調整になる。
あと、SDPARA の原稿は、今日からrenewal。
難関の introduction でいきなり行き詰まる。
だいたい1ページ進んだところ。
今日の作業内容: ソースコードチェック 2h + 原稿調整 2h + SDPARA 原稿 2h
今日のBGM: マクロスF OST [1-2], FF9 OST [1,3,4]
今日のランチ: 杏ゃ ポークカレー
明日の予測作業時間: 6h
(あちこちにメールしてあったのが、ついに返事がきた。)
これによって、自分でプログラムを作る部分が大幅に軽減されそうだ。
最初は2ヶ月ぐらいかかるかと思ったが、これなら2週間程度の作業時間を割り当てればいけそうな気がする。
明日は、このソースコードの使いかたを勉強しよう。
6ページの原稿については、ある程度文章が完成。
7ページなっていたが、図や表の位置を調整することで6ページに収まることができた。
特に、図や表で [htbp] としていたのを [htb] に変更したのが大きかった。
この原稿は、あとは数値実験が終了すれば、他の人との調整になる。
あと、SDPARA の原稿は、今日からrenewal。
難関の introduction でいきなり行き詰まる。
だいたい1ページ進んだところ。
今日の作業内容: ソースコードチェック 2h + 原稿調整 2h + SDPARA 原稿 2h
今日のBGM: マクロスF OST [1-2], FF9 OST [1,3,4]
今日のランチ: 杏ゃ ポークカレー
明日の予測作業時間: 6h
2010年3月3日水曜日
SDP ソルバー実行シェルスクリプト
数値実験用に SDP ソルバーを複数 (SDPA, CSDP, SeDuMi, SDPT3) 動かすが、これを毎回手作業でやっていては面倒になってきたため、シェルスクリプトと matlab コードを作った。
exeSDPsolver.sh
#!/bin/sh
for problem in *.dat-s
do
# SDPT3
matlab -nodisplay -r "exeSDPsolver('$problem','SDPT3')" 2>&1 | tee $problem.SDPT3.log
#SeDuMi
matlab -nodisplay -r "exeSDPsolver('$problem','SeDuMi')" 2>&1 | tee $problem.SeDuMi.log
#CSDP
OMP_NUM_THREADS=1 /usr/bin/time ./csdp $problem $problem.CSDP.result 2>&1 | tee $problem.CSDP.log
#SDPA
OMP_NUM_THREADS=8 /usr/bin/time ./sdpa $problem $problem.SDPA.result -numThreads 8 2>&1 | tee $problem.SDPA.log
done
rm -f time-table.txt
grep -H ^computing *.SeDuMi.log >> time-table.txt
grep -H ^computing *.SDPT3.log >> time-table.txt
grep -H ^Total *.CSDP.log >> time-table.txt
grep -H ^ALL *.SDPA.log >> time-table.txt
sort time-table.txt > result-problem.txt
cp time-table.txt result-solver.txt
exeSDPsolver.m
function exeSDPsolver(filename,solver)
fprintf('%s - %s - START @ %s\n',solver,filename,datestr(now));
if strcmpi(solver,'SeDuMi') == 1
addpath(genpath('PATH_TO_SEDUMI/SeDuMi_1_21'));
[At,b,c,K] = fromsdpa(filename);
tic;
[x,y,info] = sedumi(At,b,c,K);
endtime=toc;
elseif strcmpi(solver,'SDPT3') == 1
addpath(genpath('PATH_TO_SDPT3/SDPT3-4.0-beta'));
[blk,At,C,b] = read_sdpa(filename);
tic;
[obj,X,y,Z] = sqlp(blk,At,C,b);
endtime=toc;
end
fprintf('computing time = %.2f for %s\n',endtime,filename);
fprintf('solver - %s - end @ %s\n',filename,datestr(now));
exit;
なお、SeDuMi と SDPT3 は choltmpsize という関数名が衝突するので、addpath でどちらを使うのかを明示するようにしている。(上の matlab ファイルでは、PATH_TO_SEDUMI, PATH_TO_SDPT3 を適宜修正する必要がある。)
また、CSDP は OpenMP の機能が使えるようにコンパイルしたのだが、なぜか OpenMP を利用するとCSDP が極端に遅くなるので、OMP_NUM_THREADS=1 と設定してある。SDPA では、この現象は起こらない。
これで、csdp, sdpa の実行ファイルと param.sdpa をカレントディレクトリにコピーしてきて
$ ./exeSDPsolver.sh
を実行すると、カレントディレクトリにある dat-s を一通り解いて、計算時間をまとめてくれる。
あとは、result-problem.txt で計算時間を確認すればよい。
今日は、昨日までの論文チェックをした。
2度目で読むと、やはり理解が深まる。
あとは原稿作り。上のスクリプトの計算が今夜にはできるはずなので、明日のうちに原稿に計算結果を反映させる。
あと、SDPARA の原稿が今日は進まなかったので、そちらも進めるようにする。
今日の作業内容:論文読み 2h + 数値実験関係 2h + 学会発表用アブストラクト 2h
今日のBGM: マクロスF OST [1-2], FF7 OST [1,2,4]
今日のランチ: 鳥こまち 鳥せいろ丼
明日の予測作業時間: 6h
exeSDPsolver.sh
#!/bin/sh
for problem in *.dat-s
do
# SDPT3
matlab -nodisplay -r "exeSDPsolver('$problem','SDPT3')" 2>&1 | tee $problem.SDPT3.log
#SeDuMi
matlab -nodisplay -r "exeSDPsolver('$problem','SeDuMi')" 2>&1 | tee $problem.SeDuMi.log
#CSDP
OMP_NUM_THREADS=1 /usr/bin/time ./csdp $problem $problem.CSDP.result 2>&1 | tee $problem.CSDP.log
#SDPA
OMP_NUM_THREADS=8 /usr/bin/time ./sdpa $problem $problem.SDPA.result -numThreads 8 2>&1 | tee $problem.SDPA.log
done
rm -f time-table.txt
grep -H ^computing *.SeDuMi.log >> time-table.txt
grep -H ^computing *.SDPT3.log >> time-table.txt
grep -H ^Total *.CSDP.log >> time-table.txt
grep -H ^ALL *.SDPA.log >> time-table.txt
sort time-table.txt > result-problem.txt
cp time-table.txt result-solver.txt
exeSDPsolver.m
function exeSDPsolver(filename,solver)
fprintf('%s - %s - START @ %s\n',solver,filename,datestr(now));
if strcmpi(solver,'SeDuMi') == 1
addpath(genpath('PATH_TO_SEDUMI/SeDuMi_1_21'));
[At,b,c,K] = fromsdpa(filename);
tic;
[x,y,info] = sedumi(At,b,c,K);
endtime=toc;
elseif strcmpi(solver,'SDPT3') == 1
addpath(genpath('PATH_TO_SDPT3/SDPT3-4.0-beta'));
[blk,At,C,b] = read_sdpa(filename);
tic;
[obj,X,y,Z] = sqlp(blk,At,C,b);
endtime=toc;
end
fprintf('computing time = %.2f for %s\n',endtime,filename);
fprintf('solver - %s - end @ %s\n',filename,datestr(now));
exit;
なお、SeDuMi と SDPT3 は choltmpsize という関数名が衝突するので、addpath でどちらを使うのかを明示するようにしている。(上の matlab ファイルでは、PATH_TO_SEDUMI, PATH_TO_SDPT3 を適宜修正する必要がある。)
また、CSDP は OpenMP の機能が使えるようにコンパイルしたのだが、なぜか OpenMP を利用するとCSDP が極端に遅くなるので、OMP_NUM_THREADS=1 と設定してある。SDPA では、この現象は起こらない。
これで、csdp, sdpa の実行ファイルと param.sdpa をカレントディレクトリにコピーしてきて
$ ./exeSDPsolver.sh
を実行すると、カレントディレクトリにある dat-s を一通り解いて、計算時間をまとめてくれる。
あとは、result-problem.txt で計算時間を確認すればよい。
今日は、昨日までの論文チェックをした。
2度目で読むと、やはり理解が深まる。
あとは原稿作り。上のスクリプトの計算が今夜にはできるはずなので、明日のうちに原稿に計算結果を反映させる。
あと、SDPARA の原稿が今日は進まなかったので、そちらも進めるようにする。
今日の作業内容:論文読み 2h + 数値実験関係 2h + 学会発表用アブストラクト 2h
今日のBGM: マクロスF OST [1-2], FF7 OST [1,2,4]
今日のランチ: 鳥こまち 鳥せいろ丼
明日の予測作業時間: 6h
2010年3月2日火曜日
論文読み終わりと学会アブストラクト作成
今日は、これまで3週に渡ってきた論文をなんとか読み終わった。
ただ、最後の4節は、あまり理解できていないので、明日、もう一度読み直す。
特に、
adjacent separating pair, extremal separating pair, ear graph, internal attachement
の4つの言葉の意味を理解する必要がある。
ところで、この論文には誤植が多いのであるが、これはやはりチェックが行き届いていないためのようだ。
途中で、「参考文献の [24] をチェックすると解かる」と書いてあるが、参考文献は [23] までしかなかった。
今日は、あと学会アブストラクトの作成をした。
だいたい1ページぐらいで大丈夫そうなので、それほど大したボリュームではないが、英語で書く必要があるので、明日英語を見直すことにする。
今日の作業内容: 論文読み 4h + アブストラクト作成 2h
今日のBGM: NOIR OST [1-2], Xenosaga 1 OST [1-2], Xenosaga 3 OST [1-2]
今日のランチ: チェロブルー ホタテ貝のペペロンチーノ
明日の予測作業時間: 6h
ただ、最後の4節は、あまり理解できていないので、明日、もう一度読み直す。
特に、
adjacent separating pair, extremal separating pair, ear graph, internal attachement
の4つの言葉の意味を理解する必要がある。
ところで、この論文には誤植が多いのであるが、これはやはりチェックが行き届いていないためのようだ。
途中で、「参考文献の [24] をチェックすると解かる」と書いてあるが、参考文献は [23] までしかなかった。
今日は、あと学会アブストラクトの作成をした。
だいたい1ページぐらいで大丈夫そうなので、それほど大したボリュームではないが、英語で書く必要があるので、明日英語を見直すことにする。
今日の作業内容: 論文読み 4h + アブストラクト作成 2h
今日のBGM: NOIR OST [1-2], Xenosaga 1 OST [1-2], Xenosaga 3 OST [1-2]
今日のランチ: チェロブルー ホタテ貝のペペロンチーノ
明日の予測作業時間: 6h
2010年3月1日月曜日
xmind と、 スケジュール、タイトだった
今日、いろいろとスケジュールを確認していたところ、
かなりタイトなスケジュールになっていることが判明。
なんか、俄然やる気が出てきた。
SDPARA の文章については、やるべき内容を xmind というマインドマップを書くためのフリーソフトで列挙してみた。
xmind は有償版もあるが、まだよくわからないのでフリー版を利用している。
また、Portable 版があって、それだと本格的にインストールしなくても、とりあえず使えるので、これを使ってみている。
マインドマップを書くと、全体が把握しやすいので、なかなか便利だ。
あと、グラフ理論の論文読みは、細かい証明を省くことでだいぶ進められるようになった。
特に、著者がどういったところを省略しているか、どういったところで誤植が入りやすいか、などを推測する力がついてきたので、スピードアップしてきた。
おかげで、論文にある間違いを発見しやすくなり、精神的にかなり楽になった。
明日は、これの続きがメインかな。
今日の作業内容:xmind 2h + 論文読み 4h
今日のBGM: マクロスF OST [1-2], FF12 OST [3,4]
今日のランチ: シッダルータ チキンとマッシュルームのカレー
明日の予測作業時間: 6h
かなりタイトなスケジュールになっていることが判明。
なんか、俄然やる気が出てきた。
SDPARA の文章については、やるべき内容を xmind というマインドマップを書くためのフリーソフトで列挙してみた。
xmind は有償版もあるが、まだよくわからないのでフリー版を利用している。
また、Portable 版があって、それだと本格的にインストールしなくても、とりあえず使えるので、これを使ってみている。
マインドマップを書くと、全体が把握しやすいので、なかなか便利だ。
あと、グラフ理論の論文読みは、細かい証明を省くことでだいぶ進められるようになった。
特に、著者がどういったところを省略しているか、どういったところで誤植が入りやすいか、などを推測する力がついてきたので、スピードアップしてきた。
おかげで、論文にある間違いを発見しやすくなり、精神的にかなり楽になった。
明日は、これの続きがメインかな。
今日の作業内容:xmind 2h + 論文読み 4h
今日のBGM: マクロスF OST [1-2], FF12 OST [3,4]
今日のランチ: シッダルータ チキンとマッシュルームのカレー
明日の予測作業時間: 6h
登録:
投稿 (Atom)