2016年7月22日金曜日

保守工程における問い合わせを用いたバグ予測モデルの提案

「保守工程における問い合わせを用いたバグ予測モデルの提案」という論文に目を通してみたが、なかなかに面白かったので、メモ。

だいたいのところで要約すると、

1.ソフトウェア開発が終わって納品したソフトウェアの保守工程において、メールの問い合わせ内容から「バグ」などの言葉を含んだメールを抽出する。
2.メールの内容や担当者などからきいたことから、複数ある保守工程をクラスタリングにより、いくつかの保守工程グループに分類する。
3.各グループごとに、「保守要員数を維持しておくべき」など判断できるような材料をつくる

といったあたり。


1については、Twitter への書き込み情報から自動的に株価取引を行うプログラムが行っていることと似たような字句解析・構文解析のあたりが行われているのではないかとおもう。
2のクラスタリングは、保守工程の数が多くなった場合には計算時間がかかりそうだけど、数理最適化の手法を使えば計算時間を短縮できるかもしれない。
3の部分は、決定木を用いているので、遺伝的プログラミングを導入すると「55」などの具体的な数字を半自動的に決めることができる可能性がある。



あとは、各バグが独立ではなくて、あるバグが原因で他のバグが報告されている、など因果関係があったりする場合にクラスタリングをどうするのか、というあたりも気になるところ。やっぱり、グラフィカルモデリングなどとも関係したりするんだろうか。


ulem.sty を使うと雑誌名にアンダーラインがつくのを防ぐ

TeX で打消し線を使いたいときに ulem.sty を使うと、参考文献のところで雑誌名(ジャーナル名)にアンダーラインがついてしまう。

これについては
http://kawaiihaseigi.blogspot.jp/2013/01/ulemstyemph.html
に書いてある手法で対応できて、

\usepackage{ulem}
のところを
\usepackage[normalem]{ulem}

とすると解決できる。

2016年7月20日水曜日

Flag 代数ってものが面白そう

arXiv に flag algebra というものに関する論文が出てきていた。

http://arxiv.org/abs/1607.04741

ざっと読んだ限りだと、グラフ理論の構造とも関係している代数とのこと。
これに SDP や Sum of Squares などが関係しているみたい。

すぐには読めないだろうけど、ちょっと時間を見つけて読んでみたいような論文だと思う。

2016年7月13日水曜日

シンプレックスへの射影についての新しい論文が出ていた

計算としては、シンプレックスへの射影は
$ \{ x \in R^N : \sum_{i=1}^N x_i, x \ge 0\}$
への射影をどう計算するか、という問題で基礎的な問題ではあるが、ソートと同じような感じでいろいろなアルゴリズムが開発されている。

今日気がついたところでは、この内容について新しい論文が出ていた。

"Fast projection onto the simplex and the $\ell_1$ ball"
http://link.springer.com/article/10.1007/s10107-015-0946-6

数値実験用のソフトは C で組んであるとのこと。

前に別の論文にあったアルゴリズムをMatlabで実装してみたときは、setdiff や union などの集合を扱う計算に計算時間を取られていたが、そのあたりは C で組むと解消できているのかもしれない。

基礎的な問題であるけど、基礎的な問題であるからこそ、常に新しいアルゴリズムが研究されていて面白い。


2016年7月11日月曜日

ウキウキである

最近になって出てきた論文をチェックしていたら、自分が定式化までして「これはどうしたものか」と思っていた放っておいた最適化問題に使えそうな解法が出てきていた。

また、この論文から芋づる式で他の論文もチェックすることができて、似たような解法がどこにあるのか、というあたりを探すことができるようになった。

以前に Google scholar などを使っていたときには検索ワードが良くなかったらしく、こういった情報にたどり着けていなかった。

ということで、今日の時間を使って論文読みはじめ。なかなかに面白い。
著者にあったことはないけれど、こういった論文を書いてくれていることは、とてもありがたいことだなぁ、と思ったりもする。

こういう論文を見つけてしまうと、もはやウキウキである。