2016年7月22日金曜日

保守工程における問い合わせを用いたバグ予測モデルの提案

「保守工程における問い合わせを用いたバグ予測モデルの提案」という論文に目を通してみたが、なかなかに面白かったので、メモ。

だいたいのところで要約すると、

1.ソフトウェア開発が終わって納品したソフトウェアの保守工程において、メールの問い合わせ内容から「バグ」などの言葉を含んだメールを抽出する。
2.メールの内容や担当者などからきいたことから、複数ある保守工程をクラスタリングにより、いくつかの保守工程グループに分類する。
3.各グループごとに、「保守要員数を維持しておくべき」など判断できるような材料をつくる

といったあたり。


1については、Twitter への書き込み情報から自動的に株価取引を行うプログラムが行っていることと似たような字句解析・構文解析のあたりが行われているのではないかとおもう。
2のクラスタリングは、保守工程の数が多くなった場合には計算時間がかかりそうだけど、数理最適化の手法を使えば計算時間を短縮できるかもしれない。
3の部分は、決定木を用いているので、遺伝的プログラミングを導入すると「55」などの具体的な数字を半自動的に決めることができる可能性がある。



あとは、各バグが独立ではなくて、あるバグが原因で他のバグが報告されている、など因果関係があったりする場合にクラスタリングをどうするのか、というあたりも気になるところ。やっぱり、グラフィカルモデリングなどとも関係したりするんだろうか。


0 件のコメント:

コメントを投稿