ベイズの定理でプロジェクトの失敗を予測

2008年10月22日(水)
坂田 祐司

データを確率の枠組みでとらえる「ベイズの定理」

 今回は「ベイズの定理」を概説し、この定理をプロジェクト管理にどのように利用するのか説明します。「ベイズの定理」は確率論や統計学において知られている定理であり、さまざまな事象に関するデータを確率論の枠組みで取り扱うことができるという点で有用な定理です。

 確率論の枠組みでデータをとらえることができるという点は、確率や統計の知識のある方にとっては特に大きな利点であるように思えないと思いますが、これがまさにベイズの定理の特徴であるということを説明します。

 なおベイズの定理はさまざまな応用があります。この定理を使った内容を総じて「ベイズ的」もしくは「ベイジアン」(Bayesian)と呼びます。今回は、ページ数の都合もあり、ベイズ的意志決定に焦点を当て、特にプロジェクト管理における課題を例として説明していきます。

統計を用いた意思決定

 ベイズ的意思決定の特徴を示すために、「通常用いられている」統計を用いた意思決定について説明します。ここで、「通常用いられている」とはネイマン-ピアソン理論(以下、NP理論)という名の統計学を基礎とした意思決定です。

 このNP理論に基づいた統計学の特徴は、一言でいえば「意思決定を行う際の推論では必ずきちんと数えた客観的データを用意せねばならない」と定めている点であり、ベイズ統計と比較すると「厳格」な立場の統計学といえます。これを専門的な言葉遣いでは「頻度(度数)主義」といいます。この点からNP理論を用いた意思決定では「仮説検定」と呼ぶ決定のアルゴリズムを用います。

 仮説検定は、まず何らかの仮説を設定し、その仮説が正しいと仮定します。次に、その仮説に従う対象群から、一定数のサンプルデータを取得し仮説に関係する量を算出し、その量が取得される確率を確率分布から算出します。最後に、算出した確率があらかじめ決めておいた値より小さければ、「仮説は成り立ちそうもない」と判断します。これがNP理論を用いた仮説検定であり、この「仮説が成り立っていない」内容を、正しい内容と導いてもよいということになります。このアルゴリズムは科学的に厳密な手法であり工学、心理学、経済学、医学など多くの学問において用いられてきました。

 しかし、このNP理論に基づいた統計を用いた意思決定には、その厳格さゆえの大きく2つの欠点があります。

 まず1点目ですが、NP理論ではある仮説に対して、その仮説に従うと仮定できる対象群が存在し、その対象群の個々が仮説に従っているのかどうか判断できるデータを客観的手法で集積できるということが前提となっている点です。この前提は科学的な真理を対象とする場合は可能です。

 しかし、経済や経営における意思決定や日常における判断事は、刻一刻と変化する事象に対する場合が多く一定数のサンプルを得ることができませんし、人間が深く関与する事象であり客観的にデータを集積することが困難です。つまり、図1の1つ目の例にあるように、不明確・主観的な事象を扱うことができないのです。

 2点目は、意思決定の対象になる事象は定量的に明確な仮説として表現していなければならない点です。この点から意思決定の最中に得ることができるサンプルから徐々に仮説の精度を高めていくという人間の意思決定時に実行しているような手順を模倣することは不可能です。すなわち、図1の2つ目の例にあるような課題が生じます。

 ベイズの定理は、NP理論に基づいた厳格な統計を用いた意思決定で生じるこれらの欠点を解消するために近年注目されたものです。

SI企業の研究所においてソフトウエア工学の研究に従事。試験やプログラムの解析技術に興味を持ち研究に従事。研究の一方、ソフトウエアのライフサイクル全般を考慮した開発方法のあるべき姿を探っている。http://d.hatena.ne.jp/ysakata

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています