最新IT技術とBI
オンメモリDBとBI(続き)
2010年3月時点で、オンメモリ型の多次元データベースで実際に販売されているのは、QlikViewだけのようですが、2010年6月ごろに販売が開始される「Microsoft Office 2010」にも同様な機能が盛り込まれることが発表されています。
この機能は、「PowerPivot」と呼ばれており、Excel 2010のアドインとして提供される予定です。PowerPivotを使用すると、サーバー上にあるSQL Server(などの各種のデータ・ソース)に格納されているソース・データから、クライアントPC上にオンメモリ型の多次元データベースを作成することができ、Excel2010のピボットテーブル機能を使用してOLAP分析を行うことができます。
このように、大手ベンダーの米Microsoftが参入するということで、今後も同じようなオンメモリ型多次元データベース製品が増えるかも知れません。
データ・マイニングとBI
データ・マイニングとは、大量のデータから、目に見えない関連性や傾向を見つけ出すことを目的とした技術のことを言います。ここでは、データ・マイニングとBIの関連について解説します。
データマイニングは、医療分野において患者の属性データから病気の発生原因となる要素を発見したり、工場で部品の故障データから不良の原因となる要素を発見するなど、さまざまな分野で利用されます。いくつかの分野で、BIとデータ・マイニングは密接な関係を持ちます。
例えば、小売業の分野では、データ・マイニングがバスケット分析に使用されます。バスケット分析とは、バスケット、つまり顧客の買い物かごの中にどんな組み合わせで商品が入っているか、別の言い方をすると、ある商品を購入する際に、別のどのような商品を購入する確率が高いかを分析する方法です。この分析結果をもとに商品の陳列方法を工夫することで、ある商品を買う顧客に別の商品を“ついでに”買ってもらい、売上を増やすことができます。
データ・マイニングで関連性や傾向を見つけ出すために使用する手法をアルゴリズムと呼びます。前述のバスケット分析では、アソシエーション・ルールと呼ばれるアルゴリズムが使用されます。アソシエーション・ルールとは、ある事象が発生した場合に、別の事象が同時に発生する確率を計算するアルゴリズムです。例えば、商品Aを購入した顧客が同時に商品Bを購入する確率は70%であるといった計算が行われます。
このアルゴリズムの実行エンジンは通常、データ・マイニング専用のソフトウエアとして提供されてきました。しかし、近年では、BIシステムの背後にあるDWHをデータ・マイニングのソース・データとして共有する動きが活発化しています。このため、DWHとして使用するRDBにデータ・マイニング・アルゴリズムの実行エンジンを統合した形で提供する製品が登場しています。
2010年3月時点での、このようなRDB統合型のデータ・マイニング製品は、図3のとおりです。
第4回の今回は、BIシステムに影響を与えている最新のIT技術と、その影響を受けて登場してきたBIシステム関連製品について説明しました。
最終回の次回は、今後BIシステムに最も大きな影響を与えるであろうクラウド・コンピューティングの技術と、その影響を受けて変化するであろうBIシステムの将来について説明します。